Comment puis-je indiquer aux moteurs de recherche de ne pas indexer le contenu via des noms de domaine secondaire?

StackOverflow https://stackoverflow.com/questions/3498491

Question

J'ai un site Web à l'a.com (par exemple). J'ai aussi quelques autres noms de domaine que je n'utilise pas pour rien: b.com et c.com. Ils transmettent actuellement a.com. J'ai remarqué que Google est l'indexation de contenu de mon site en utilisant b.com/stuff et c.com/stuff, non seulement a.com/stuff. Quelle est la bonne façon de dire Google seulement le contenu de l'index via a.com, non b.com et c.com?

Il semble que si une redirection 301 via htaccess est la meilleure solution, mais je ne suis pas sûr de savoir comment faire. Il n'y a que le seul fichier .htaccess (chaque domaine ne possède pas son propre fichier htaccess).

b.com et c.com ne sont pas censés être des alias de a.com, ils ne sont que d'autres noms de domaine que je réserve pour des projets futurs possibles.

Était-ce utile?

La solution

Vous pouvez simplement créer une redirection avec un fichier .htaccess comme ceci:

RewriteEngine on
RewriteCond %{HTTP_HOST} \.b\.com$ [OR]
RewriteCond %{HTTP_HOST} \.c\.com$
RewriteRule ^(.*)$ http://a.com/$1 [R=301,L]

Autres conseils

robots.txt est la façon de dire les araignées que ramper et ce pour ne pas ramper. Si vous mettez ce qui suit à la racine de votre site à /robots.txt:

User-agent: *
Disallow: /

Une araignée qui se conduit bien ne recherche pas une partie de votre site. La plupart des grands sites ont un robots.txt, comme google

User-agent: *
Disallow: /search
Disallow: /groups
Disallow: /images
Disallow: /news
#and so on ...

Il dépend à peu une grande partie de ce que vous voulez atteindre. 301 dire que le contenu est déplacé de façon permanente (et il est la bonne façon de transférer PR), est-ce que vous voulez atteindre?

Vous voulez que Google se comporter? Que vous pouvez utiliser robots.txt, mais gardez à l'esprit il y a un inconvénient: ce fichier est lisible de l'extérieur et chaque fois situé au même endroit, de sorte que vous donnez essentiellement loin l'emplacement des répertoires et fichiers que vous voulez protéger. Il faut donc utiliser robots.txt que s'il vaut la peine de rien protéger.

S'il y a une valeur de quelque chose que vous devez protéger votre mot de passe protéger le répertoire, ce serait la bonne façon. Google ne sera pas le mot de passe de l'index des répertoires protégés.

http://support.google.com/webmasters/ bin / answer.py? hl = fr & answer = 93708

Pour la dernière méthode, il dépend si vous souhaitez utiliser le fichier httpd.conf ou .htaccess. La meilleure façon est d'utiliser httpd.conf, même si .htaccess semble plus facile.

http://httpd.apache.org/docs/2.0/howto/ auth.html

Demandez à votre code côté serveur génère une référence canonique qui pointent vers la page pour être considérée comme « source ». exemple =

Référence: http://googlewebmastercentral.blogspot.com/2009/02/specify-your -canonical.html - Mise à jour:. Ce lien-tag est actuellement également pris en charge par Ask.com, Microsoft Live Search et Yahoo

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top