Le fichier "robots.txt"

Accueil > Préparer votre site > Le fichier "robots.txt"

Présentation du fichier "robots.txt"


Ce fichier donne des indications aux robots des moteurs de recherche sur les pages à indexer ou à ne pas indexer de votre site.

Celui-ci se place dans le répertoire web de votre hébergement, càd au même endroit que la pge d'accueil de votre site.


Format du fichier "robots.txt"


Il peut contenir les commandes suivantes :

User-Agent
Permet de préciser le robot concerné par les directives suivantes. La valeur * signifie "tous les moteurs de recherche".
Disallow
Permet d'indiquer les pages à exclure de l'indexation. Chaque page ou chemin à exclure doit être sur une ligne à part et doit commencer par /. La valeur / seule signifie "toutes les pages du site".



Voici des exemples de fichier robots.txt :

Exclusion de toutes les pages


User-Agent: *
Disallow: /


Exclusion d'aucune page

(équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées)

User-Agent: *
Disallow:


Autorisation d'un seul robot


User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /


Exclusion d'un robot


User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:


Exclusion d'une page


User-Agent: *
Disallow: /repertoire/chemin/page.html


Exclusion de plusieurs page


User-Agent: *
Disallow: /repertoire/chemin/page.html
Disallow: /repertoire/chemin/page2.html
Disallow: /repertoire/chemin/page3.html


Exclusion de toutes les pages d'un répertoire et ses sous-dossiers


User-Agent: *
Disallow: /repertoire/


Pour plus d'information


The Web Robots Page