Table des matières

Présentation du fichier robots.txt

Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi, tout moteur de recherche commence l'exploration d'un site web en cherchant le fichier robots.txt à la racine du site.

Si ce fichier robots.txt n'existe pas à la racine de votre site, le moteur de recherche l'indexera tout de même mais vous verrez une erreur 404 apparaître en plus dans vos statistiques, c'est pour quoi il est mieux de le créer.

Format du fichier robots.txt

Le fichier robots.txt (écrit en minuscules et au pluriel) est un fichier ASCII se trouvant à la racine du site et pouvant contenir les commandes suivantes :

Attention, le fichier robots.txt ne doit contenir aucune ligne vide !

Voici des exemples de fichier robots.txt

User-Agent: *
Disallow: /
User-Agent: *
Disallow: 
User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /
User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:
User-Agent: *
Disallow: /repertoire/chemin/page.html
User-Agent: *
Disallow: /repertoire/chemin/page.html
Disallow: /repertoire/chemin/page2.html
Disallow: /repertoire/chemin/page3.html
User-Agent: *
Disallow: /repertoire/

Quelques User-Agents

Voici quelques exemples de User-Agents pour les moteurs de recherche les plus populaires :

Nom du moteurUser-Agent
Alta Vista Scooter
Excite ArchitextSpider
Google Googlebot
HotBot Slurp
InfoSeek InfoSeek Sidewinder
Lycos T-Rex
Voilà Echo