Sitemap.xml : pourquoi et comment y avoir recours pour le SEO ?

Les fichiers sitemap.xml (à ne pas confondre avec les plans de sites html) permettent de lister les pages et les documents (images, vidéos, PDF…) que vous souhaitez faire référencer par les moteurs de recherche, et de donner diverses informations sur chacun de ces éléments (date de mise à jour, fréquence de modification…). Lorsqu’ils sont bien paramétrés, les sitemaps sont utiles pour le référencement naturel à plusieurs niveaux.

En quoi les fichiers sitemap.xml sont-ils utiles ?

picto illustrant l'arborescence d'un site web

Une meilleure exploration de vos contenus

En indiquant directement aux moteurs de recherche la liste des éléments importants et que vous souhaitez faire indexer, vous vous assurez qu’ils seront bien tous explorés pour le référencement (ce qui ne garantit pas pour autant qu’ils seront indexés). Ce qui n’est pas toujours le cas, notamment si vous vous trouvez dans une des situations suivantes :

  • Votre site comporte beaucoup de pages : plus votre site comporte de pages, plus les moteurs de recherche mettront du temps à toutes les explorer. Ce qui peut poser problème pour votre référencement.
  • Votre site ne comporte pas assez de liens internes : les moteurs de recherche utilisent en grande partie les liens internes pour explorer votre site, l’absence ou le manque de liens peut donc pénaliser la découverte et l’exploration de vos contenus.
  • Votre site a été mis en ligne récemment et reçoit encore peu de backlinks : les liens externes à votre site sont aussi empruntés par les moteurs de recherche pour arriver sur votre site. Moins votre site reçoit de liens, moins il y aura de portes d’entrées potentielles pour les moteurs de recherche.
picto illustrant le travail d'exploration des moteurs de recherche

Des indications pour les moteurs de recherche

En plus de lister les éléments à faire indexer, vous pourrez par l’intermédiaire du sitemap fournir un certain nombre d’indications utiles (plus ou moins prises en compte en fonction des moteurs de recherche) sur vos contenus comme :

  • La fréquence de mise à jour de chaque élément
  • La date de la dernière modification
  • Les versions alternatives qui existent dans d’autres langues
  • Leur priorité pour l’exploration (bien que cette indication ne soit pas réellement utilisée par Google)
Picto illustrant le monitoring de l'indexation

Suivre l'indexation

Lorsque vous soumettez un fichier Sitemap depuis la Google Search Console associée à votre site, l’outil vous donne des informations sur son exploration par le moteur de recherche (cela existe également pour Bing avec l'outil Webmaster Tools).

Vous accéderez ainsi à un récapitulatif des sitemaps qui ont été envoyés avec pour chacun d’eux :

  • La date de l’envoi
  • Le nombre d’url découvertes lors de l’exploration
  • La date de la dernière exploration par les moteurs de recherche

Vous pourrez par ailleurs suivre de près l’indexation des pages renseignées dans le sitemap, et vérifier ainsi la bonne prise en compte de vos contenus par les moteurs. De cette façon, vous identifierez également les erreurs que pourrait contenir votre fichier sitemap.

 

Comment mettre en place un fichier Sitemap ?

Quelque soit la méthode utilisée pour la génération du fichier Sitemap, certains points d'attention doivent être pris en compte pour que celui-ci soit utile à votre référencement. Il faut notamment veiller :

  • à utiliser un format de fichier lisible par les moteurs de recherche (xml, RSS, mRSS, atom 1.0 ou texte). Le format xml étant le plus souvent utilisé de tous.
  • à ce que celui ne contienne que des url valides et indexables (pas d'erreurs 4xx, 5xx ou de redirections)
  • à ce qu'il soit le plus complet possible. L'interêt du sitemap étant de lister les contenus que vous souhaitez indexer, fournir une liste incomplète serait contreproductif

Une bonne pratique est également de proposer un fichier sitemap pour chaque type de contenus : vidéos, images, actualités... Cela permet de suivre plus précisement l'indexation de ces différents éléments.

Pour connaitre plus précisement les critères à respecter lors de la génération du fichier sitemap, n'hésitez pas à consulter la documentation détaillée de Google.

Génération d’un fichier Sitemap avec un CMS

Le plus souvent, la mise en place du fichier sitemap se fait assez facilement, notamment grâce aux outils proposés par les différents CMS (Wordpress, Drupal, Prestashop…). Vous pourrez ainsi générer votre fichier sitemap automatiquement. Celui comprendra alors toutes les adresses autorisées à l’indexation, et exclura normalement celles qui comportent une instruction no-index.

Selon les outils, il vous sera possible d’aller plus loin dans le paramétrage de votre sitemap. Vous pourrez par exemple y faire apparaître pour chaque élément une fréquence de mise à jour ou la date de la dernière mise à jour.

Génération manuelle d’un fichier Sitemap

Dans le cas où la génération automatique du fichier sitemap n’est pas envisageable, il est possible de procéder manuellement. A noter que cette méthode est moins favorable, étant donné qu’elle ne permet pas une mise à jour automatique du fichier au fur et à mesure que le site évolue.

Des outils comme www.xml-sitemaps.com permettent de générer un fichier Sitemap au format XML simplement en renseignant l’adresse de son site. Ces outils peuvent être utiles mais comportent un certain nombre de limites : limitation du nombre d’adresses listées (500 maximum), impossibilité de spécifier des adresses à exclure, priorité d’exploration aléatoire…

Génération d'un fichier sitemap avec Screaming frog

Il est également possible d’utiliser un outil spécifique comme Screaming Frog SEO Spider pour :

  • Réaliser un crawl complet du site, afin de lister toutes les adresses que l’on souhaite référencer
  • Faire générer automatiquement par l’outil un fichier sitemap, à partir des adresses qu’il aura listées.

L’avantage de cette procédure est qu’il est possible au moment de la génération du sitemap de préciser les types de contenus à inclure ou non dans le fichier. Il est également possible de paramétrer l’affichage d’indications comme la fréquence de modification, la date de la dernière modification et surtout d’inclure les informations relatives aux balises Hreflang. A noter qu’avec la licence gratuite, l’outil impose également une limite de 500 url.

Une fois que le fichier Sitemap a été généré, celui-ci doit être déposé sur le serveur, à la racine, via un transfert FTP.

 

Soumission dans la Search Console

Un fois généré et présent sur votre serveur, le fichier Sitemap doit être soumis aux moteurs de recherche, et en particulier à Google en passant par l’outil Search Console.

Une fois connecté sur votre propriété, il suffit :

  • d’aller dans l’onglet « Sitemaps »
  • renseigner l’url de votre fichier
  • cliquer sur « Envoyer »

Interface de l'outil Search Console permettant la soumission du fichier sitemap

Interface de l'outil Search Console permettant la soumission du fichier sitemap

Un délai sera nécessaire avant que celui-ci soit exploré par Google. Vous pourrez par la suite suivre l’évolution de son exploration depuis cette interface.

Vous pouvez également soumettre votre fichier sitemap à Google en utilisant ces méthodes :

  • En envoyant une demande GET depuis votre navigateur en utilisant l’adresse : https://www.google.com/ping?sitemap={adresse complète du sitemap}
  • En ajoutant au fichier robots.txt de votre site la ligne suivante : Sitemap: {adresse complète du sitemap}

SEO/Content
Paid Media
Web Analytics / Data

Échangeons sur votre projet