Aller au contenu
TG Web » Blog » Conseils SEO » Sitemap

Qu’est-ce que le sitemap d’un site internet ?

sitemap xml

Le sitemap d’un site internet est un fichier qui permet à Google de bien comprendre votre site internet. Bien qu’il ne soit pas obligatoire, s’en passer peut vite être un frein à votre SEO notamment si la hiérarchisation et le maillage interne de votre site n’est pas optimisé. Je vous explique tout cela dans cet article.

Qu’est-ce qu’un sitemap ?

Le sitemap est un fichier qui permet d’indiquer aux robots d’exploration (Googlebots…) l’ensemble des pages à indexer d’un site internet. Il ne faut pas confondre le sitemap XML et le sitemap HTML (ou plan du site) :

  • Le sitemap XML est celui destiné aux Googlebots
  • Le sitemap HTML est celui destiné aux humains pour montrer l’arborescence du site (et une technique SEO pour diminuer le nombre de clics depuis la page d’accueil).

Pourquoi faire un sitemap ?

Le sitemap est très important en SEO, c’est une sorte de carte détaillée de votre site internet. Vous aiguillez Google concernant la lecture de votre site internet, cela évite qu’il oublie des urls ou qu’il aille voir des urls que vous ne souhaitez pas qu’il voit. 

Imaginez, vous créez du contenu de qualité, mais vous n’avez pas fait un bon maillage interne, Google peut avoir du mal à en lire certains, avec le sitemap, il sait que ces derniers existent. Après, cela ne veut pas dire qu’il ira forcément les voir rapidement, mais en tout cas, il ira plus que si vous n’avez pas de sitemap.

Comment créer un sitemap ?

Un sitemap doit générer automatiquement les urls, c’est-à-dire que chaque url crée doit être automatiquement présente dedans. Pour cela, il y a deux principales méthodes :

  1. Si vous utilisez un CMS standard comme WordPress, Prestashop, Magento, Joomla ou Drupal, des plugins proposent des sitemap adaptés. Par exemple, sur WordPress, Yoast SEO en génère un de qualité.
  2. Vous pouvez également utiliser un outil de génération automatique de sitemap (Google est votre ami).

Quelles sont les règles pour créer un sitemap ?

Il y a 3 règles importantes :

  • Le fichier XML est enregistré en UTF-8
  • Toutes les urls listées dans le sitemap doivent être sur le même site (mon-domaine.fr par exemple). Si vous avez des sous-domaines, c’est 1 sitemap spécifique.
  • Maximum 50 000 urls et 50Mo (on parle de très gros site, je vous rassure).

Quoi mettre dans un sitemap ?

Outre les urls, vous pouvez mentionner les points suivants (non obligatoire) :

  • La date de publication ou de modification du contenu (<lastmod>),
  • La fréquence de modification de la page (<changefreq>),
  • La priorité que vous donnez à cette page (<priority>). Petit aparté, si vous mettez toutes les pages à « 1.0 » (priorité max), elles seront toutes prioritaires donc finalement, aucune ne le sera !
<?xml version="1.0" encoding="ISO-8859-1"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>https://www.mon-site.com</loc>
<lastmod>2022-01-05</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

Votre agence de création de sites internet ou votre agence SEO doivent prévoir cela en amont, pensez à l’inclure dans le Cahier des Charges.

Où placer le sitemap ?

Le sitemap xml se place à deux endroits :

La Google Search Console

Comme vu dans l’article sur la Google Search Console, c’est en quelque sorte votre interface de lien avec Google. Il faut lui indiquer ici le (ou les) sitemap xml. Pour cela, cliquez sur « Sitemaps » dans le menu de gauche, mettez l’url (point 1), envoyez le (point 2) et il va apparaitre au point 3. Laissez 24h à Google pour bien le lire.

sitemap google search console

Le robots.txt

Le robots.txt permet différentes choses dont indiquer à Google les urls que vous ne souhaitez pas qu’il lise mais également l’orienter vers des points importants. Dans ce document, vous mentionnez :

Sitemap: https://www.mon-domaine.fr/sitemap.xml

Erreur la plus fréquente entre le sitemap et robots.txt

Très régulièrement, vous avez un problème d’indexation de pages que l’on voit sur la Search Console. Elle vous indique, dans « Couverture d’urls » des urls « valides avec des erreurs ».  Il est probable que ce soient des urls indexées malgré le blocage du robots.txt, dis autrement, vous interdisez le passage de Google pour une url (disallow dans robots.txt) mais cette dernière est dans le sitemap donc vous dites à Google de la lire, contradictoire !

Idem, si vous mettez une url en noindex (interdite pour Google), vérifiez bien qu’elle n’est pas dans le sitemap.

Conclusion sur le sitemap

Même s’il n’est pas obligatoire, je vous conseille fortement d’en créer un surtout que la majorité des CMS en propose via des plugins. C’est une réelle aide pour Google et plus vous l’aidez, plus vous aurez de chance qu’il vous le rende. D’ailleurs, c’est une des choses que l’on regarde dans un audit SEO.

Contactez-nous pour échanger sur votre projet web
contact[@]tgweb.fr

Yohann | Expert SEO

5/5 - (1 vote)
Aller au contenu principal