Le sitemap d’un site internet est un fichier qui permet à Google de bien comprendre votre site internet. Bien qu’il ne soit pas obligatoire, s’en passer peut vite être un frein à votre SEO notamment si la hiérarchisation et le maillage interne de votre site n’est pas optimisé. Je vous explique tout cela dans cet article.
Qu’est-ce qu’un sitemap ?
Le sitemap est un fichier qui permet d’indiquer aux robots d’exploration (Googlebots…) l’ensemble des pages à indexer d’un site internet. Il ne faut pas confondre le sitemap XML et le sitemap HTML (ou plan du site) :
- Le sitemap XML est celui destiné aux Googlebots
- Le sitemap HTML est celui destiné aux humains pour montrer l’arborescence du site (et une technique SEO pour diminuer le nombre de clics depuis la page d’accueil).
Pourquoi faire un sitemap ?
Le sitemap est très important en SEO, c’est une sorte de carte détaillée de votre site internet. Vous aiguillez Google concernant la lecture de votre site internet, cela évite qu’il oublie des urls ou qu’il aille voir des urls que vous ne souhaitez pas qu’il voit.
Imaginez, vous créez du contenu de qualité, mais vous n’avez pas fait un bon maillage interne, Google peut avoir du mal à en lire certains, avec le sitemap, il sait que ces derniers existent. Après, cela ne veut pas dire qu’il ira forcément les voir rapidement, mais en tout cas, il ira plus que si vous n’avez pas de sitemap.
Comment créer un sitemap ?
Un sitemap doit générer automatiquement les urls, c’est-à-dire que chaque url crée doit être automatiquement présente dedans. Pour cela, il y a deux principales méthodes :
- Si vous utilisez un CMS standard comme WordPress, Prestashop, Magento, Joomla ou Drupal, des plugins proposent des sitemap adaptés. Par exemple, sur WordPress, Yoast SEO en génère un de qualité.
- Vous pouvez également utiliser un outil de génération automatique de sitemap (Google est votre ami).
Quelles sont les règles pour créer un sitemap ?
Il y a 3 règles importantes :
- Le fichier XML est enregistré en UTF-8
- Toutes les urls listées dans le sitemap doivent être sur le même site (mon-domaine.fr par exemple). Si vous avez des sous-domaines, c’est 1 sitemap spécifique.
- Maximum 50 000 urls et 50Mo (on parle de très gros site, je vous rassure).
Quoi mettre dans un sitemap ?
Outre les urls, vous pouvez mentionner les points suivants (non obligatoire) :
- La date de publication ou de modification du contenu (<lastmod>),
- La fréquence de modification de la page (<changefreq>),
- La priorité que vous donnez à cette page (<priority>). Petit aparté, si vous mettez toutes les pages à « 1.0 » (priorité max), elles seront toutes prioritaires donc finalement, aucune ne le sera !
<?xml version="1.0" encoding="ISO-8859-1"?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>https://www.mon-site.com</loc> <lastmod>2022-01-05</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>
Votre agence de création de sites internet ou votre agence SEO doivent prévoir cela en amont, pensez à l’inclure dans le Cahier des Charges.
Où placer le sitemap ?
Le sitemap xml se place à deux endroits :
La Google Search Console
Comme vu dans l’article sur la Google Search Console, c’est en quelque sorte votre interface de lien avec Google. Il faut lui indiquer ici le (ou les) sitemap xml. Pour cela, cliquez sur « Sitemaps » dans le menu de gauche, mettez l’url (point 1), envoyez le (point 2) et il va apparaitre au point 3. Laissez 24h à Google pour bien le lire.
Le robots.txt
Le robots.txt permet différentes choses dont indiquer à Google les urls que vous ne souhaitez pas qu’il lise mais également l’orienter vers des points importants. Dans ce document, vous mentionnez :
Sitemap: https://www.mon-domaine.fr/sitemap.xml
Erreur la plus fréquente entre le sitemap et robots.txt
Très régulièrement, vous avez un problème d’indexation de pages que l’on voit sur la Search Console. Elle vous indique, dans « Couverture d’urls » des urls « valides avec des erreurs ». Il est probable que ce soient des urls indexées malgré le blocage du robots.txt, dis autrement, vous interdisez le passage de Google pour une url (disallow dans robots.txt) mais cette dernière est dans le sitemap donc vous dites à Google de la lire, contradictoire !
Idem, si vous mettez une url en noindex (interdite pour Google), vérifiez bien qu’elle n’est pas dans le sitemap.
Conclusion sur le sitemap
Même s’il n’est pas obligatoire, je vous conseille fortement d’en créer un surtout que la majorité des CMS en propose via des plugins. C’est une réelle aide pour Google et plus vous l’aidez, plus vous aurez de chance qu’il vous le rende. D’ailleurs, c’est une des choses que l’on regarde dans un audit SEO.
Contactez-nous pour échanger sur votre projet web contact[@]tgweb.fr
Yohann | Expert SEO