Aller au contenu
TG Web » Blog » Conseils SEO » Contenu dupliqué

Le contenu dupliqué : l’ennemi du SEO

duplicate content

Écrire du contenu fait partie des facteurs importants pour avoir un bon positionnement SEO. Cependant, Google veut du contenu unique, à valeur ajoutée et qui répond aux attentes de l’internaute. Il part donc à la chasse au contenu dupliqué, qu’il soit volontaire (plagiat) ou involontaire (problème interne à votre site internet). Je vous explique tout cela en détail avec des conseils précis pour éviter de pénaliser votre SEO… ce serait un comble que créer du contenu pénalise votre SEO.

Qu’est-ce que du contenu dupliqué ?

Le contenu dupliqué (ou Duplicate Content en anglais) est le fait d’avoir du contenu copié totalement ou très sensiblement proche sur 2 urls distinctes. Cette duplication peut très bien être interne à votre site (erreur technique ou dédoublement du travail) ou externe (on parle de vol ou plagiat).

Deux pages sont considérées comme dupliquées si elles ont + de 70% à 75% de leur contenu identique. Dit autrement, si 25% à 30% de votre contenu est différent entre 2 ou plusieurs pages internet, il n’y aura pas de problème de duplicate content.

Contenu dupliqué en interne

Il est relativement fréquent que les sites internet d’un certain volume de pages ou les e-commerces aient du contenu dupliqué. Votre CMS permet de publier, pour un même texte, 2 urls différentes pour que chacune soit rangée dans une catégorie spécifique. Ce type de duplicate content est embêtant pour Google, car il crawle une partie de votre site et vous lui faites perdre du temps. Il n’y a pas de risque de pénalité, par contre, c’est un frein évident pour votre SEO. D’où l’importance de collaborer avec une agence SEO et non uniquement avec une agence web.

Contenu dupliqué en externe

Celui-ci est plus grave aux yeux de Google. Il peut s’agir de plagiat involontaire tel que reprendre mots pour mots la description du produit envoyée par la marque, du coup, tous les revendeurs qui font cela dans leur e-boutique seront en contenu dupliqué ! Il peut également s’agir de plagiat pur et dur, c’est celui-ci que Google chasse et essaie de punir. C’est pour cela que vous ne devez pas copier/coller un texte venant d’un autre site internet, vous aurez de grandes chances d’être le perdant donc quel est votre intérêt ?

Quels sont les risques liés au contenu dupliqué ?

Face au contenu à faible valeur ajoutée et, ou dupliqué, Google a sorti en 2011 Google Panda, un algorithme qui permet de sanctionner la ou les pages incriminées et, dans les cas les plus extrêmes, le site internet. Cette sanction consiste, tout simplement, à supprimer de la SERP la page incriminée.

Pourquoi Google combat le contenu dupliqué ?

Google référence des milliards de pages (on parle de 200 000 milliards de pages), il doit crawler des milliards de sites internet, il a pour cela un budget crawl alloué à chaque site. En gros, il alloue un certain budget pour crawler un site, il ne peut donc pas tout voir. Si vous lui faites perdre du budget crawl (du temps) avec un texte dupliqué (ou une page 404 par exemple), non seulement il n’aime pas cela, mais cette perte de temps empêchera les bots d’aller sur une url utile de votre site. Ainsi, même s’il y a peu de chance que la pénalité Google Panda s’applique sur la page incriminée, il aura utilisé un jeton de budget crawl pour rien sur votre site internet.

Comment vérifier le contenu dupliqué ?

Il existe différents outils qui permettent de contrôler que d’autres sites ne proposent pas de contenus dupliqués de votre site internet : Siteliner, Copyscape ou KillDuplicate. Ces outils, gratuit ou payant, sont un gain de temps important car ils s’occupent de tout et vous indiquent un pourcentage sur les pages qu’ils ont remarqués.

Il est également possible d’utiliser Google en copiant entre guillemets une partie du texte. Google ira ainsi chercher dans les pages qu’il a indexées celles qui reprennent le contenu en question. Gratuit, mais chronophage.

Comment éviter le contenu dupliqué ?

Concernant le contenu dupliqué en interne, il faut éviter d’avoir les mêmes pages appelées depuis plusieurs catégories, éviter les ID de sessions… Et surtout, bien travailler la technique de son site avec des redirections 301 automatiques entre l’url http et l’https et idem entre le sans www. et avec www. Exemple, l’url officielle de votre site est https://www.mon-site.fr, les urls suivantes doivent obligatoirement renvoyer vers l’officielle : http://mon-site.fr, http//www.mon-site.fr et https://mon-site.fr. En effet, s’il n’y a pas de redirections 301, il y a de fortes chances que Google considère ses 4 urls dupliquées… et croyez-moi, c’est très fréquent !

Si vous avez besoin d’avoir 2 pages identiques (pour x ou y raison), vous pouvez utiliser la balise canonical. Cette balise indique à Google que la page où elle est posée est une copie de la page mentionnée dans la balise : link rel= « canonical » href= « https://www.mon-site.fr/page-origine/ ».

Enfin, si vous externalisez votre rédaction de contenu, demandez des preuves que le contenu n’est pas dupliqué avec un des outils cités plus haut.

Conclusion sur le duplicate content

Le contenu dupliqué est un frein important au référencement de votre site internet. Dites-vous que Google préfèrera toujours l’original, faites le maximum pour cela donc dans l’éventualité où vous vendez des produits qui se trouvent ailleurs, faites des fiches originales et uniques.

Contactez-nous pour échanger sur votre projet web
contact[@]tgweb.fr

Yohann | Expert SEO

5/5 - (3 votes)
Aller au contenu principal