Your Browser Does Not Support JavaScript. Please Update Your Browser and reload page. Have a nice day! Non, on ne résout pas tous les problèmes de duplicate avec des canonicals ! - Peak Ace
  • canonicals
  • duplicate content
  • SEO
14.04.2023

Non, on ne résout pas tous les problèmes de duplicate avec des canonicals !

Il est de plus en plus fréquent de voir des webmasters essayer de résoudre tous leurs cas de duplication de contenu avec une balise <link rel=’canonical’…>. La raison invoquée c’est que c’est plus facile à mettre en oeuvre q’une redirection 301, ou de traiter la cause de la duplication de contenu,
Mais le problème c’est que cela ne marche pas à tous les coups…
Pourquoi ?

La balise link rel canonical n’est pas une directive, c’est juste une indication

Depuis l’apparition de cette balise, Google le dit et le répète : cette balise donne une indication (« a hint » en anglais) à Google, que le moteur peut ensuite librement décider d’exploiter.
Ce n’est pas une directive que le moteur doit respecter impérativement.

Le résultat, c’est qu’utiliser des link rel canonical ne garantit jamais que les problèmes de duplication de contenus soient résolus. Il faut donc considérer cela comme une solution à employer quand on a pas d’autres choix. Sinon, il vaut mieux véritablement traiter la cause de la duplication, ou mettre en place des redirections 301.

Vous ne me croyez pas ? Voila ce que vous dit un porte parole de Google

John Mueller l’avait rappelé dans un hangout récent : dans le cas où les deux pages ont en fait des contenus différents (les deux pages ne sont pas de vrais doublons, ce sont des quasi doublons ou même des pages en réalité différentes), Google peut décider de ne pas tenir compte de la balise canonical ! Et c’est un comportement normal,

Comment diagnostiquer qu’une balise canonical est ignorée par Google

Il est assez facile de voir si Google respecte vos urls canoniques ou non.
Tout d’abord il faut identifier toutes les pages d’atterrissage de votre site qui reçoivent du trafic issu des moteurs de recherche.
On peut les obtenir via la Google Search Console. Si vous en avez beaucoup, je vous rappelle que vous pouvez contourner la limite des 1000 résultats du rapport en ligne en passant par l’API ou par un outil de type Analytics Edge ou Supermetrics.
Vous pouvez aussi exploiter l’information de vos logs ou de votre solution de web analytics.
Si une url canonicalisée vers une autre url est active (cette page d’atterrissage reçoit du trafic), c’est donc qu’elle figure dans l’index et dans des pages de résultats. Donc que la balise canonical est… ignorée !
On peut identifier facilement ces cas avec un outil comme Botify en créant un rapport sur les pages actives canonicalisées.
Pour des sites comportant moins de 50000 urls, on peut aussi s’aider d’un crawl Screaming Frog connecté au web analytics et à la search console pour identifier ces mêmes pages

Testez cette méthode sur votre site et vous aurez peut-être une mauvaise surprise : ces cas sont moins rares qu’on ne le pense…

Qu’est-ce que la cannibalisation SEO ?

L’aspect contenu est une part importante du SEO et le travail d’optimisation sémantique doit être constant. Cependant, il peut arriver de vous retrouver confronté à un cas particulier dans certains de vos contenus, la cannibalisation SEO. Petite explication sur ce phénomène.
Il arrive que deux contenus uniques travaillent sur la même requête suite à une faille dans l’optimisation on page (balise title, Hn, ou autre élément lié à la sémantique…). Si c’est le cas, l’algorithme de Google aura du mal à définir la bonne URL à prioriser et à positionner, c’est ce qu’on appelle la cannibalisation SEO.
Les risques liés à ce phénomène sont divers et peuvent-être :

  • Positionnement d’une page peu pertinente
  • Baisse des performances business (et donc du chiffre d’affaire)
  • Taux de rebond important
  • Baisse du taux de clics depuis les SERPs
  • Baisse globale de position du site

Illustrons le cas avec un exemple concret :
Chaises e-commerce cannibalisation seo
Un site e-commerce vendant des meubles designs veut travailler l’expression »fauteuil Starck ».
Deux pages du site remontent sur cette requête :

  • une page produit
  • une page listing/catégorie

La page produit se positionne contre la page catégorie, cependant la page catégorie propose 20 modèles différents de fauteuils désignés par Starck et répond mieux aux attentes des internautes. La conséquence pour ce site se traduit par une perte potentielle des ventes, une non capitalisation sur le catalogue produit et une diminution du taux d’engagement.

Comment identifier ce risque et sa présence sur votre site ?

Plusieurs solutions :

  • réaliser un crawl et identifier les balises en doubles (title, h1, etc…)
  • utiliser des outils comme SEMrush qui proposent des moyens pour analyser les optimisations on page d’un site

Pour corriger la cannibalisation si elle existe sur votre site :

  • optimiser les pages sur des requêtes distinctes/différenciantes
  • optimiser le maillage interne pour faire remonter la page légitime
  • potentielle suppression de page et redirection en 301 vers l’URL légitime

Bien entendu, si vous n’identifiez pas cette problématique sur votre site, évitez tout contenu doublon en vérifiant soigneusement que chaque nouveau contenu n’existe pas déjà sur votre site (commande site : sur Google ou extract des positions via un outil marché).

Pour en savoir plus :
Le lien vers le hangout de John Mueller (aller directement à 33’31 »)
La page support de Google sur les urls canoniques

Vincent Frias