Cliquez ici pour une approche théorique complète de la balise canonique.
C’est la théorie, mais correspond-elle aussi à la réalité ? L’analyse d’un grand nombre de pages web avec un classement dans Google conduit à des conclusions surprenantes.
Un demi-milliard de pages Web
Nous avons analysé environ un demi-milliard de pages web (1) qui ont un classement Google pour les mots-clés contrôlés. Dans 1,8 % des cas, le code html contient une balise canonique avec une URL différente de celle de la page elle-même. En théorie, il s’agit de pages qui utilisent la balise canonique pour l’usage auquel elle est destinée. Les pages avec une balise canonique contenant l’URL de la page elle-même ont été laissées de côté.
- (1) Plus précisément, 493 279 736. De ce nombre, 8 985 663 contenaient une balise canonique avec une URL différente de celle de la page en question.
Laisser Google « tourner en rond » ne fonctionne pas
5,3 % de près de 50 millions de pages avec une balise canonique(2) se réfèrent à elles-mêmes dans la pratique, mais seulement à la deuxième ou troisième ligne.
2ème ligne = la page A se réfère à la page B dans la balise canonique, la page B se réfère à nouveau à la page A dans la balise canonique.
3ème ligne = la page A se réfère à la page B dans la balise canonique, la page B se réfère à la page C dans la balise canonique, la page C se réfère à nouveau à la page A dans la balise canonique.
Joli détail mis à part : 2% des URL de cette balise canonique proviennent de pages inexistantes.
- (2) Pour cela, nous avons vérifié 47,796,436 pages avec une balise canonique. 5,3 % d’entre elles (2 540 046) se réfèrent à elles-mêmes par un détour. Pour 2% (965,488), la balise canonique montre une URL d’une page inexistante.
Avertissement 1 : ces pages permettent à Google de tourner en rond. En théorie, ces pages ne sont pas référencées, alors pourquoi apparaissent-elles dans les résultats de recherche organique de Google ?
Une balise canonique, mais quand même, dans les résultats de la recherche
Pour 13% de plus de 40 millions de mots-clés (3) contrôlés, la première page de résultats de recherche organique dans Google contient au moins une page qui contient une balise canonique avec une URL qui renvoie à une autre page. Pour plus de 6 millions de mots-clés contrôlés dont nous ne vérifions pas seulement les 10 premiers, mais aussi un certain nombre des pages suivantes dans les résultats de recherche organique, le pourcentage monte à 25%.
- (3) Des 42,321,388 mots-clés économiquement intéressants, nous vérifions régulièrement les 10 meilleurs résultats de Google. Pour 13% d’entre eux (5,526,679), le top 10 contient au moins une page web avec une balise canonique.
- (4) Des 6,163,422 mots-clés, nous regardons au-delà du top 10 dans Google. Pour 25% (1,594,266) de ces résultats, nous trouvons au moins une page web avec une balise canonique.
Avertissement 2 : Si ces pages demandent à Google de se référer à une autre page via la balise canonique, pourquoi sont-elles quand mêmes dans les résultats de la recherche organique et non pas cette autre page ?
Google fait ce qu’il veut
Conclusion de cette analyse : en théorie, on utilise la balise canonique pour que Google renvoie à une page autre que celle en question, mais en pratique ce n’est pas le cas. Google fait ce qu’il veut avec la balise canonique. Les gens de Google l’admettent simplement sur la page web « Consolidate dual URL », de manière assez indirecte :
https://support.google.com/webmasters/answer/139066?hl=fr
Bien que nous vous recommandons de spécifier une page canonique pour les URL ou versions doubles, pour diverses raisons, telles que les performances ou le contenu, Google peut choisir une page algorithmiquement différente de la page canonique.
Et :
Vous ne pouvez pas forcer Google à choisir la page canonique, mais vous pouvez influencer le choix en utilisant une ou plusieurs des techniques présentées ici.
Le fait que Google fait ses propres choix avec la balise canonique est également évident à partir d’exemples pratiques. Cliquez ici pour le voir.