Dupliquer le contenu, qu’est-ce que c’est exactement ?
Si des blocs de contenu – et en particulier du contenu textuel – se trouvent à des endroits différents sur Internet, identiques ou largement identiques, il s’agit d’un contenu double ou dupliqué. Ces différents endroits sur Internet correspondent à des URL différentes, soit à l’intérieur d’un même site web (alors le nom de domaine est le même, ex : https://www.nomdedomaine.fr/pageweb1.html et https://www.nomdedomaine.fr/identique-ala-pageweb1.html) ou bien dans différents sites web (ex : https://www.siteweb1.fr/paginaweb1.html et https://www.siteweb2.fr/identique-ala-pageweb1.html
Mais cela ne s’arrête pas là. Parfois, il existe à la fois une version d’un site web avec « www. » et une version sans, avec (en grande partie) le même contenu. C’est, dans ce cas, aussi du contenu dupliqué. Egalement s’il existe une version avec protocole « http:- » d’un site web, à côté d’une version avec « https:-« protocol.
Parfois, le contenu dupliqué sur différents sites Web est inévitable.
Les boutiques en ligne sont parfois confrontées à ce problème lorsqu’elles prennent littéralement en charge un contenu technique ou autre des sites Web des fournisseurs de leurs produits. Dans la pratique, Google reconnaît bien ces situations et le moteur de recherche ne considère pas ceci comme un contenu dupliqué. Mais les URL avec le contenu du fournisseur sont les originaux et normalement ils finissent plus haut dans les résultats de recherche. Afin d’obtenir de bons résultats, les propriétaires des boutiques en ligne devront investir dans du contenu unique pour que les pages web soient optimisées.
Il en va de même pour les communiqués de presse qui sont copiés à partir de différents sites Web et même pour les articles de blog : tant que Google peut identifier l’original, il ne se passera pas grand chose.
Pourquoi Google est-il compliqué à propos du contenu en double ?
Pour les moteurs de recherche tels que Google, chaque URL correspond à une adresse page web séparée. Deux URL ou plus avec un contenu presque identique, Google n’appréciera pas cela. Ce n’est pas seulement parce que le contenu dupliqué est parfois utilisé pour essayer de manipuler les résultats de la recherche – qui ne fonctionne plus maintenant, Google est devenu tellement plus intelligent.;
Plus important c’est que Google doit faire un choix : quelle page obtiendra la position la plus haute dans les résultats de la recherche ? Placer les pages l’une après l’autre n’est pas une option : Les utilisateurs de Google qui cliquent sur un lien, et voient le même contenu, ont une mauvaise expérience d’utilisateur, comme nommé par Google. Ce que le moteur de recherche évite.
Dans le meilleur des cas Google s’assurera que que la page ou l’URL – généralement la plus ancienne – ait la position normale et méritée. et que la page ou l’URL avec contenu dupliqué n’ait que quelques pages. Ces dernières apparaîtront plus tard dans les résultats de recherche. Et s’il y a beaucoup d’URL avec du contenu dupliqué, surtout au sein du même site Web, Google devient totalement suspicieux et peut entraîner une baisse de l’appréciation du site Web dans son ensemble, et peut entraîner un déclassement de la note pour l’ensemble du site Web. .
Une bonne idée : plusieurs sites web avec des noms de domaine différents mais avec un contenu identique ?
Il y a des propriétaires de sites Web qui pensent qu’ils ont la solution pour dominer la première page des résultats de recherche dans Google : juste un site Web avec un bon contenu pour les mots-clés les plus importants et ensuite utiliser ce contenu pour 9 autres sites Web, avec d’autres noms de domaine. « Et puis mon site est sur la première page de Google plusieurs fois pour ces mots-clés, peut-être 10 fois. Super, tous les visiteurs finissent sur mon site web ! » Ce n’est pas possible ;
Avec un peu de chance, le plus ancien site Web sera assez haut dans Google, mais tous les autres sont garantis d’être poussés vers le bas par le moteur de recherche, généralement plusieurs pages plus loin.
Contenu dupliqué « par accident »
Quelques cas où les propriétaires de sites Web luttent avec le contenu dupliqué avec les meilleures intentions :
1. Un nouveau site web avec un nouveau nom de domaine
Parfois, une refonte radicale d’un site web ne peut être évitée, par exemple si vous voulez le rendre accessible aux appareils mobiles. Parfois, les gens choisissent immédiatement un nouveau nom de domaine. La première pensée est souvent : « Je quitte l’ancien site web en ligne. Quand je mets le nouveau en ligne, il augmentera lentement dans les résultats de recherche jusqu’à ce qu’il dépasse l’ancien ». Malheureusement Google ne pense pas de cette façon et le nouveau site Web se retrouvera toujours à des dizaines de positions derrière l’ancien ;
Si votre site web a déjà de bonnes positions dans Google pour des mots-clés importants, changer votre nom de domaine n’est jamais la meilleure idée : il y a une réelle chance que vous perdiez irrévocablement ces bonnes positions. Mais parfois, autrement n’est pas possible. Dans ce cas le mieux est de laisser les URL de l’ancien site web exister, SANS le contenu original, mais avec une redirection permanente (301) pour configurer l’URL qui correspondant au nouveau site web.
Si tout va bien, Google reprend après un certain temps l’ancienne URL et en pratique sera remplacée par la nouvelle, le moteur de recherche fait lui-même le changement. Note : cela ne fonctionne pas toujours, et si c’est le cas, les positions peuvent fluctuer un peu ;
En fait, lors de la création d’un nouveau site Web, il est préférable de profiter de l’occasion pour optimiser considérablement le contenu du texte.
2. Passer d’un site web avec « www. » à un site sans, ou du protocole « http:- » au protocol « https:-«
L’histoire avec le « www. »-semble être une chose du passé, de nos jours les navigateurs sont assez intelligents pour ajouter ce préfixe si nécessaire. Mais souvent les propriétaires de sites Web veulent se débarrasser de ce « www. », puis ils choisissent de garder leur site Web « www. »- en ligne, à côté d’une version identique sans « www. ». Il en va de même s’ils veulent passer d’un site Web avec le protocole « http:- » à un site Web avec le protocole « https:-« .
Dans les deux cas, vous obtenez la même histoire que ci-dessus : Google ‘voit’ deux URL différentes, l’une avec « www. » et l’autre sans, et donne une note plus élevée à la plus ancienne, celle avec « www. », alors que le propriétaire du site Web veut juste voir le site web sans « www. » en haut. Il en va de même pour « http: » contre « https: ». Aussi dans ces cas il vaut mieux garder les URL avec « www » et ceux avec « http: » SANS contenu et AVEC une redirection permanente vers les versions sans « www » ou avec « https: ». Mais ici aussi, des fluctuations de positions ne peuvent pas être exclues.
3. Contenu dupliqué, inévitable pour votre site web/boutique en ligne
Il est parfois inévitable qu’il y ait différentes pages web avec un contenu presque identique sur votre site web, en particulier pour les boutiques en ligne. Cela peut être dû à votre CMS (système de gestion de contenu) : tous les systèmes ne peuvent pas éviter correctement les duplications de contenu. Mais il y a beaucoup d’autres situations dans lesquelles il est difficile de contrer la duplication de contenu ;
Pas de problème, cela peut être résolu avec la balise ‘canonique’, mais plus d’informations à ce sujet, plus tard, dans un article de blog .