Duplizierter Inhalt (Duplicate Content) – Was ist das genau?
Wenn ganze, (größtenteils) identische Blöcke Inhalt – und dann vor allem Textinhalt – an verschiedenen Stellen vorkommen im Internet, ist die Rede von doppeltem oder dupliziertem Inhalt. Die unterschiedlichen Stellen sind die verschiedenen URLs, entweder innerhalb derselben Website (dann ist der Domainname derselbe, z.B. https://www.Domainname.de/Webseite1.html und https://www.Domainname.de/identisch-mit-Webseite1.html) oder auf verschiedenen Websites (z.B. https://www.Website1.de/Webseite1.html und https://www.Website2.nl/identisch-mit-Webseite1.html)
Da hört es jedoch nicht auf. Manchmal gibt es von einer Website sowohl eine Version mit „www-“ als auch ohne, mit (größtenteils) demselben Content. Auch das ist duplizierter Inhalt. Dasselbe gilt für eine Version mit HTTP: -Protokoll, neben einer Website mit HTTPS: -Protokoll.
In manchen Fällen ist duplizierter Content unvermeidlich
In diese Lage geraten Webshops, wenn sie technischen oder anderen Inhalt wörtlich übernehmen von der Website Ihres Produktlieferanten. Normalerweise erkennt Google diese Situationen und interpretiert sie nicht als duplizierten Inhalt. Die URLs mit dem Inhalt der Lieferanten sind in diesem Fall original. Diese werden gewöhnlich höher angezeigt in den Suchergebnissen. Damit Webshop-Betreiber trotzdem gut abschneiden können, müssen sie beim Optimieren Ihrer Webseiten besonders Wert legen auf einzigartigen Inhalt. Das ist auch der Fall bei Pressemitteilungen, die auf verschiedenen Webseiten veröffentlicht werden und sogar bei Blogposts: solange Google das Original erkennt, ist alles in Ordnung.
Warum ist duplizierter Inhalt Google ein Dorn im Auge?
Für Suchmaschinen wie Google steht jede URL für eine separate Webseite. Zwei oder mehr URLs mit fast dem gleichen Inhalt kann die Suchmaschine nicht leiden. Das ist nicht nur so, weil duplizierter Inhalt eingesetzt werden konnte, um die Suchergebnisse zu manipulieren – was heutzutage übrigens nicht mehr klappt, da Google inzwischen schlauer geworden ist – sondern da Google eine Entscheidung treffen muss: Welche Seite bekommt die höchste Position in den Suchergebnissen? Die Seiten nacheinander anzuzeigen, ist keine Möglichkeit: Google-Nutzer, die auf einen Link klicken, sich den Inhalt anschauen, zu den Suchergebnissen zurückkehren, auf den nächsten Link klicken und dann den selben Inhalt zu sehen bekommen, machen laut Google eine schlechte Nutzererfahrung. Die Suchmaschine setzt sich jederzeit dafür ein, dies zu verhindern.
Bestenfalls sorgt Google dafür, dass die eine Seite oder URL – meist die älteste – die normale, verdiente Position bekommt, und dass die Seite oder URL mit dupliziertem Inhalt erst später auf einer der Folgeseiten der Suchergebnisse erscheint. Sollte es verdacht viele URLs mit dupliziertem Inhalt geben, gerade innerhalb einer Website, wird Google misstrauisch und kann die Wertschätzung Ihrer Website womöglich abnehmen.
Eine gute Idee: eine ganze Reihe Websites mit unterschiedlichen Domänen, aber identischem Inhalt.
Es gibt Website-Betreiber, die meinen die Lösung gefunden zu haben, um die erste Seite der Suchergebnisse in Google zu erobern: eine Website mit ausgezeichnetem Inhalt für die wichtigsten Schlüsselwörter und diesen Inhalt danach wiederverwenden in 9 anderen Webseiten mit anderen Domänen. „Und dann wird meine Website bei diesen Suchbegriffen gewiss verschiedene Male angezeigt werden auf der ersten Seite in Google, vielleicht sogar 10 Mal. Fabelhaft, alle Besucher landen auf meiner Website!“. Aber Vorsichtig sei geboten, denn das klappt so nicht!
Mit etwas Glück schafft die ältere Webseite es gerade hoch genug in Google. Alle anderen Seiten werden jedoch garantiert und meist gar zusammen und gleichzeitig heruntergestuft in den Suchergebnissen.
„Aus Versehen“ duplizierter Inhalt
In manchen Situationen können auch Website-Betreiber mit den besten Absichten mit dupliziertem Inhalt konfrontiert werden:
1. Eine neue Website mit einer neuen Domäne
Manchmal lasst sich eine eingreifende Erneuerung einer Website nicht vermeiden, zum Beispiel wenn diese mobilfreundlich gemacht werden soll. Ab und zu entscheiden sich die desbetreffenden Leute dann auch gleich zu einer neuen Domäne. Der erste Gedanke dabei ist dann oft: „Ich behalte die alte Website online. Wenn ich die neue dann ins Netz stelle, wird die langsam die Suchergebnisse erobern, bis sie die alte überholt.“ Leider sieht Google das aber anders: eine neue Website wird immer dutzende Positionen hinter der alten aufgeführt.
Wenn Ihre Website für wichtige Schlüsselwörter bereits gut abschneidet in Google, ist eine Domainänderung eigentlich nie der beste Schachzug: es besteht nämlich die Gefahr, dass diese guten Position unwiderruflich verloren gehen. Und trotzdem geht es manchmal nicht anders. In dem Fall ist es besser, die URL der alten Website doch beizubehalten, OHNE den ursprünglichen Inhalt und mit einer permanenten Weiterleitung (Redirect 301) zur übereinstimmigen URL der neuen Website.
Wenn alles gut geht, dann registriert Google schon bald, dass die alte URL in der Praxis ersetzt wurde durch die neue und macht die Suchmaschine selbst die Umstellung. Vorsicht, denn es klappt nicht immer und wenn es klappt, dann schaukeln die Positionen womöglich.
Eigentlich ist es ratsam, den Textinhalt gleich beim Erstellen einer neuen Website bestmöglich zu optimieren.
2. Der Umstieg von einer www.-Website auf eine Website ohne www., oder von HTTP: -Protokoll auf HTTPS: -Protokoll
Die „www.-Geschichte“ scheint der Vergangenheit anzugehören. Browser sind mittlerweile schlau genug selbst das Präfix hinzuzufügen, wenn das überhaupt notwendig ist. Oft wollen Website-Betreiber das „www“ jedoch loswerden, und dann entscheiden sie sich dazu, Ihre www.-Website im Netz zu lassen, parallel zur Version ohne „www“. Genauso beim Übergang von einer Website mit HTTP: -Protokoll auf eine Website mit dem sichereren https: -Protokoll. Auch in diesen Fällen ist es besser, die URLs mit „www-“ und die mit „HTTP:“ beizubehalten, OHNE Inhalt und MIT einem permanenten Redirect zur Version ohne „www“ oder mit „HTTPS:“. Aber auch hier sind Positionsschwankungen nicht auszuschließen.
In beiden Fällen bewirkt man obengenannten Ablauf: Google „sieht“ zwei unterschiedliche URL, eine mit „www-“ und eine ohne. Die Suchmaschine stuft die ältere höher ein, die mit „www-“, während der Website-Betreiber natürlich möchte, dass die ohne „www-“ gut abschneidet.
3. Unvermeidlicher duplizierter Content innerhalb Ihrer Website/Ihres Webshops
Manchmal ist es unvermeidlich, dass es verschiedene Webseiten mit fast identischem Inhalt auf einer Website gibt, gerade bei Webshops. Das kann an Ihrem CMS (Content Management System) liegen: nicht alle Systeme können duplizierten Inhalt nämlich in gleichen Maßen vermeiden. Des Weiteren gibt es noch eine ganze Reihe anderer Situationen, in denen man dupliziertem Inhalt nur schwierig entgegenwirken kann.
Aber kein Grund zur Sorge! Das lässt sich lösen mit dem sogenannten Canonical-Tag. Dazu aber mehr im nächsten Blogpost.