WordPress hat es. TYPO3 auch. Shopware ebenfalls. In einer ganzen Reihe Content Management Systemen sind Canonical-Tags, die auf sich selbst verweisen, mittlerweile Standard. In den meisten Fällen wird der Nutzer nicht einmal mehr gefragt. Die Selbstreferenzierung wird einfach bei der Erstellung einer neuen Seite gesetzt. Warum? Erklären wir.
Canonical-Link und Duplicate Content
Was ein Canonical-Link ist, wie er funktioniert und warum er verwendet werden sollte, ist im Netz schon auf Hunderten Seiten erklärt worden. Wer nach einem ausführlichen Guide zu dem Thema sucht, wird beispielsweise bei searchmetrics fündig.
Um eine kurze Zusammenfassung kommen wir aber nicht herum: Der Canonical-Link wird verwendet, um einer Suchmaschine zu signalisieren, dass es eine Seite gibt, die als repräsentativ für alle verlinkenden Seiten gilt. Damit soll Duplicate Content und Keyword-Kannibalisierung verhindert werden.
Ein Beispiel: Sie betreiben einen Shop für Schrauben. Ihre Produkte sind nach Hersteller und Durchmesser sortiert. Auch in der Länge unterscheiden sie sich. Sie können nun entweder für jede einzelne Variante individuelle Inhalte verfassen, womit Sie schnell an die Grenzen des Machbaren kommen dürften. Oder Sie stellen denselben Inhalt auf jede Seite, passen die relevanten Details und Merkmale an und bestimmen mittels Canonical eine der Produkt- zur Hauptseite. Nur diese nimmt Google dann in den Index auf.
So sparen Sie nicht nur sich selbst Arbeit, Sie vermeiden zudem doppelte Inhalte. Auch Ihr Kunde findet sich schneller zurecht, denn kennt er eine Ihrer Seiten, kennt er alle und kann sich auf die für seine Kaufentscheidung wichtigen Unterschiede konzentrieren, ohne sich ständig neu orientieren zu müssen.
Warum verweist ein Canonical Link dann auf sich selbst?
Die Crawler, die für Google das Internet durchforsten, orientieren sich an der URL einer Seite. Und die kann durch dynamische Parameter oder angehängte Elemente, beispielsweise durch Filter, Einstellungen oder Suchergebnisse der internen Suche, variieren. Auch interne (seltener auch externe) Verlinkungen, bei denen der Ersteller nicht aufgepasst hat, können zu diesem Ergebnis führen.
Ein Beispiel: Sie besuchen einen Shop für Hosen. Diese sind unter der URL www.hosenshop.de zu erreichen. Über die Filterfunktion lassen Sie sich nur blaue Hosen anzeigen. Die URL ändert sich auf www.hosenshop.de/farbe=blau. Der Inhalt der Seite ist aus Sicht eines Crawlers kaum anders. Insbesondere Content-Blöcke wie Text oder Bilder sind identisch.
Schon haben Sie ein Problem mit Duplicate Content. Und das multipliziert sich. Weitere Parameter schließen beispielsweise die Größe mit ein. www.hosenshop.de/farbe=blau/groesse=38 wäre eine neue URL. Die Inhalte aber bleiben gleich. Und da es in den meisten Shops eine ganze Menge möglicher Filter gibt, gibt es auch eine ganze Menge dieser URLs. Für den Crawler stellt jede davon eine eigene Seite dar. Aus Sicht der Suchmaschine handelt es sich also um Duplicate Content.
Setzen Sie nun auf die Seite www.hosenshop.de einen Canonical Tag, wird diese Information übergeben, auch wenn sich die URL durch solche dynamischen Parameter ändert. So ist für den Crawler und auch für den Google-Algorithmus klar, dass es nur eine Seite gibt, indexiert werden soll. DC wird dadurch verhindert und ein schlechteres Ranking aufgrund doppelter Seiteninhalte vermieden.
TL/DR oder: Zusammenfassung
Auf vielen Websites werden dynamische URLs eingesetzt. Jede dieser URLs stellt für einen Crawler eine eigene Seite dar. Die Inhalte aber sind zu großen Teilen identisch. Über einen Canonical wird eine Hauptseite festgelegt, die der Crawler in den Index aufnimmt. Alle anderen URLs werden ignoriert.