In einer aktuellen Episode des Google-Podcasts Search Off the Record erklärte Allan Scott vom Team "Dups", wie Google entscheidet, welche URL als Haupt-URL angesehen wird, wenn es doppelte Seiten gibt.
Er enthüllte, dass Google etwa 40 verschiedene Signale berücksichtigt, um die Haupt-URL aus einer Gruppe ähnlicher Seiten auszuwählen.
Etwa 40 Signale für die Auswahl der kanonischen URL
Duplicate Content ist ein häufiges Problem für Suchmaschinen, da viele Webseiten mehrere Seiten mit identischem oder ähnlichem Inhalt haben.
Um dieses Problem zu lösen, verwendet Google einen Prozess namens Kanonisierung. Bei diesem Prozess wählt Google eine URL als Hauptversion aus, die indexiert und in den Suchergebnissen angezeigt werden soll.
Google hat betont, wie wichtig es ist, Signale wie rel= "canonical " Tags, Sitemaps und 301-Weiterleitungen für die Kanonisierung zu verwenden. Die Anzahl der an diesem Prozess beteiligten Signale ist jedoch größer, als Sie vielleicht denken.
Scott enthüllte es während des Podcasts:
"Ich bin mir im Moment nicht sicher, wie hoch die genaue Zahl ist, da es Höhen und Tiefen gibt, aber ich denke, sie liegt bei etwa 40.
Hier sind einige der bekannten Signale, die erwähnt wurden:
- rel= "canonical" tags
- 301 Weiterleitungen
- HTTPS vs. HTTP
- Sitemaps
- Interne Links
- Länge der URL
Das Gewicht und die Bedeutung der einzelnen Signale können variieren, und einige Signale, wie z. B. rel="canonical " Tags, können sowohl den Prozess der Gruppierung als auch den der Kanonisierung beeinflussen.
Signale ausbalancieren
Bei so vielen Signalen im Spiel erkannte Allan die Herausforderungen, die mit der Bestimmung der kanonischen URL verbunden sind, wenn die Signale widersprüchlich sind.
Er erklärte:
"Wenn Ihre Signale miteinander in Konflikt geraten, wird das System beginnen, auf weniger wichtige Signale auszuweichen.
Das bedeutet, dass starke Signale wie rel= "canonical " Tags und 301-Weiterleitungen zwar entscheidend sind, dass aber auch andere Faktoren eine Rolle spielen können, wenn diese Signale unklar oder widersprüchlich sind.
Daher beinhaltet der Kanonisierungsprozess von Google ein empfindliches Gleichgewicht, um die am besten geeignete kanonische URL zu bestimmen.
Bewährte Praktiken für die Kanonisierung
Klare Signale helfen Google, die bevorzugte kanonische URL zu identifizieren.
Die besten Praktiken sind folgende:
- Verwenden Sie die Tags rel= "canonical " korrekt.
- Richten Sie 301-Weiterleitungen für dauerhaft verschobene Inhalte ein.
- Stellen Sie sicher, dass die HTTPS-Versionen der Seiten zugänglich und verlinkt sind.
- Einreichen von Sitemaps mit bevorzugten kanonischen URLs.
- Achten Sie bei der internen Verlinkung auf Konsistenz.
Diese Signale helfen Google, die korrekten kanonischen URLs zu finden, was das Crawling, die Indexierung und die Sichtbarkeit Ihrer Website in Suchmaschinen verbessert.
Fehler, die Sie vermeiden sollten
Hier sind einige häufige Fehler, die Sie vermeiden sollten.
1. Falsche oder widersprüchliche kanonische Tags:
- Auf nicht existierende oder 404-Seiten verweisen
- Mehrere Canonical Tags mit unterschiedlichen URLs auf einer Seite
- Auf eine völlig andere Domain verweisen
Korrektur: Kanonische Tags zweimal überprüfen, nur einen pro Seite verwenden und absolute URLs verwenden.
2. Kanonische Ketten oder Schleifen
Wenn Seite A auf Seite B als kanonische Seite verweist, Seite B aber auf Seite A oder eine andere Seite verweist, wodurch eine Schleife entsteht.
Korrektur: Stellen Sie sicher, dass kanonische URLs immer auf die endgültige und bevorzugte Version der Seite verweisen.
3. Verwenden Sie die Tags noindex und canonical gemeinsam
Senden Sie widersprüchliche Signale an Suchmaschinen. Noindex bedeutet, die Seite überhaupt nicht zu indexieren, wodurch die kanonischen Tags irrelevant werden.
Korrektur: Verwenden Sie die Tags canonical für die Konsolidierung und noindex für den Ausschluss.
4. Kanonisieren, um Seiten umzuleiten oder zu noindexieren
Das Verweisen von Canonics auf weitergeleitete oder nicht indexierte Seiten stört Suchmaschinen.
Korrektur: Kanonische URLs müssen den Status 200 haben und indizierbar sein.
5. Ignorieren der Groß- und Kleinschreibung
Eine inkonsistente Groß- und Kleinschreibung von URLs kann zu Problemen mit doppelten Inhalten führen.
Korrektur: Die einheitliche Groß- und Kleinschreibung von URLs und Canonical Tags beibehalten.
6. Vernachlässigung von Paginierung und Einstellungen
Ausgelagerte Inhalte und parameterreiche URLs können bei falscher Handhabung zu Duplikaten führen.
Korrektur: Verwenden Sie kanonische Tags, die auf die erste Seite oder "View All" für die Paginierung verweisen, und halten Sie die Einstellungen konsistent.
Wichtigste Erkenntnisse
Es ist unwahrscheinlich, dass die vollständige Liste der über 40 Signale, die zur Bestimmung der kanonischen URLs verwendet werden, öffentlich zugänglich gemacht wird.
Dennoch verdient diese sehr aufschlussreiche Diskussion Beachtung.
Hier sind die wichtigsten Punkte, die Sie beachten sollten:
- Google verwendet etwa 40 verschiedene Signale, um kanonische URLs zu bestimmen, wobei rel= "canonical " Tags und 301-Weiterleitungen zu den stärksten Indikatoren gehören.
- Bei einem Konflikt zwischen den Signalen stützt sich Google auf sekundäre Signale, um seine Entscheidung zu treffen
- Eine klare und konsistente Umsetzung der Kanonisierungssignale (Tags, Weiterleitungen, Sitemaps, interne Links) ist entscheidend.
- Häufige Fehler wie kanonische Zeichenfolgen, gemischte Signale oder falsche Implementierungen können Suchmaschinen stören.
Hören Sie sich die gesamte Diskussion im folgenden Video an :
Hauptbild: chatiyanon/Shutterstock