En un episodio reciente del podcast Search Off the Record de Google, Allan Scott, del equipo de Dups, explicó cómo decide Google qué URL considerar como principal cuando hay páginas duplicadas.
Reveló que Google tiene en cuenta unas 40 señales diferentes a la hora de elegir la URL principal entre un grupo de páginas similares.
Alrededor de 40 señales para seleccionar la URL canónica
El contenido duplicado es un problema común para los motores de búsqueda, ya que muchos sitios web tienen varias páginas con contenido idéntico o similar.
Para resolver este problema, Google utiliza un proceso denominado canonicalización. Este proceso permite a Google elegir una URL como la versión principal que se indexará y mostrará en los resultados de búsqueda.
Google ha destacado la importancia de utilizar señales como las etiquetas rel="canonical", los sitemaps y las redirecciones 301 para la canonicalización. Sin embargo, el número de señales que intervienen en este proceso es mayor de lo que imaginas.
reveló Scott durante el podcast:
"De momento no estoy seguro de la cifra exacta, porque hay altibajos, pero creo que ronda los 40.
Éstas son algunas de las señales conocidas que se han mencionado:
- tags rel= "canonical
- Redireccionamientos 301
- HTTPS frente a HTTP
- Sitemaps
- Enlaces internos
- Longitud de la URL
El peso y la importancia de cada señal pueden variar, y ciertas señales, como las etiquetas rel="canonical", pueden influir tanto en los procesos de agrupación como de canonización.
Señales de equilibrio
Con tantas señales en juego, Allan reconoció el reto que supone determinar la URL canónica cuando las señales son contradictorias.
Dijo:
"Si sus señales entran en conflicto entre sí, el sistema empezará a recurrir a señales menos importantes.
Esto significa que, aunque las señales fuertes como las etiquetas rel="canonical" y los redireccionamientos 301 son cruciales, pueden entrar en juego otros factores cuando estas señales no son claras o son contradictorias.
Como resultado, el proceso de canonización de Google implica un delicado acto de equilibrio para determinar la URL canónica más adecuada.
Buenas prácticas de canonicalización
Las señales claras ayudan a Google a identificar la URL canónica preferida.
Las mejores prácticas son las siguientes:
- Utilice correctamente las etiquetas rel="canonical".
- Establezca redireccionamientos 301 para el contenido movido permanentemente.
- Asegúrese de que las versiones HTTPS de las páginas son accesibles y están enlazadas.
- Envíe sitemaps con URL canónicas preferidas.
- Asegúrese de que sus enlaces internos son coherentes.
Estas señales ayudan a Google a encontrar las URL canónicas correctas, lo que mejora el rastreo, la indexación y la visibilidad de su sitio en los motores de búsqueda.
Errores a evitar
He aquí algunos errores comunes que conviene evitar.
1. Etiquetas canónicas incorrectas o contradictorias:
- Apuntar a páginas inexistentes o 404
- Varias etiquetas canónicas con URL diferentes en la misma página
- Apuntar a un dominio completamente diferente
CorrecciónCompruebe dos veces las etiquetas canónicas, utilice sólo una por página y use URL absolutas.
2. Cadenas o bucles canónicos
Cuando la página A hace referencia a la página B como página canónica, pero la página B hace referencia a la página A o a otra página, creando un bucle.
CorrecciónAsegúrese de que las URL canónicas apunten siempre a la versión final y preferida de la página.
3. Utilice las etiquetas noindex y canonical a la vez
Envío de señales contradictorias a los motores de búsqueda. Noindex significa no indexar la página en absoluto, lo que hace que las etiquetas canónicas sean irrelevantes.
CorrecciónUtilice etiquetas canónicas para la consolidación y noindex para la exclusión.
4. Canonicalizar para redirigir o noindexar páginas
Apuntar canónicos a páginas redirigidas o no indexadas molesta a los motores de búsqueda.
CorrecciónLas URL canónicas deben tener un estado 200 y ser indexables.
5. Ignorar mayúsculas y minúsculas
La rotura inconsistente de URL puede provocar problemas de contenido duplicado.
Corrección: Mantenga la coherencia de las URL y las etiquetas canónicas.
6. Descuidar la paginación y los parámetros
Los contenidos paginados y las URL ricas en parámetros pueden dar lugar a duplicaciones si se gestionan mal.
CorrecciónUtilice etiquetas canónicas que apunten a la primera página o "Ver todo" para la paginación, y mantenga la coherencia de sus parámetros.
Principales resultados
Es poco probable que se haga pública la lista completa de las más de 40 señales utilizadas para determinar las URL canónicas.
Sin embargo, este debate tan instructivo merece ser destacado.
Estos son los puntos principales que hay que recordar:
- Google utiliza alrededor de 40 señales diferentes para determinar las URL canónicas, siendo las etiquetas rel="canonical" y las redirecciones 301 algunos de los indicadores más potentes.
- En caso de conflicto entre señales, Google utiliza señales secundarias para tomar su decisión
- La aplicación clara y coherente de las señales de canonicalización (etiquetas, redireccionamientos, sitemaps, enlaces internos) es crucial.
- Errores comunes como las cadenas canónicas, las señales mixtas o las implementaciones incorrectas pueden confundir a los motores de búsqueda.
Escuche todo el debate en el siguiente vídeo:
Imagen principal: chatiyanon/Shutterstock