Categories
Noticias

Google puede ver las páginas web como duplicadas si las URL son demasiado similares

Google utiliza un método predictivo para detectar contenido duplicado basado en patrones de URL, lo que podría provocar que las páginas se identifiquen incorrectamente como duplicadas.

Para evitar que se arrastre e indexación innecesaria, Google Intenta predecir cuando las páginas pueden contener contenido similar o duplicado en función de sus URL.

Cuando Google se arrastra páginas con patrones de URL similares y descubra que contienen el mismo contenido, puede determinar todas las demás páginas con ese patrón de URL. El mismo contenido también.

Desafortunadamente para los propietarios de sitios que podrían significar páginas con contenido único que se descontan como duplicados porque tienen el mismo patrón de URL que las páginas que son duplicadas reales. Esas páginas se dejarán fuera del índice de Google.

Este tema se discute DurinG The Google Search Seo Central Seo Hangout grabado en marzo 5. El propietario del sitio Ruchit Patel le pregunta a Mueller sobre su sitio web de eventos donde miles de URL no se están indexando correctamente.

Una de las teorías de Mueller en cuanto a por qué está sucediendo. El método predictivo utilizado para detectar contenido duplicado.

AnunciCementContinue Lectura a continuación

Lea la respuesta de Mueller en la sección a continuación.

Juan Mueller de Google en la predicción de contenido duplicado

Google tiene múltiples niveles de Determinar cuando las páginas web tienen contenido duplicado.

Uno de ellos es mirar el contenido de la página directamente, y el otro es predecir cuando las páginas se dupliquen según sus URL.

“Lo que tiende a suceder de nuestro lado es que tenemos múltiples niveles de tratar de entender cuando hayEs el contenido duplicado en un sitio. Y uno es cuando miramos el contenido de la página directamente y nos vemos, bueno, esta página tiene este contenido, esta página tiene contenido diferente, debemos tratarlos como páginas separadas.

La otra cosa es amable. de un enfoque predictivo más amplio que tenemos donde observamos la estructura de la URL de un sitio web donde vemos, bueno, en el pasado, cuando hemos visto las URL que se ven así, hemos visto que tienen el mismo contenido que Urls como este. Y luego, a continuación, aprenderemos ese patrón y diremos que las URL que parecen esto son las mismas que las URL que se ven así “.

AnunciCementContinue Lectura a continuación

Mueller continúa explicando esto es conservar recursos cuando se trata de arrastrarse e indexar.

Cuando Google piensa unLa página es una versión duplicada de otra página porque tiene una URL similar, ni siquiera se arrastrará, dijo la página para ver cómo se ve realmente el contenido.

“Incluso sin mirar las URL individuales nosotros A veces, puede decir, bueno, nos salvaremos algunos rastreo e indexación y solo se centraremos en estos casos de duplicación asumidos o muy probables. Y he visto que sucede con cosas como ciudades.

He visto que suceda con cosas como, no lo sé, los automóviles son otra en la que vimos que sucede, donde esencialmente nuestros sistemas reconocen que lo que usted Especifique como un nombre de la ciudad es algo que no es tan relevante para las URL reales. Y, por lo general, aprendemos ese tipo de patrón cuando un sitio proporciona un montón del mismo contenido con nombres alternativos “.

Mueller habla a HEl método predictivo de la detección de Google para detectar contenido duplicado puede afectar los sitios web de eventos:

“Entonces, con un sitio de eventos, no sé si este es el caso de su sitio web, con un sitio de eventos, podría suceder Para que tome una ciudad, y tome una ciudad que se encuentra a un kilómetro, y las páginas de eventos que muestres existen exactamente iguales porque los mismos eventos son relevantes para ambos lugares.

y usted Tome una ciudad, quizás a cinco kilómetros de distancia y muestre exactamente los mismos eventos nuevamente. Y desde nuestro lado, que podría terminar fácilmente en una situación en la que decimos, bueno, verificamos 10 URL de eventos, y este parámetro que parece un nombre de la ciudad en realidad es irrelevante porque revisamos 10 de ellos y mostramos el mismo contenido. Y eso es algo donde nuestros sistemas.Luego, puede decir, bueno, tal vez el nombre de la ciudad en general es irrelevante y podemos simplemente ignorarlo “.

AnunciCementContinue Lectura a continuación

¿Qué puede hacer un propietario del sitio para corregir este problema?

Como una solución potencial para este problema, Mueller sugiere buscar situaciones en las que existen casos reales de contenido duplicado y para limitar lo más posible.

“Entonces, ¿qué lo haría? Trate de hacerlo en un caso como este es ver si tiene este tipo de situaciones en las que tiene fuertes superposiciones de contenido y para tratar de encontrar formas de limitar tanto lo más posible.

y eso podría ser por Usando algo como un REL canónico en la página y diciendo, bueno, esta pequeña ciudad que está justo afuera de la gran ciudad, estableceré el canónico a la gran ciudad porque muestra exactamente el SAM.Contenido.

Para que realmente cada URL se arrastremos en su sitio web e índice, podemos ver, bueno, esta URL y su contenido son únicos y es importante para nosotros mantener todas estas URLs indexadas.

O vemos información clara de que esta URL que conoce se supone que es la misma que la otra, quizás haya configurado una redirección o tenga un REL canónico, y solo podemos centrarnos en aquellos Las URL principales y aún entienden que el aspecto de la ciudad es fundamental para sus páginas individuales “.

AnunciCementContinue Lectura a continuación

Mueller no aborda este aspecto del problema, pero vale la pena señalar que no hay penalización o negativa Señal de clasificación asociada con contenido duplicado.

A lo sumo, Google no indexará el contenido duplicado, pero no reflejará NegativEly en el sitio en general. Ver: Google: el contenido duplicado no es un factor de clasificación negativo Escuchar la respuesta de Mueller en el video a continuación:

Leave a Reply

Your email address will not be published. Required fields are marked *