Categories
SEO

¿Qué es la indexación semántica latente y por qué no importa para SEO?

Los hechos sobre la indexación semántica latente

se hacen muchas reclamaciones Para la indexación semántica latente (LSI) y “Palabras clave de LSI” para SEO.

Algunos incluso dicen que Google se basa en “Palabras clave de LSI” para comprender las páginas web.

Esto se ha discutido durante casi veinte años y los hechos basados ​​en la evidencia han estado allí todo el tiempo.

Esta es la indexación semántica latente

La indexación semántica latente (también conocida como análisis semántico latente) es un método para analizar un conjunto de Documentos in Orden para descubrir co-ocurrencias estadísticas de las palabras que aparecen juntas que luego dan información sobre los temas de esas palabras y documentos.

Dos de los problemas (entre varios) que LSI se establece para resolver son los problemas de Sinonimia y polisemia.

Sinonimia

es una referencia a la cantidad de palabras que pueden describir lo mismo.

Una persona que busca “recetas de flapjack” es igual a una búsqueda de “Recetas de panqueques” (fuera del Reino Unido) porque los flapjacks y panqueques son sinónimos.

AnuncioContinue Lectura a continuación

La polisemia se refiere a palabras y frases que tienen más de un significado. La palabra Jaguar puede significar un animal de animal, automóvil o un equipo de fútbol americano.

LSI es capaz de predecir estadísticamente qué significado de una palabra representa por estadísticaY Analizando las palabras que coexisten con él en un documento.

Si la palabra “Jaguar” está acompañada en un documento por la palabra “Jacksonville”, es estadísticamente probable que la palabra “JAGUAR” sea un Referencia a un equipo de fútbol americano. Al comprender cómo se producen las palabras, una computadora es más capaz de responder a una consulta al asociarse correctamente

las palabras clave adecuadas

a la consulta de búsqueda.

image of an Apple Macintosh SE computer from 1988 La

patente para LSI se presentó el 15 de septiembre de 1988. Es una tecnología antigua que llegó años antes de Internet, ya que sabemos que existía. image of an Apple Macintosh SE computer from 1988 LSI no es nuevo ni está cortando borde.

Es importante entender que en 1988, LSI estaba avanzando en el estado del arte de la combinación de texto simple.

Image of an IBM AS400 computer from 1988

LSI precedió a Internet y fue creado durante un tiempo.n Apple Computers se veía así: Image of an IBM AS400 computer from 1988

Se creó

LSI cuando se creó una computadora empresarial popular (IBM AS / 400):

LSI es una tecnología que se vuelve hacia atrás.

AnunciCementContinue leyendo a continuación

Al igual que las computadoras desde 1988, el estado de El arte en la recuperación de la información ha recorrido un largo camino en los últimos 30 años.

LSI no es práctico para la web

Una mayor deficiencia de usar la indexación semántica latente para toda la Web es que Los cálculos realizados para crear el análisis estadístico deben recalcularse cada vez que se publique e indexado una nueva página web.

Esta deficiencia se menciona en un documento de investigación de 2003 (no google) sobre el uso LSI para detectar correo electrónico correo electrónico (usando lÍndice semántica atent para filtrar el PDF de SPAM).

Notas de investigación:

“Un problema con LSI es que no es compatible con la adición ad-hoc de nuevos documentos una vez que Se ha generado el conjunto semántico. Cualquier actualización a cualquier valor celular cambiará el coeficiente en cualquier otro vector de Word, ya que SVD utiliza todas las relaciones lineales en su dimensionalidad asignada para inducir vectores que predecirán todas las muestras de texto en las que se produce la palabra … “

Le pregunté a

Bill Slawski

sobre la inquisibilidad de LSI para la recuperación de la información de los motores de búsqueda y estuvo de acuerdo, diciendo:

“LSI es un enfoque de indexación más antiguo desarrollado para bases de datos estáticas más pequeñas. Hay similitudes con nuevas tecnologías, como el uso de vectores de palabras o Word2VEC.

Una de las limitacionesNS de LSI es que si se agrega nuevo contenido a un corpus que se requiere la indexación para todo el corpus, lo que lo convierte en una utilidad limitada para un corpus de cambio rápidamente, como la web “

está ahí ¿Un documento de investigación de palabras clave de Google LSI?

Algunos en la comunidad de búsqueda creen que Google usa “palabras clave de LSI” en su algoritmo de búsqueda como si LSI sigue siendo una tecnología de vanguardia

para probarlo, Algunos se refieren a un documento de investigación de 2016

, lo que mejora el tema semántico en clúster para las consultas de búsqueda con co-ocurrencia de Word y Bigraph Co-Clusering (PDF).

Ese documento de investigación no es un ejemplo. de indexación semántica latente. Es una tecnología completamente diferente.

De hecho, ese documento de investigación no es de LSI (A.K.A. Análisis semántico latente)que cita un documento de investigación LSI de 1999 ([5] T. Hofmann. Indicación semántica probabilística latente. … 1999) Como parte de una explicación de por qué LSI no es útil para el problema, los autores están tratando de resolver.

Publicidad leyendo A continuación

Esto es lo que dice:

Es un error utilizar el documento de investigación anterior como prueba.T Google usa LSI como un factor de rango importante. El documento no se trata de LSI y ni siquiera se trata de analizar las páginas web.

Es un papel de investigación interesante de 2016 sobre las consultas de búsqueda breves de la minería de datos para entender lo que significan.

ese papel de investigación Aparte, sabemos que Google utiliza tecnologías de coincidencia de BERT y Neural para comprender las consultas de búsqueda en el mundo real. Larga historia corta: el uso de ese documento de investigación para hacer una declaración definitiva algoritmo de clasificación de Google es incompleto por todas partes.

AnuncioContinue Lectura a continuación

¿Google usa palabras clave de LSI?

No hay tal cosa como las palabras clave de LSI, cualquiera que le indique lo contrario, se equivoca, lo siento.

– & # 127820; John & # 127820; (@JOHNMU)

Señaló

Búsqueda de expertos en patente Slawski también se ha abierto sobre la noción de indexación semántica latente y SEO.

Las declaraciones de Bill en LSI se basan en un profundo conocimiento de

algoritmos de Google

, que ha compartido en artículos basados ​​en hechos (como

aquí

y aquí ).

AnuncioContinue leyendo a continuación

BillSlawski Tweets Su opinión informada sobre la indexación semántica latente

La indexación semántica latente no tiene nada que ver con SEO:

https://t.co/x6kcet9vsm

1 / 3

– Bill Slawski ⚓ (@bill_slawski)

18 de agosto, 2020

Esos términos tienen su propia tecnología y los procesos detrás de cómo se determinan y no usan LSI. No hay nada “latente” sobre ellos. 3/3

– Bill Slawski ⚓ (@bill_slawski)

18 de agosto, 2020

Por qué Google está asociado con un análisis semántico latente

A pesar de que no hay ninguna prueba en términos de patentes e investigaciones que LSI / LSA son factores importantes relacionados con el ranking, Google todavía está asociado con la indexación semántica latente.

Una razón para esto es GoogleLa adquisición de una compañía de 2003 llamada semántica aplicada.

La semántica aplicada había creado una tecnología llamada CIRCA. CIRCA fue un algoritmo de análisis semántico que se usó en AdSense y también en

Google AdWords

.

AdvertisementContinue Lectura a continuación

De acuerdo con

Comunicado de prensa de Google

:

“La semántica aplicada es un innovador comprobado en el procesamiento de texto semántico y la publicidad en línea”, dijo Sergey Brin, cofundador de Google y Presidente de Tecnología. “Esta adquisición permitirá a Google crear nuevas tecnologías que hacen que la publicidad en línea sea más útil para los usuarios, editores y anunciantes por igual.

Los productos de la semántica aplicada se basan en su tecnología patentada circa, que entiende, organiza y extractos. Conocimiento de sitios web e información.Los repositorios de RMACIÓN de una manera que imita el pensamiento humano y permite una recuperación de información más efectiva. Una aplicación clave de la tecnología CIRCA se aplica el producto AdSense de la semántica que permite a los editores web entender los temas clave en páginas web para entregar anuncios altamente relevantes y específicos. “

Análisis semántico y SEO

La frase “análisis semántico” fue una palabra de moda caliente a principios de la década de 2000, tal vez parcialmente impulsada por la tecnología de búsqueda semántica de Jeeves. La compra de la semántica aplicada de Google aceleró la tendencia de asociar Google con la indexación semántica latente , a pesar de que no hay evidencia creíble. AnuncioContinue Lectura a continuación Así, para 2005, la comunidad de mercadeo de búsqueda estaba haciendo declaraciones no fundamentadas,Como


:

“Durante varios meses he notado cambios en los rankings de sitios web en Google y fue claro que algo había cambiado en su algoritmo. Uno de los más Los cambios importantes son la probabilidad de que Google ahora esté brindando más peso a la indexación semántica latente (LSI). Esto no debe ser sorprendente considerando que Google compró semántica aplicada en abril de 2003 y, según informes, ha estado sirviendo sus anuncios de AdSense utilizando indexación semántica latente “. El mito de SEO que Google usa palabras clave de LSI, posiblemente se originó en la popularidad de las frases como” análisis semántico “,” indexación semántica “y” búsqueda semántica “que se ha convertido en SEO BuzzWords, Dada la vida al solicitar la tecnología de búsqueda semántica de Jeeves y la compra de la compañía de análisis semántico de Google AppliEd semántica. Los hechos sobre la indexación semántica latente LSI es un método muy antiguo para entender de qué se trata un documento. Fue patentado en 1988, mucho antes de la Internet como sabemos que existió. AnuncioContinue Lectura a continuación La naturaleza de LSI lo hace inadecuado para aplicar a través de toda la Internet con fines de recuperación de la información. No hay papeles de investigación que muestren explícitamente que La indexación semántica latente es una característica importante de la clasificación de búsqueda de Google. Los hechos presentados en este artículo muestran que este ha sido el caso desde principios de la década de 2000. Rumores del uso de Google de LSI y LSA de Google. Empresa en 2003 después de que Google adquirió la semántica aplicada, la compañía que produjo el producto publicitario contextual Adsense. Los Googlers han afirmado varias veces que Google no usa tal cosa como Palabras clave de LSI. Déjame decirlo más fuerte para aquellos en la parte posterior: no existe tal cosa como Palabras clave de LSI. Teniendo en cuenta la abrumadora cantidad de evidencia, es razonable afirmar que es un hecho de que el concepto de palabras clave de LSI es falso. Los hechos también indican que LSI no es una parte importante de la clasificación de Google. Algorithms. Considerado a la luz de los avances recientes en AI, el procesamiento de lenguaje natural y Bert, la idea de que Google usaría prominentemente, LSI, ya que una característica de clasificación está literalmente más allá de la creencia y ridícula. AnuncioContinue leyendo a continuación. Más recursos: Una lista de verificación de SEO completa para los propietarios de sitios web Cómo convertirse en unN SEO Expert Cómo evitar la información errónea de SEO Imagen destacada por el autor

Leave a Reply

Your email address will not be published. Required fields are marked *