Categories
SEO

Optimización automatizada de etiquetas de título utilizando aprendizaje profundo

Una victoria rápida de SEO para la mayoría de los sitios es incluir la palabra clave de mejor clasificación en las etiquetas de título que les están extrañando.

Piénsalo por un minuto.

Si una página ya está Clasificación para una palabra clave y si esa palabra clave no está presente en su título, entonces esa página podría clasificar más altas si tuviéramos que agregar ese término de una manera natural

Si también agregamos palabras clave a meta descripciones. , también podríamos tenerlos destacados en negrita en los resultados de la búsqueda.

Automated Title Tag Optimization Using Deep Learning

Automated Title Tag Optimization Using Deep Learning

Ahora, si trabaja en un sitio con cientos ¡Miles de páginas, o millones de páginas, lo que hace esto manualmente puede volverse mucho tiempo y prohibitivamente caro bastante rápido!

AnunciCementContinue leyendo a continuación

Tal vez esto es algo que podríamos enseñar a hacer una máquina para nosotros.

podría enD hasta hacerlo aún mejor y más rápido que un equipo de ingreso de datos.

Averigüemos.

Reintroducción de Ludwig y Google de Uber T5 Vamos a combinar un par de Tecnologías que he cubierto en columnas anteriores: T5 de LudwigGoogle de Uber (Transformador de transferencia de texto a texto de Uber) Presenté por primera vez

Ludwig

en mi artículo

Clasificación de intenciones automatizadas mediante el aprendizaje profundo

.

En resumen, es una herramienta de “AUTO ML” de código abierto que le permite capacitar a modelos de vanguardia sin escribir ningún código.

Automated Title Tag Optimization Using Deep Learning Primero introduje T5 en el artículo

Cómo producir títulos y metaduras automáticamente . Automated Title Tag Optimization Using Deep Learning

Google

describe T5

como una versión superior de modelos de estilo bert.

advertisementcontinue leyendoDebajo

Si recuerda mi artículo sobre la clasificación de intenciones, BERT fue perfecta para la tarea porque nuestra salida / predicciones de destino son clases / etiquetas (las intenciones).

En contraste, T5 puede resumir (como lo mostré En mi artículo sobre la generación de META TAGS), traducir, responder preguntas, clasificar (como BERT), etc.

Es un modelo muy poderoso. Ahora, T5 no ha sido entrenado ( Por lo que sé) para la optimización de la etiqueta de título.

¡Tal vez podamos hacerlo! Necesitamos:

Un conjunto de datos de entrenamiento con un ejemplo que incluye: etiquetas de título originales sin nuestra Objetivo PalkSour Objetivo Palabras clave: etiquetas de título de Título con nuestro código de afinación de palabras clave de destino y un tutorial para seguir el conjunto de títulos que no están optimizados que podamos usar para probar nuestro modelo

vamosPara comenzar con un conjunto de datos ya coloco de

Datos de Semrush que tiré de HootSuite

. Compilaré instrucciones sobre cómo compilar un conjunto de datos como este juntos. Automated Title Tag Optimization Using Deep Learning

Los autores de T5 organizan generosamente un portátil de colab de Google detallado Automated Title Tag Optimization Using Deep Learning que puede usar para ajustar T5.

Si lo ejecuta, puede usarlo para responder preguntas de trivialidades arbitrarias. En realidad, hice esto durante mi

presentación de SEJ ESUMMIT

en julio.

También incluyen una sección que explica Cómo afinarlo por las nuevas tareas. Pero cuando mira los cambios de código y se requiere la preparación de datos, parece mucho trabajo para averiguar si nuestra idea funcionaría en realidad. AnunciCementContinue leyendo a continuación Tal vez hay un SIMPL¡Er WAY! Afortunadamente, Uber lanzó Ludwig versión 0.3 hace un par de meses. Versión 0.3 de Ludwig Botes con: Un hiperparameter Mecanismo de optimización que aprieta el rendimiento adicional de los modelos. Integración sin código con abrazar la cara s s transformadores Repositoron, dando a los usuarios acceder a la vanguardia pre-entrenada. Modelos como

GPT-2

, T5 ,

Electra

, y DISTILBER para las tareas de procesamiento de lenguaje natural que incluyen clasificación de texto, análisis de sentimientos, entidad nombrada Reconocimiento, respondiendo a la pregunta y mucho más.

Un backend nuevo, más rápido, modular y extensible basado en

TensorFlow 2 .Support para muchos nuevos formatos de datos, incluido TSV, Apache Parquet, JSON y JSONL.OUT. -F-the-box K-Fold Cross Validation

Capacidad. Ideas de integración con

Pesos y sesgos

para monitorear y administrar múltiples procesos de entrenamiento de modelos. Un nuevo tipo de datos vectoriales que admite etiquetas ruidosas para su supervisión débil.

La liberación está llena de nuevas características, pero mi favorita es la integración de las

transformadores de abrazos de la biblioteca

Presenté

abrazando tuberías de la cara

en Mi artículo sobre títulos y meta descripciones generaciones.

AnunciCementContinue La lectura a continuación

 Las tuberías son excelentes para ejecutar predicciones en los modelos ya capacitados y disponibles en el 

Hub

. Pero, en este momento, no hay modelos que hagan lo que necesitamos, por lo que Ludwig viene muy útil aquí.

 Tuning t5 Fino con Ludwig 
 T5 con l¡UDWIG es tan simple, debería ser ilegal! 

La contratación de un ingeniero de AI para hacer el equivalente nos costaría seriamente $$$.

 Aquí están los pasos técnicos. 
 Abra un nuevo cuaderno de Google Colab y cambie el tiempo de ejecución para usar GPU. 

Descargue el conjunto de datos HootSuite que coloco escribiendo escribiendo lo siguiente. Automated Title Tag Optimization Using Deep Learning

! Wget URL https: //gist.githubusercontent. COM / HAMLETBATISTA / 5F6718A653ACF80921444C37007F0D063 / RAW / 84D17C0460B8914F4B76A8699114F4B76A8699D5 / HOOTSUITE_TITLES.CSV Automated Title Tag Optimization Using Deep Learning Siguiente, vamos a instalar Ludwig.

! PIP Instale Ludwig

! PIP Instale ludwig [texto]

Carguemos el conjunto de datos de entrenamiento que descargué en un marco de datos de Pandas para inspeccionarlo y ver cómo se ve.

Importar pandas como PD

DF = PD.READ_CSV (“DATOS .csv “) df.head ()

       La mayor parte del trabajo se reduce a la creación de un archivo de configuración adecuado.  AnunciCementContinue leyendo a continuación  Me di cuenta de que funciona comenzando con el  Documentación para T5  y un poco de prueba y error.   Puede encontrar el código Python para producirlo 

aquí

.

Vamos a revisar los cambios clave .

INPUT_FEATURAS: –

Nombre: Original_title

Tipo: Textlevel: Word

 Codificador: T5 

Reduce_Output: null-

Nombre: Palabra clave

Tipo: Textlevel: Word

Tied_weights: Original_title Automated Title Tag Optimization Using Deep Learning Codificador: t5reduce_output: nullutput_features: –

Nombre: Optimized_title Tipo: Secuencelevel: Word Automated Title Tag Optimization Using Deep Learning Decodificador: generador

Define la entrada al modelo como el título original (sin la palabra clave de destino) y el objetivo kEyword.

Para la salida / predicción, defino el título optimizado y el decodificador

como un generador

Automated Title Tag Optimization Using Deep Learning. Un generador le dice al modelo que produzca una secuencia. Necesitamos esto para generar nuestros hermosos títulos.

Ahora llegamos a la parte típicamente difícil, pero se hizo súper fácil con Ludwig: entrenamiento T5 en nuestro conjunto de datos. Automated Title Tag Optimization Using Deep Learning ! Tren Ludwig –Dataset Hootsuite_titles .csv –config config.yaml

Debe obtener una impresión como la de abajo.

Asegúrese Para revisar los diccionarios de las características de entrada y salida para asegurarse de que se recoja su configuración correctamente. AnunciCementContinue Lectura a continuación Por ejemplo, debe ver Ludwig usando ‘T5-SMALL’

como modelo. Es fácil cambiarlo para modelos T5 más grandes en el concentrador modelo ypotencialmente mejorar la generación.

Formé el modelo durante aproximadamente 1 hora y obtuve una exactitud de validación muy impresionante de

 0.88 

.

También tenga en cuenta que Ludwig seleccionó automáticamente otras mediciones de generación de texto importantes:

Perplexia

Automated Title Tag Optimization Using Deep Learning y

Distancia de edición Automated Title Tag Optimization Using Deep Learning .

Son los dos números bajos, que son buenos en nuestro caso.

 AnunciCementContinue leyendo a continuación 

Optimización de títulos con nuestro modelo capacitado

Automated Title Tag Optimization Using Deep Learning ahora a la parte emocionante. ¡Pongamos nuestro modelo a la prueba!

Primero, descargue un conjunto de datos de prueba con títulos HootSuite sin optimice lo invisible por el modelo durante la capacitación. Automated Title Tag Optimization Using Deep Learning .

! WGET URL https://gist.githubusercontent.com/ Hamletbatista / 1C4CFC0F24F6AC9774DD18A1F6E5B020 / RAW / 7756F21BA5FBF02C2FE9043ffda06e525a06ea34 / hootsuite_titles_to_optimize.csv

Se puede revisar el conjunto de datos con este comando.

 hootsuite_titles_to_optimize.csv! Cabeza 

Automated Title Tag Optimization Using Deep Learning

Automated Title Tag Optimization Using Deep Learning

Podemos generar predicciones con el siguiente comando.

! Ludwig Predecir –Dataset hootsuite_titles_to_optimize.csv –Model_Path Resultados / Experiment_Run / Model /




Se ejecutará durante menos de un minuto y guardará las predicciones a un CSV en el directorio de resultados.

AnunciCementContinue Lectura a continuación

Puede revisar los títulos optimizados con este comando :

! Gato /content/results/title_predictions.csv | sed ‘s /, / / ​​g’



¡Mire cuán hermosos y dramáticamente coherentes son los títulos! Muy impresionante que Ludwig y
T5 pueden hacer con un pequeño conjunto de entrenamiento y sin sintonización de hiperparameter avanzado. , pero nuestra prueba adecuada se reduce a si está mezclando nuestras palabras clave de destino.

Revisemos algunos ejemplos del conjunto de datos de prueba:

Fila

: 798

Título original: 20 Creativo
Instague Ideas de noticias Para involucrar a sus seguidores, palabra clave de destino : qué publicar en
T5 Título optimizado
: 20 creativo Ideas para involucrar a sus seguidores advertisementContinue leyendo a continuación ¡Ahora dime que no hay algo de hechicería seria aquí! & # 129299;

Aquí está otra.

Fila

: 779

TÍTULO ORIGINAL Automated Title Tag Optimization Using Deep Learning: Cómo crear una

media sociedad Idea En 8 sencillos pasos (plantilla gratuita) Automated Title Tag Optimization Using Deep Learning Palabra clave de destino

:

Estrategia social

T5 Título optimizado: Cómo crear un Estrategia de redes sociales

en 8 pasos fáciles (plantilla libre)

¡BOOM!

y aquí está otra:

 

Fila

: 773 Título original : 20+ Creative Show Social Media Show

Ideas y ejemplos,

Palabra clave de destino

: Ideas de concurso

Título optimizado T5

: 20+ Creative

 Concurso de medios sociales Ideas 

y ejemplos

Puede encontrar la lista completa previsible

aquí Automated Title Tag Optimization Using Deep Learning.

Automated Title Tag Optimization Using Deep Learning

Construyendo una aplicación de optimización de etiquetas de título con StreamLit

Los usuarios principales de un servicio como este pueden ser escritores de contenido.

advertisementcontinue leyendo bELOW

¿No sería genial empaquetar esto en una aplicación simple de usar que requiere muy poco esfuerzo para juntar?

que es posible con

ROWERLIT !

Lo usé brevemente en mi artículo

Cómo generar datos estructurados automáticamente usando la visión de la computadora

.

Instalelo usando:

Abra su navegador usando la URL proporcionada. Típicamente, http: // localhost: 8502

Si aún estás arrastrando A su manera de

aprender Python

, ¡espero que esto te emocione lo suficiente como para comenzar a correr! & # 128013; & # 128293;

hPara producir conjuntos de datos personalizados para entrenar

He capacitado este modelo utilizando títulos HootSuite y probablemente no funcionará bien para sitios en otras industrias. Baramente podría funcionar para los competidores.

Es una buena idea producir su propio conjunto de datos, por lo que aquí hay algunos consejos para hacer eso. Aproveche sus propios datos de la consola de búsqueda de Google o las herramientas de WebMaster de Google. , puede retirar los datos de la competencia de Semrush, Moz, AHREFS, etc.Esciere una secuencia de comandos para obtener etiquetas de título y dividir los títulos con y sin las palabras clave de su objetivo. Tome los títulos con las palabras clave y reemplace las palabras clave con sinónimos o use técnicas similares a “deoptimizar “Los títulos.advertisementcontinue leyendo a continuación Estos pasos le darán un conjunto de datos de capacitación con Verdad en tierra Datos que el modelo puede usar para aprender FRom. Para su conjunto de datos de prueba, puede usar los títulos que no tienen las palabras clave (desde el paso 3). Luego, inspeccione la calidad de las predicciones manualmente.


La escritura del código para estos pasos debe ser divertida e interesante tarea. Recursos para obtener más

La adopción de Python en el La comunidad continúa fuerte.

La mejor manera de aprender es haciendo un trabajo interesante y relevante.

Mi equipo en RankSense comenzó a escribir y compartir guiones prácticos en forma de tutoriales de Twitter.

 

Los llamamos RSTWITTORIOS. Hace un par de meses, le pedí a la comunidad que se uniera a nosotros y compartimos sus propios scripts, luego subí a los videos Turistas conmigo cada semana. & # 128165; Tan emocionado de ver tantos #python #seos Compartiendo sus brillantes scripts y viajes en las próximas semanas. Estamos reservados con semanalmente #RSTWITTORTY Sesiones a marzo (¡3 ranuras)! & # 128013; & # 128293; #dontwait Rellena este formulario y clavan una fecha y # 129299; https://t.co/wf2pt6f8kv pic.twitter .com / iosefumwkr – Hamlet Batista (@hamletbatista) 18 de noviembre de 2020 AnunciCementContinue leyendo a continuación al principio , Pensé que haría uno de estos, una vez al mes y planeaba que mi equipo hiciera el resto cada semana. Estamos reservados con increíbles Twittortorys y Twalthroughs cada semana hasta mayo (en el momento de Esta escritura)! & # 128165; Si está tratando de aprender o dominar #python , comparta su experiencia con nosotros y acelera su l¡Ganando! Tenemos 2 tragamonedas abiertas para #RSTWITTORIOS y seminarios web para marzo y abril de 2021. ¡Fechas de apertura para mayo pronto! #dontwait & # 128013; & # 128293; https://t.co/rfnoz25kpq Pic.twitter.com/9giii4u8wx – Hamlet Batista (@hamletbatista) 1 de diciembre de 2020 Muchos trucos geniales y otros viajes de aprendizaje. #Dontwait Más recursos: Cómo generar Preguntas frecuentes y faqpage de calidad Schemas automáticamente con Python haciendo más con menos: automatizado, de alta calidad Generación de contenido 7 Proyectos de ejemplo para comenzar con Python para SEO Créditos de la imagen Todas las capturas de pantalla tomadas por el autor, de diciembre de 2020

Leave a Reply

Your email address will not be published. Required fields are marked *