Categories
SEO

7 proyectos de ejemplo para comenzar con Python para SEO

Después de comenzar a aprender Python a fines del año pasado, me he encontrado poniendo en práctica lo que he estado aprendiendo cada vez más para mis tareas diarias como profesional de SEO.

Esto varía de tareas bastante simples Como comparar la forma en que las cosas como el recuento de palabras o los códigos de estado han cambiado con el tiempo, a las piezas de análisis, incluyendo el enlace interno y el análisis de archivos de registro.

Además, Python ha sido realmente útil:

para trabajar con grandes Conjuntos de datos. Para los archivos que generalmente se bloquean Excel y requieren un análisis complejo para extraer información significativa.

Cómo Python puede ayudar con la SEO técnica

Python permite a los profesionales de la SEO de varias maneras debido a su Capacidad para automatizar tareas repetitivas de bajo nivel que normalmente toman mucho tiempo para completar

Esto significa que tenemos más tiempo (y energía) para gastar en importantes esfuerzos estratégicos y de optimización que no pueden ser automatizados.

También nos permite trabajar de manera más eficiente con grandes cantidades de datos para hacer más Las decisiones impulsadas por datos, que a su vez pueden proporcionar devoluciones valiosas en nuestro trabajo, y el trabajo de nuestros clientes.

AnunciCementContinue Lectura a continuación De hecho, un estudio

de McKinsey Global Institute encontró que los datos- Las organizaciones impulsadas tenían 23 veces más propensas a adquirir clientes y seis veces más probabilidades de conservar a esos clientes.

También es realmente útil para respaldar cualquier idea o estrategias que tenga, ya que puede cuantificarlo con los datos que tiene y tomar decisiones basadas en eso, al tiempo que tiene más poder de apalancamiento al intentarConsigue las cosas implementadas.

Agregar python a su flujo de trabajo SEO

La mejor manera de agregar Python a su flujo de trabajo es:

Piense en lo que se puede automatizar, especialmente al realizar tareas tediosas. Identifique cualquier brechas en el trabajo de análisis que está realizando, o ha completado. He encontrado que otra forma útil de comenzar el aprendizaje es usar los datos que ya tiene acceso y Extraiga información valiosa

de ella usando Python.

Así es como he aprendido la mayoría de las cosas que compartiré en este artículo.

AnuncioContinue Lectura a continuación

El aprendizaje de Python no es necesario para convertirse en un buen SEO PRO, pero si está interesado en encontrar más sobre cómo puede ayudar a prepararse para saltar.

Lo que necesita para comenzar

en oDer Para obtener los mejores resultados de este artículo, hay algunas cosas que necesitará: Algunos datos de un sitio web (por ejemplo, un rastreo de su sitio web, Google Analytics, o datos de la consola de búsqueda de Google) .AN IDE (desarrollo integrado Medio ambiente) Para ejecutar Código, para comenzar, recomendaría Google Colab o

Notebook Jupyter

. La mente abierta. Esto es quizás lo más importante, no tenga miedo de romper algo o cometer errores, encontrar la causa de un problema y las formas de solucionarlo es una gran parte de lo que hacemos como profesionales de SEO, por lo que aplicamos esta misma mentalidad al aprendizaje. Python es útil para quitar cualquier presión.

1. Probando las bibliotecas

Un gran lugar para comenzar es probar algunas de las muchas bibliotecas que están disponibles para usar en Python. Hay muchas

bibliotecas para explorar

, pero tres que encuentro más útil para las tareas relacionadas con SEO son pandas, solicitudes y hermosas sopa.

Panda

Panda

es una biblioteca de Python utilizada para trabajar con los datos de la tabla, permite la manipulación de datos de alto nivel donde la estructura de datos clave es un flujo de datos. Los fromas de datos son esencialmente la versión de Pandas de un Excel

Sin embargo, la hoja de cálculo

, sin embargo, no se limita a los límites de fila y byte de Excel y también mucho más rápido y, por lo tanto, eficiente en comparación con Excel. Python Pandas DataFrame

Python Pandas DataFrame

 

 

 

Rquest Content

Rquest Content La mejor manera de comenzar con Pandas es tomar un CSV simple de datos, por ejemplo, un rastreo de su sitio web y guarde esto dentro de Python como un flujo de datos.

Una vez que tenga esta tienda ” Podremos realizar un númerode diferentes tareas de análisis, incluidos los datos de agregación, pivotamiento y limpieza.

 AnunciCementContinue Lectura a continuación 

Importar pandas como PDDF = PD.READ_CSV (“/ FILE_NAME / and_PATH”) DF.HEAD

Solicite

La siguiente biblioteca se llama Solicitudes , que se utiliza para hacer solicitudes HTTP en Python.

Utiliza diferentes métodos de solicitud, como obtener y publicar para hacer una solicitud, con Los resultados se almacenan en Python.

Un ejemplo de esto en acción es una simple solicitud de URL, esto imprimirá el código de estado de una página, que luego se puede usar para crear una simple toma de decisiones Función.

Solicitudes de importación # Imprima la respuesta HTTP de la respuesta de la página = Solicitud de solicitud (‘https://www.deepcrawn.com’) Imprimir (Respuesta) #Create Función de toma de decisiones SI LA RESPUESTA.STATUS_CODE== 200: impresión (‘¡Éxito!’) Elif Response.Status_code == 404: Imprimir (‘No se encuentra’)

 

También puede usar diferentes solicitudes, como encabezados, que muestran información útil sobre el Página, como el tipo de contenido y un límite de tiempo en el tiempo que tardó en almacenar en caché la respuesta.

 #PRINT PAGE HEADER RESPUESTADORES = RESPUESTA. HIERNO.SPRINT (encabezados) #Extracto elemento del encabezado responseResponse.Headers ['contenido- Tipo '] 

Beautiful Soup Links

Beautiful Soup Links

También existe la capacidad de simular a un agente de usuario específico, como GoogleBot, para extraer la respuesta. BOT específico se verá al rastrear la página.

AnunciCementContinue leyendo por debajo de

encabezados = {‘Agente de usuario’: ‘Mozilla / 5.0 (compatible; Googlebot / 2.1; + http: //www.google.com/bot .HTML) ‘} UA_RESPONSE = SOLICITUDS.GET (‘https://www.deepclaw.com/’, encabezados = encabezados) Imprimir (UA_RESPONSE)

 Hermosa sopa 

La biblioteca final se llama

hermosa sopa

, que se usa para extraer datos de los archivos HTML y 

XML

. Segmentation

Se usa más a menudo para el raspado web, ya que puede transformar un documento HTML en diferentes objetos de Python. Segmentation Por ejemplo , puede tomar una URL y usar una sopa hermosa, junto con la biblioteca de solicitudes, extraer el título de la página.

# SOBREAULTURE SOPA DE BS4 Importar Beautifulsup Import Solicitudes #Request URL Para extraer elementos de FROMURL = ‘HTTPS: //www.deepclaw.com/knowledge/technical-seo-library/’req = SolicituS.Get (URL) SOPS = BeautifulSoup (req.text, “html.parser”) # Imprimir título de la página web Título = Soup.titlePrint ( Título)

 Adicionalmente, hermosa SouP Le permite extraer otros elementos de una página, como todos los enlaces de HREF que se encuentran en la página. 

para el enlace en sopa.find_all (‘a’): imprimir (link.get (‘href’ )) Segments

Segments

2. Las páginas de segmentación

La primera tarea consiste en segmentar las páginas de un sitio web, que esencialmente agrupa las páginas en las categorías que dependen de su estructura de URL o el título de la página.

AnunciCementContinue Reading a continuación

Comience por usar un regeo simple para romper El sitio en diferentes segmentos basados ​​en su URL:

Segment_Definitions =[[(R ‘\ / Blog \ /’), ‘Blog’], [(R ‘/ Technical-SEO-Library \ / ‘),’ Biblioteca técnica de SEO ‘], [(R’ \ / Hangout-Biblioteca \ / ‘),’ Biblioteca Hangout ‘], [(R’ \ / Guías \ / ‘),’ Guías ‘],]

 

A continuación, agregamos una pequeña función que seOP a través de la lista de URL y asigne cada URL con una categoría, antes de agregar estos segmentos a una nueva columna dentro del flujo de datos que contiene la lista de URL original.

Uso_sement_Definitions = Segmento TRUEDEF (URL): Si usa_sement_definitions == VERDADERO: Para Segment_Definition en Segment_Definitions: si re.findall (segmento_definition [0], url): devuelve segmento_definición [1] devuelve ‘Otro’df [‘ segmento ‘] = df [‘ url ‘]. Aplicar (lambda x: get_segment ( x))

Redirect Relevance

Redirect Relevance

También hay una forma de segmentar las páginas sin tener que crear manualmente los segmentos, utilizando la estructura de la URL. Esto agarrará la carpeta que está contenida después del dominio principal para categorizar cada URL.

AnunciCementContinue leyendo a continuación

de nuevo, tsu mensaje agregará una nueva columna a nuestro proceso de datos con el segmento generado.

Pandas Pivot DEF GET_SEGMENT (URL): Slug = reinsearch (r’https?: \ / \ /.*? \ //? ([^ \ /]) \ / ‘) \ /’, URL) Si Slug: devuelve Slug.Group (1) Else: devuelva ‘Ninguno’ # Agregue una columna de segmento y realice en una categoríaDF [‘segmento’] = df [‘ URL ‘]. Aplicar (lambda x: get_sement (x))

Pandas Pivot

Relevance Examples

3. Redirigir la relevancia Relevance Examples Esta tarea es algo que nunca habría pensado en hacer si no era consciente de lo que era posible con Python.

Siguiendo una migración, cuando se establecieron redirecciones, nosotros Quería averiguar si el mapeo de redireccionamiento era preciso revisando si la categoría y la profundidad de cada página habían cambiado o se mantuvieron igual.

AnunciCementContinue leyendo Below

Esto implicó tomar un rastreo previo y posterior a la migración del sitio y segmentará cada página en función de su estructura de URL, como se mencionó anteriormente.

Siguiendo esto, utilicé algunos operadores de comparación simples, que están integrados en Python, para determinar si la categoría y la profundidad para cada URL habían cambiado.

DF [‘Category_Match’] = DF [‘Old_Category’] == (DF [‘Redirected_Category’]) DF [‘Segment_Match’] = DF [‘OLD_SEGMENT’] == (DF [‘Rediriged_Sexment’]) DF [‘profundos_match’] = df [‘old_count’] == (df [‘rediriged_count’]) df [‘profundos_difference’] = df [‘ Old_count ‘] – (DF [‘ Redirected_count ‘])

 Como es esencialmente un script automatizado, se ejecutará a través de cada URL para determinar si la categoría o la profundidad ha cambiado y emite los resultados como un nuevoframe de datos. 

El nuevo flujo de datos incluirácolumnas adicionales que muestran verdadera si coinciden, o falso si no lo hacen. Internal Link Analysis

Internal Link Analysis

Y al igual que en Excel, la biblioteca permite pandas Usted debe hacer que los datos se pongan en función de un índice del refrigerante original.

AnunciCementContinue leyendo a continuación

, por ejemplo, para obtener una cuenta de cuántas URL tenían categorías coincidentes después de la migración.

Status Code Log File Requests

Status Code Log File Requests

Log File Requests by Segment

Log File Requests by Segment

Log File Requests Line Graph

Log File Requests Line Graph

Python Pandas Merge

Python Pandas Merge

Pandas Merge

Pandas Merge

Este análisis le permitirá revisar las reglas de redireccionamiento que se han establecido e identificar si hay categorías con una gran diferencia previa y posterior a la migración que pueda necesitar una investigación adicional.

4. Análisis de enlaces internos

El análisis de los enlaces internos es importante para identificar qué secciones del sitio están vinculadas al más, así como el discoOver oportunidades para mejorar la conexión interna a través de un sitio.

AnuncioContinue Lectura a continuación

Para realizar este análisis, solo necesitamos algunas columnas de datos de un rastreo web, por ejemplo, cualquier enlaces de visualización métrica y se enlaces entre Páginas. Pytrends Example

Nuevamente, queremos segmentar estos datos con el fin de determinar las diferentes categorías de un sitio web y analizar la vinculación entre ellos. Pytrends Example interno_linking_pivot [‘SIGUIENTE_LINKS_IN_COUNT’] = (interno_linking_pivot [‘ seguido_links_in_count ‘]). Aplique (‘ {:. 1f} ‘. Formato) interno_linking_pivot [‘ enlick_in_count ‘] = (interno_linking_pivot2 [‘ enlick_in_count ‘]). Aplique (‘ {:. 1F} ‘. Formato) interno_linking_pivot [‘ enlaces_out_count ‘ ] = (interno_linking_pivot [‘enlaks_out_count’]). Aplique (‘{:. 1F}’. Formato) interno_linking_pivot

Pytrends Visualisation

Las tablas de pivotes son realmente útiles para este análisis, ya que podemos pivotar en la categoría para calcular el número total de enlaces internos para cada uno. Pytrends Visualisation AnuncioContinue leyendo a continuación. Python también nos permite realizar funciones matemáticas para obtener un recuento, suma o mezquino de los datos numéricos que tenemos.

5. Análisis de archivos de registro

Otra pieza de análisis importante está relacionada con

archivos de registro

y los datos que podemos recopilar para estos en varias herramientas diferentes.

Algunos útiles Las ideas que puede extraer incluyen identificar qué áreas de un sitio se arrastran más por GoogleBOT y monitoreando cualquier cambio en el número de solicitudes a lo largo del tiempo.

Además, también se pueden usar para ver cuántos no indexables o pa rotaLos GES siguen recibiendo éxitos BOT para abordar cualquier problema potencial con el presupuesto de rastreo.

nuevamente, la forma más fácil de realizar este análisis es segmentar las URL en función de la categoría que se sientan en la categoría y usan tablas de pivote para generar un conteo, o promedio, para cada segmento.


AnunciCementContinue Lectura a continuación

Si puede acceder a los datos de archivo de registro históricos, hay También la posibilidad de monitorear cómo las visitas de Google a su sitio web han cambiado con el tiempo.

También hay excelentes bibliotecas de visualización disponibles dentro de Python, como MatPlotlib y el marborn, que le permiten crear gráficos de barras o gráficos de línea para trazar los datos en bruto en gráficos fáciles de seguir, mostrando comparaciones o tendencias a lo largo del tiempo. 6. Fusión de datos Con la Biblioteca Pandas, también existe la capacidad de combinar los cuadros de datos en función de una columna compartida, por ejemplo, URL. AnunciCementContinue Lectura a continuación Algunos ejemplos de fusiones útiles para fines de SEO incluyen Combinando datos de un gateo web con los datos de conversión que se recopila dentro de Google Analytics. Esto tomará cada URL para que coincida con y muestre los datos de ambas fuentes dentro de una tabla. Los datos que fusionan de esta manera ayudan a proporcionar más información sobre las páginas de mayor rendimiento, mientras que también identifica las páginas que no se desempeñan tan bien como está esperando. AnunciCementContinue Lectura a continuación Tipos de combinación Hay un par de formas diferentes de fusionar datos en PYTHON, el valor predeterminado es una fusión interna donde se producirá la fusión en los valores que existen en los frágase de datos izquierdo y derecho. Sin embargo, , también puede realizar una combinación externa que devolverá todas las filas del flujo de datos izquierdo, y todas las filas del protector de datos derecho y coincidan con ellos cuando sea posible. AnunciCementContinue leyendo por debajo de , así como una fusión a la derecha, o a la izquierda. Fusión que fusionará todas las filas correspondientes y mantenga aquellos que no coincidan si están presentes en la fusión a la derecha o izquierda, respectivamente. 7. Tendencias de Google También hay una gran biblioteca disponible llamada Pytrends , que esencialmente le permite recopilar datos de las tendencias de Google a escala con Python. Hay varios métodos API disponibles Para extraer diferTipos de datos de NT. Un ejemplo es rastrear el interés de la búsqueda por encima del tiempo de hasta 5 palabras clave a la vez. Otro método útil es devolver las consultas relacionadas para un cierto tema, esto mostrará un puntaje de las tendencias de Google entre 0-100, así como un porcentaje que muestra cuánto interés ha aumentado la palabra clave con el tiempo. AnuncioContinue leyendo a continuación. Estos datos se pueden agregar fácilmente a un documento de hoja de Google para poder mostrar dentro de un panel de datos de Google Data Studio. en Conclusión Estos proyectos me han ayudado a ahorrar mucho tiempo en el trabajo de análisis manual, al tiempo que me permite descubrir aún más información de todos los datos a los que tengo acceso. I Espero que esto te haya dado algunos ins.Patriativa para los proyectos de SEO Puede comenzar a comenzar a iniciar su aprendizaje de Python. AnunciCementContinue leyendo a continuación Me encantaría saber cómo se lleva a cabo si decides probar alguno de estos y he incluido todos los Proyectos anteriores dentro de Este repositorio de GitHUB . Más recursos: Cómo predecir el éxito del contenido con Python una introducción a Procesamiento de lenguaje natural con Python para SEOS SEO técnico avanzado: una guía completa Créditos de la imagen Todas las capturas de pantalla tomadas por el autor, de diciembre de 2020

Leave a Reply

Your email address will not be published. Required fields are marked *