Categories
SEO

Pregunte al experto: desmitificando la AI y el aprendizaje de la máquina en la búsqueda

El mundo del aprendizaje de la AI y la máquina tiene muchas capas y puede ser bastante complejo para aprender. Muchos términos están ahí fuera y, a menos que tenga una comprensión básica del paisaje, puede ser bastante confuso. En este artículo, Expert Eric Enge introducirá los conceptos básicos y tratará de desmitificarlo todo para usted. Esta es también la primera de una serie de artículos de cuatro partes para cubrir muchos de los aspectos más interesantes del paisaje AI.

Los otros tres artículos en esta serie serán:

  • Introducción al procesamiento de lenguaje natural

  • GPT-3

  • : Qué es y Cómo aprovecharlo Corrientes en Google AI Algorithms: Rankbrain, Bert,
  • Mamá

, y Smith

Fondo básico en AI

    Hay tantos términos diferentes que puede ser difícil deOrdenar lo que todos significan. Entonces, comencemos con algunas definiciones:

  • Inteligencia artificial : esto se refiere a la inteligencia poseída / demostrada por las máquinas, a diferencia de la inteligencia natural, que es lo que vemos en los humanos y otros Animales.
  • Inteligencia general artificial (AGI) : este es un nivel de inteligencia donde las máquinas pueden abordar cualquier tarea que una lata humana. Aún no existe, pero muchos se esfuerzan por crearlo.
  • Aprendizaje de la máquina : este es un subconjunto de AI que utiliza datos e iterativos para aprender a realizar tareas específicas.
  • Aprendizaje profundo : este es un subconjunto de aprendizaje de la máquina que aprovecha las redes neuronales altamente complejas para resolver problemas de aprendizaje automático más complejos.
  • naProcesamiento de lenguaje tural (NLP) : este es el campo de AI centrado específicamente en el procesamiento y la comprensión del lenguaje.

Redes neuronales

: este es uno de los tipos de máquina más populares Algoritmos de aprendizaje que intentan modelar la forma en que las neuronas interactúan en el cerebro.

Todos están estrechamente relacionados y es útil ver cómo encajan todos:

En resumen, la inteligencia artificial abarca todos estos conceptos, el aprendizaje profundo es un subconjunto de aprendizaje de la máquina, y el procesamiento de lenguaje natural utiliza una amplia gama de algoritmos AI para comprender mejor el idioma.

Ejemplo de la muestra de cómo funciona una red neuronal

Hay muchos tipos diferentes de algoritmos de aprendizaje de la máquina. El más conocido de tLos algoritmos de la red neuronal están y para brindarle un poco de contexto que lo cubriré a continuación.

Considere el problema de determinar el salario para un empleado. Por ejemplo, ¿qué pagamos a alguien con 10 años de experiencia? Para responder a esa pregunta, podemos recopilar algunos datos sobre lo que otros se están pagando y sus años de experiencia, y eso podría parecer esto:

con datos como este podemos facilitar Calcule lo que este empleado en particular debe recibir el pago creando un gráfico de línea:

Para esta persona en particular, sugiere un salario de un poco más de $ 90,000 por año. Sin embargo, todos podemos reconocer rápidamente que esto no es realmente una visión suficiente, ya que también debemos considerar la naturaleza del trabajo y el nivel de rendimiento del emplo.Yee. La introducción de esas dos variables nos llevará a un gráfico de datos más como este:

es un problema mucho más difícil de resolver, pero uno que el aprendizaje de la máquina puede hacer con relativamente fácilmente. Sin embargo, no estamos realmente hechos con la adición de complejidad a los factores que impactan los salarios, ya que donde se encuentra también tiene un gran impacto. Por ejemplo, los empleos del área de San Francisco Bay en tecnología pagan significativamente más que los mismos trabajos en muchas otras partes del país, en gran parte debido a las grandes diferencias en el costo de la vida.

Vector ilustración aislada de mapa administrativo simplificado de EE. UU. (Estados Unidos de América). Fronteras y nombres de los estados (regiones). Siluetas grises. Esquema blanco.

  • El enfoque básico que usaría las redes neuronales esAdivina en la ecuación correcta utilizando las variables (trabajo, experiencia de año, nivel de rendimiento) y calculando el salario potencial utilizando esa ecuación y al ver qué tan bien coincide con nuestros datos del mundo real. Este proceso es cómo se sintonizan las redes neuronales y se conoce como “descenso de degradado”. La forma de inglés simple de explicarlo sería llamarlo “aproximación sucesiva”.

Los datos salariales originales son lo que la red neuronal usaría como “datos de capacitación” para que pueda saber cuándo ha construido un algoritmo. Eso coincide con la experiencia del mundo real. Caminemos a través de un simple ejemplo que comienza con nuestro conjunto de datos originales con solo los años de experiencia y los datos salariales.

Para mantener nuestro ejemplo más sencillo, supongamos que la red neuronal que usaremos para thSe entiende que 0 años de experiencia equivalen a $ 45,000 en el salario y que la forma básica de la ecuación debe ser: salario = años de servicio * x + $ 45,000. Necesitamos resolver el valor de X para llegar a la ecuación correcta para usar. Como primer paso, la red neuronal puede adivinar que el valor de X es de $ 1,500. En la práctica, estos algoritmos hacen estas conjeturas iniciales al azar, pero esto lo hará por ahora. Aquí está lo que obtenemos cuando intentamos un valor de $ 1500:

Como podemos ver en los datos resultantes, los valores calculados son demasiado bajos. Las redes neuronales están diseñadas para comparar los valores calculados con los valores reales y proporcionarle la retroalimentación que luego se puede usar para probar una segunda suposición en cuál es la respuesta correcta. Para nuestra ilustración, tengamos $ 3,000 ser nuestro nex.T Adivina como el valor correcto para X. Aquí es lo que obtenemos esta vez:

Como podemos ver que nuestros resultados han mejorado, ¡lo cual es bueno! Sin embargo, todavía tenemos que adivinar nuevamente porque no estamos lo suficientemente cerca de los valores correctos. Por lo tanto, hagamos una conjetura de $ 6000 esta vez:

Curiosamente, ahora vemos que nuestro margen de error ha aumentado ligeramente, ¡pero ahora estamos demasiado altos! Tal vez necesitemos ajustar un poco nuestras ecuaciones hacia abajo. Probemos $ 4500:


¡Ahora vemos que estamos bastante cerca! Podemos seguir intentando valores adicionales para ver cuánto más podemos mejorar los resultados. Esto lleva a jugar otro valor clave en el aprendizaje de la máquina, que es lo preciso que queremos que tenga nuestro algoritmo y cuándo dejamos de armar. Pero a los efectos de nuestro ejemplo aquí somos cPierde lo suficiente y espero que tenga una idea de cómo funciona todo esto.

Nuestro ejemplo de ejercicio de aprendizaje de la máquina tenía un algoritmo extremadamente simple para construir, ya que solo necesitábamos derivar una ecuación en esta forma: salario = años de servicio * X + $ 45,000 (aka y = mx + b). Sin embargo, si intentábamos calcular un verdadero algoritmo salarial que lleva a todos los factores que afectan los salarios de los usuarios que necesitamos:

Un conjunto de datos mucho más grande que se usan como nuestros datos de capacitación


Para construir un algoritmo mucho más complejo puede ver cómo los modelos de aprendizaje de la máquina pueden volverse altamente complejos. ¡Imagina las complejidades cuando estamos lidiando con algo en la escala del procesamiento de lenguaje natural! Otros tipos de algoritmos básicos de aprendizaje de la máquina La máquinaEjemplo de aprendizaje compartido anteriormente es un ejemplo de lo que llamamos “aprendizaje de la máquina supervisado”. Lo llamamos supervisado porque proporcionamos un conjunto de datos de capacitación que contenía valores de salida de destino y el algoritmo pudo usarlo para producir una ecuación que generaría los resultados de salida (o cerca de los mismos). También hay una clase de algoritmos de aprendizaje de máquinas que realizan “aprendizaje automático no supervisado”. Con esta clase de algoritmos, todavía proporcionamos un conjunto de datos de entrada, pero no proporcionan ejemplos de los datos de salida. Los algoritmos de aprendizaje de la máquina deben revisar los datos y encontrar un significado dentro de los datos por su cuenta. Esto puede sonar con franqueza como inteligencia humana, pero no, todavía no estamos allí. Ilustre con dos ejemplos de este tipo de aprendizaje de la máquina en elmundo. Un ejemplo de aprendizaje de la máquina sin supervisión es la noticia de Google. Google tiene los sistemas para descubrir los artículos que obtienen la mayor cantidad de tráfico de nuevas consultas de búsqueda que parecen ser impulsadas por nuevos eventos. Pero, ¿cómo sabe que todos los artículos están en el mismo tema? Si bien puede hacer relevancia tradicional que coincida con la forma en que lo hacen en la búsqueda regular en las noticias de Google, esto se realiza mediante algoritmos que les ayudan a determinar la similitud entre las piezas de contenido. como se muestra en La imagen de ejemplo anterior, Google ha agrupado con éxito numerosos artículos sobre la aprobación de la factura de infraestructura el 10 de agosto de 2021. Como se puede esperar, cada artículo que se centra en la descripción del evento y la factura en sí probablemente tenga similitudes sustanciales en el contenido. Reconociendo elSE Similitud e identificación de artículos también es un ejemplo de aprendizaje insuperable en la acción. Otra clase interesante de aprendizaje de la máquina es lo que llamamos “Sistemas de recomendación”. Vemos esto en el mundo real en sitios de comercio electrónico como Amazon, o en sitios de cine como Netflix. En Amazon, podemos ver “con frecuencia comprados juntos” debajo de un listado en una página de producto. En otros sitios, esto podría ser etiquetado como “Las personas que compraron esto también compraron esto”. Sitios de películas como Netflix Use sistemas similares para hacerle las recomendaciones de la película. Estos pueden basarse en preferencias específicas, películas que ha clasificado o su historial de selección de películas. Un enfoque popular para esto es comparar las películas que ha visto y calificado mucho con las películas que han sido vigiladas ycalificado por otros usuarios. Por ejemplo, si ha clasificado 4 películas de acción muy altamente, y un usuario diferente (que llamaremos a John) también tasa las películas de acción altamente, el sistema podría recomendarle Otras películas que Juan ha visto pero que no lo has hecho. Este enfoque general es lo que se llama “filtrado de colaboración” y es uno de los varios enfoques para construir un sistema de recomendación. Nota: Gracias a Chris Penn para revisar este artículo y proporcionar orientación. Las opiniones expresadas en este artículo son las del autor invitado y no necesariamente la tierra de los motores de búsqueda. Los autores del personal se enumeran aquí .

Leave a Reply

Your email address will not be published. Required fields are marked *