Categories
Noticias

Búsqueda de audio de Google – ¿Será posible alguna vez?

será posible

¿Google para crear un índice de contenido de audio que los usuarios pueden buscar a través de páginas web similares?

Los resultados de las pruebas tempranas, que Google publicó en un artículo de blog, indica que la búsqueda de audio es más difícil de lograr de lo que puede sonar.

Los detalles de estas pruebas se comparten en un artículo escrito por TIM OLSON, SVP de asociaciones estratégicas digitales en KQED.

Google se está asociando con KQED en un esfuerzo conjunto para hacer que el audio sea más maravilloso.

Con la ayuda de Kungfu.ai, un proveedor de servicios AI, Google y KQED realizan pruebas para determinar cómo transcribir audio de una manera que es rápida y sin errores.

AnunciCementContinueLeyendo a continuación

Esto es lo que descubrieron.

Las dificultades de la búsqueda de audio

El mayor obstáculo para hacer que la búsqueda de audio sea la posibilidad de que el audio debe convertirse en texto antes de que pueda ser Búsqueda y ordenada.

Actualmente no hay forma de transcribir con precisión el audio de una manera que le permita que se encuentre rápidamente.

La única forma de búsqueda de audio en una escala mundial será a través de Transcripciones automatizadas. Las transcripciones manuales tomarían un tiempo y esfuerzo considerables de los editores.

OLSON de KQED Notas sobre cómo la barra de precisión debe ser alta para las transcripciones de audio, especialmente cuando se trata de indexar las noticias de audio. Los avances hechos hasta el momento en el habla a texto no cumplen actualmente esas normas.

AnuncioLectura de Ontinue a continuación

Limitaciones de la tecnología actual de voz a texto

Google realizó pruebas con KQED y Kungfu.ai mediante la aplicación de las últimas herramientas de discurso a texto a una colección de noticias de audio.

Las limitaciones se descubrieron en la capacidad de la AI para identificar los sustantivos adecuados (también conocidos como entidades nombradas).

Las entidades nombradas a veces necesitan que se entiende un contexto para ser identificado con precisión, lo que la IA no siempre tiene.

Olson da un ejemplo de las noticias de audio de KQED que contiene el habla llena de entidades nombradas que son contextuales a la región del Área de la Bahía:

“El audio de noticias local de KQED es rico en referencias de nombre Entidades relacionadas con temas, personas, lugares y organizaciones que son contextuales a la región del Área de la Bahía. Los oradores usan siglas como “CHP” FOR California Highway Patrol y “The Peninsula” para la zona que abarca San Francisco a San José. Estos son más difíciles de identificar la inteligencia artificial “.

Cuando no se entienden las entidades nombradas, la AI hace que su mejor conjetura de lo que se dijo. Sin embargo, esa es una solución inaceptable para la búsqueda en la web, porque una transcripción incorrecta puede cambiar todo el significado de lo que se dijo.

¿Qué es lo siguiente?

El trabajo continuará en la búsqueda de audio con los planes para hacer el La tecnología ampliamente accesible cuando se desarrolla.

DAVID STILTER, Partner Direct para noticias y publicaciones en Google, dice que la tecnología se compartirá abiertamente cuando se complete el trabajo en este proyecto.

“Uno de los pilares de la nueva iniciativa de Google está incubando nuevos enfoques para difícilproblemas. Una vez completado, esta tecnología y las mejores prácticas asociadas se compartirán abiertamente, ampliando considerablemente el impacto anticipado “.

Los modelos de aprendizaje de la máquina de hoy no están aprendiendo de sus errores, dice Olson de Kqed, que es donde está donde Es posible que los humanos deban intervenir. Publicidad Lectura a continuación El siguiente paso es probar un bucle de retroalimentación donde las salas de prensa ayudan a mejorar los modelos de aprendizaje de la máquina al identificar errores de transcripción comunes.

” Estamos seguros de que en un futuro próximo, las mejoras en estos modelos de habla a texto ayudarán a convertir el audio al texto más rápido, lo que, en última instancia, ayudando a las personas a encontrar noticias de audio de manera más efectiva “. Fuente: Google

Leave a Reply

Your email address will not be published. Required fields are marked *