“Dos madrileños pusimos el catalán en Google Voice”

Pedro Moreno es el ingeniero responsable del área de investigación de reconocimiento de voz de Google. Dirige un grupo de tecnología del habla que permite que el motor de búsqueda de Google reconozca ya 42 idiomas, aunque el objetivo es llegar a cubrir las 300 lenguas del mundo que tienen más de un millón de habitantes. Este verano, se han incorporado el catalán, el gallego y el euskera.

¿Qué idioma presenta mayores dificultades?

El chino mandarín. Es un idioma que tiene el problema añadido de que el tono con el que se pronuncian las palabras también indica mensaje. Aunque después de todo, fue un buen idioma para empezar porque nos permitió aprender cómo hacerlo. Tardamos un año en construirlo. Con el japonés, que también es complicado, tardamos seis meses. Luego ya llegaron los principales europeos: francés, italiano, alemán y español.

¿Siempre se tarda tanto?

Ahora todo el proceso lo tenemos muy automatizado. Tardamos unas tres semanas. Lo primero es la recogida de datos. Construimos una aplicación para Android que presenta una serie de frases y los usuarios tienen que leerlas. Luego se graban y se envían a nuestra base de datos.

¿Quién graba los idiomas?

Los reclutamos de muchas formas. Con fiestas, charlas en universidades técnicas y redes sociales. Por lo general se hacen regalos, como entradas para el cine.

¿Cómo se introduce un idioma en Google?

La principal dificultad es la parte social. Grabamos unas 200 horas de audio en una semana. Luego organizamos las war rooms (salas de guerra). Estamos varios ingenieros en una sala trabajando durante una semana. El reconocimiento de voz lleva tres partes: módulo léxico, lingüística, acústica. Luego le aplicamos técnicas de inteligencia artificial.

¿Cómo fue con el catalán?

En el caso del catalán tuvimos la suerte de que había un proyecto de transliteración en Google Maps, para traducir los nombres de los lugares, que lo había hecho un ingeniero catalán.

¿Presentó el catalán alguna peculiaridad especial?

El catalán no es de los idiomas difíciles, pero el vasco tiene una pronunciación de vocales prácticamente igual al castellano. El catalán es distinto, con reglas de pronunciación más complejas.

¿Quiénes pusieron en marcha la búsqueda en catalán?

Un colega de Madrid y yo, también de Madrid. Las dos primeras frases que utilizamos fueron topicazos: “Barcelona és bona si la bossa sona” y “Salut i força al canut”. Funcionó bien a la primera. Se grabó una mitad de los usuarios en Valencia y la otra mitad en Barcelona. Lo curioso es que lo hizo un equipo de Egipto que sólo habla inglés y árabe.

¿Está funcionando bien?

El sistema no es perfecto. Cuanto más usuarios tiene, más lo perfeccionamos. Está pensado para la búsqueda, así que en dictado es más débil, pero lo iremos mejorando. Cada seis meses perfeccionamos cada idioma.

¿Cómo se aprende sobre lo que hay que corregir?

Si el usuario acepta uno de los resultados que le ofrece la búsqueda, eso es una buena señal de que funcionó. Si no acepta ninguna opción y vuelve a hacer la búsqueda, esto es una sugerencia indirecta de que falló.

¿Qué volumen de voz analiza a diario Google Voice?

Cada día procesamos el equivalente a 15 años de audio.

¿Cuál es el futuro?

Ahora estamos en un proceso de combinar el reconocimiento de voz con sistemas basados en redes neuronales.

¿Dialogaremos con la máquina igual que con las personas?

Creo que es inevitable, pero no sé decir cuando.

CATÁLOGOS DIGITALES , M-COMMERCE Y MUCHO MÁS EN TU TABLET
Sr. Empresario,
Mantenga su catálogo siempre actualizado.
Realice presentaciones multimedia e interactivas, y automatice el envío de la documentación asociada.
Con nuestra potente herramienta productiva para tablet que permitirá a su equipo de ventas disponer de un sistema interactivo de apoyo para la presentación multimedia de productos y servicios, así como para la gestión remota de pedidos, tareas y clientes. Ofrezca a sus clientes una experiencia dinámica y diferente al consultar e interactuar con sus productos y servicios
Contacte en el 937 356 902 ó 607 230 390 ó en info@laanet.com y [LaAnet.com]
Para que pueda ver todas las ventajas que le proponemos, le realizaremos una exposición personalizada en nuestra sala demo.
Tenemos la mejor solución para su Empresa

Si te ha gustado este artículo puedes completarlo dejando un comentario o bien puedes suscribirte al feed y recibir las entradas futuras en tu lector de feeds.

Comentarios

No hay comentarios todavía.

Deja tu comentario

(requerido)

(requerido)