Científicos crean avatar de cabeza parlante más realista hasta el momento


Investigadores del departamento de Ingeniería de la Universidad de Cambridge y el laboratorio de investigación de Toshiba crearon una cabeza virtual parlante con un amplio rango emocional identificable por los interlocutores humanos. El trabajo se inspiró en el computador “Holly” de la serie británica de ciencia ficción Red Dwarf.

A diferencia de la serie de ficción espacial, este avatar bautizado como “Zoe” no es capaz de pensar por sí mismo, pero sí puede recitar lo que el investigador escriba en un teclado. Basta escribir una frase, luego insertar una emoción y Zoe lo dirá utilizando las expresiones faciales que correspondan.

“En este momento podría ser usado para leer mensajes de una forma expresiva. También podría utilizarse como lector para audiolibros, por ejemplo. Estamos hablando con organizaciones para niños autistas y sordos, donde este tipo de tecnología potencialmente podría utilizarse para enseñarle a los niños a ‘leer emociones’ y leer los labios”, explicó el investigador Bjorn Stenger de Toshiba Research Europe a Wired.

El avatar se llama Zoe por la actriz británica Zoe Lister, quien dispuso su rostro y voz para ser utilizadas en el proyecto. Debió grabar 7.000 frases leídas de extractos de periódicos y del directorio telefónico. Luego se utilizaron algoritmos para obtener datos de voz y visuales, modelando la voz y la cara de modo de poder recrear una emoción y una frase.

Durante las grabaciones, Lister debió expresar seis emociones básicas: felicidad, tristeza, ternura, enojo, temor y neutral. Luego, estas podían ser combinadas para crear patrones y expresiones diferentes.

El sistema solo entiende texto, no voz, pero en el futuro se podría implementar instrucciones de este tipo. De esta forma, el asistente personal del smartphone (tipo Siri) podría tener cara y emociones en el futuro.

Todavía quedan varios detalles que ajustar para crear una imagen que se vea natural y no genere la sensación de “valle inquietante“. Por ahora, todavía no se ve natural y las expresiones no están totalmente bien sincronizadas, aunque va en camino.


0 comentarios: