Recientemente,
DeepMind, la empresa de
inteligencia artificial de
Google, superó los registros alcanzados por personas en las pruebas de leer los labios. La máquina obtuvo un índice de acierto del 46,8% y, a pesar de que no pudo comprender más de la mitad de lo que visualizó, el mejor registro de una persona es de 12,4%; es decir, los resultados de DeepMind son hasta casi cuatro veces más precisos que los alcanzados por humanos.
Detrás de este resultado está Oriol Vinyals, un científico investigador que se encarga de que los dispositivos tecnológicos logren aprender del mismo modo que los humanos.
Vinyals llegó a Google luego de haber hecho una pasantía en la empresa y trabajó como investigador del buscador durante tres años hasta que en enero de este año ingresó al equipo de DeepMind.
Una vez dentro, se le pidió que elaborara nuevas técnicas de traducción. Fue allí que a Vinyals se le ocurrió la idea de si una computadora sería capaz de escribir con detalles la descripción de una imagen. El investigador le dijo a la revista MIT Technology Review que cambió "una única línea de código: en lugar de traducir desde el francés, lo cambié para introducir en su lugar una imagen".
Para su sorpresa, la computadora pudo describir la imagen a la perfección. Luego de las pruebas, la nueva forma de traducción se está incorporando a Google Image Search para que los procesadores escriban leyendas por sí mismos.