La inteligencia artificial cada día está más cerca de ser verdaderamente inteligente. Una división de Google conocida como DeepMind ha establecido una colaboración con la Universidad de Oxford con el objetivo de desarrollar una aplicación que pueda tener la capacidad más avanzada del mundo para leer labios, incluso mejor que un humano.
Para arrancar el proyecto, los responsables de la investigación nutrieron la mente artificial con miles de horas de video con contenido de la BBC, dando por resultado una red neuronal entrenada para reconocer gestos y palabras basados en el movimiento bucal, consiguiendo una efectividad del 46,8 por ciento.
Al momento de hacer las pruebas de humano vs. máquina se determinó que un experto en lectura de labios puede ser un cuarto de eficiente que los resultados conseguidos por la inteligencia artificial, para obtener estas mediciones se le encargó subtitular un video que apenas logró una precisión de palabras del 12,4 por ciento.
De acuerdo con el sitio The Next Web, esta investigación tiene su origen en un trabajo ya publicado por la Universidad de Oxford, en el que se emplearon técnicas similares para crear la aplicación LipNet, que hace lectura de labios y tiene capacidad para leer grabaciones de video con oraciones simples con un 90 por ciento de efectividad.
En el caso de la aplicación desarrollada por DeepMind de Google junto a la Universidad de Oxford, recibe el nombre de “Watch, Listen, Attend, and Spell” y fue entrenado para reconocer palabras en imágenes mucho más difíciles.
Para su entrenamiento, la red neuronal de DeepMind estuvo observando 5.000 horas de contenido de programas de TV populares, en los que se acumularon más de 110.000 oraciones distintas y 17.500 palabras únicas.
El objetivo de este proyecto de DeepMind de Google es reconocer frases que son dichas por una boca y un rostro que son reconocibles aún sin el sonido correspondiente, en el caso de esta aplicación se trata la tarea del reconocimiento de palabras como un tema de mundo abierto y no con un número determinado de palabras y frases, con este programa quieren conseguir que la mente artificial vaya nutriendo su catálogo de palabras y oraciones en la medida en que va reconociendo el lenguaje humano.
Seguiremos Informando…