Deep Learning, Deep Dreams: el sueño de una inteligencia artificial

¿Qué es un Brand Voice ?

El Deep Learning está revolucionando los sistemas de aprendizaje automático pero, ¿cuál es el origen de esta tecnología y dónde están sus limitaciones a día de hoy?

Las técnicas de Deep Learning están basadas en redes neuronales artificiales, resultado de investigaciones con más de 30 años de historia. Recientemente han experimentado un auge espectacular debido, fundamentalmente, a avances en la capacidad de cómputo y al uso de GPUs para computación científica.

En 2012, el trabajo de un grupo de investigación de la Universidad de Toronto marcó un punto de inflexión en el campo de la visión artificial. Este grupo estaba liderado por Geoffrey Hinton, uno de los mayores especialistas en redes neuronales artificiales y Deep Learning desde la década de los 80. Sus resultados pulverizaron todos los registros en la principal competición de reconocimiento de imágenes, la ILSVRC (ImageNet Large Scale Visual Recognition Challenge).

Desde entonces, este tipo de técnicas han sido utilizadas de forma exitosa en otras muchas áreas de la inteligencia artificial, como procesamiento de lenguaje natural o reconocimiento del habla. Por este motivo, grandes empresas como Google, Facebook, Baidu o IBM, están apostando con fuerza por estas tecnologías. Contratando a los mejores investigadores y adquiriendo compañías especializadas como DeepMind o AlchemyAPI.

En los últimos meses el Deep Learning también ha atraído la atención de los medios por sus curiosas aplicaciones en ámbitos de tipo más lúdico o artístico.

Por un lado, investigadores de DeepMind han demostrado que estas técnicas pueden ser aplicables a tareas como el control de videojuegos. Aprendiendo a base de ensayo-error, y superando en algunos casos el nivel de humanos expertos.

Otra aplicación llamativa ha sido desarrollada en la Universidad de Tubingen y permite generar versiones de una imagen imitando el estilo de diferentes artistas y estilos pictóricos.

Igualmente interesante es el proyecto Deep Dream de Google Research, que ha generado alucinaciones aparentemente surrealistas partiendo de imágenes reales.

Las malas noticias

Leyendo los logros anteriores, parece que las máquinas ya están cerca de equipararse a los humanos en capacidades que hasta ahora no eran más que ciencia-ficción. ¿En qué punto nos encontramos realmente? ¿Sueñan ya los androides con ovejas eléctricas?

En 2014 Google anunció que uno de sus algoritmos de clasificación de imágenes superaba en precisión al ser humano. Poco tiempo después, un estudiante de doctorado de la universidad de Stanford, llamado Andrej Karpathy, realizó manualmente los mismos tests. Mejorando los resultados obtenidos por el algoritmo de Google, demostró que, en realidad, Google había sobreestimado las capacidades de sus algoritmos en relación a las capacidades humanas.

Además, el concepto de visión artificial no debe quedarse en la mera detección de objetos o clasificación de imágenes. Para una máquina todavía resulta tremendamente difícil ir más allá y llegar a entender acciones, intenciones o emociones, como hacemos las personas.

A día de hoy podría parecer que la forma en la que humanos y máquinas aprendemos es muy parecida. El uso de terminologías inspiradas en el funcionamiento del cerebro, como “redes neuronales”, podría llevarnos a engaño. En realidad, la algoritmia que hay detrás de las redes neuronales artificiales de última generación solo se asemeja a la fisiología de nuestro cerebro desde un punto de vista muy simplista. Muchas de las imágenes que actualmente confunden a un sistema de Deep Learning no le provocarían a una persona el mismo tipo de dificultades.

Pasado, presente y futuro

Fei-Fei Li, impulsora de la iniciativa ImageNet, opina que las máquinas se están acercando al nivel de visión del mundo que tiene un niño de 3 años. Li comenzó a investigar en el área de la inteligencia artificial hace más de 15 años bajo la tutela de Christof Koch, una autoridad en el ámbito de la neurociencia.

Koch contribuyó a sentar las bases de la teoría neurobiológica de la consciencia en 1990. 25 años después, Li está al frente del Stanford Artificial Intelligence Lab y el Stanford Vision Lab, dirigiendo en sus investigaciones, entre otros, al joven Andrej Karpathy.

Décadas de investigaciones nos han conducido a donde estamos hoy. Ayudando a entender mejor el proceso cognitivo. O desarrollando algoritmos de aprendizaje automático, como las técnicas de Deep Learning, que están consiguiendo resultados espectaculares.

El futuro parece prometedor. Cada día nos beneficiamos de nuevas aplicaciones inteligentes que hacen nuestra vida más fácil. Sin embargo, la inteligencia artificial se enfrenta a un desafío muy ambicioso: máquinas que realmente comprendan el mundo y puedan llegar a razonar como nosotros. Ese objetivo aún parece lejano.