Ir al contenido

Deep Dream

De Wikipedia, la enciclopedia libre
Izquierda: Foto original de Zachi Evenor. Derecha: procesado por Günther Noack

Deep Dream es un algoritmo de procesamiento de imágenes creado por Google,[1]​ que se basa en la enseñanza a sus computadoras en cuanto a la forma de ver, entender y apreciar nuestro mundo.[2]​ Además, el algoritmo está formado por una red neuronal artificial, que fue entrenada mostrandole millones de imágenes como ejemplo, para así ajustar poco a poco los parámetros de la red neuronal hasta obtener la identificación de la imagen y clasificarla de la manera adecuada.[3]

En este programa de Inteligencia Artificial se originan ideas oníricas de Google, clasificando imágenes con solo "mirarlas",[4]​ para así reproducirlas o mejorarlas sobre la base de patrones formados durante el aprendizaje/entrenamiento. Muchas de las imágenes editadas muestran ojos de animales y sus caras, ya que es lo que el software ha sido entrenado para ver y reconocer.[5]

Software

[editar]

El software Deep Dream fue desarrollado para el imageNet large scale visual recognition challenge (ILSVRC). Este era un desafío reto, propuesto a diferentes equipos de investigación, que consistió en crear un sistema de reconocimiento de objetos y su localización dentro de una misma imagen, aparte de su detección inmediata. En este Desafío se adjudicó a Google el primer premio en el año 2014, logrado gracias al uso del entrenamiento de redes neuronales.[6][7]

En junio de 2015 Google publicó la investigación, y tras esto hizo su código fuente abierto utilizado para generar las imágenes en un IPython notebook. Con esto se permitió que las imágenes de la red neuronal pudiesen ser creadas por cualquiera.

El código se basa en Caffe y utiliza paquetes de códigos abiertos disponibles. Además, está diseñado para tener el menor número de dependencias posible.[8]

Red Neuronal Artificial

¿Cómo funciona?

[editar]

Las redes neuronales comprenden un sistema de procesamiento de información que simula el funcionamiento del sistema nervioso, mediante el uso de neuronas artificiales que aprenden y procesan información, modelando un problema matemáticamente por medio de algoritmos, para entregar una solución. Se les da el nombre de redes neuronales porque imitan de forma sencilla el sistema que tienen las neuronas de nuestro cerebro de procesar información.

Estas redes neuronales tienen distintas características:
  • Son capaces de adquirir información y utilizarla para mejorar su modo de funcionamiento.
  • Imitan la forma en que el cerebro reorganiza la información cerebral.
  • se auto-organizan.
  • son dinámicas, tolerando y ajustando los errores por sí solas.[9][10]

En el caso de Deep Dream, la red fue entrenada simplemente mostrando muchos ejemplos de lo que se quería que aprendiera, de manera que extrajera lo esencial de cada objeto. Así se construyó una red capaz de tomar decisiones y analizar por sí misma una imagen. En su utilización se escoge una capa para que la red mejore lo que ha sido detectado. Cada capa de la red incorpora características a un nivel diferente de abstracción, por lo que, la complejidad de las funciones generadas depende de qué capa se escoja para mejorar una imagen.

Clasificación de capas neuronales:
  • Primeras capas: Son sensibles a funciones básicas, como bordes y sus orientaciones.
  • Capas intermedias: Interpretan características básicas; buscan formas o componentes generales, como una puerta o una hoja.
  • Capas finales: Las neuronas se activan en respuesta a cosas muy complejas, como edificios o árboles, identificando características más sofisticadas.[4]
Izquierda: Imagen real cielo y nubes; Derecha: Imagen procesada por DeepDream
Sobre-interpretación de animales en el cielo, DeepDream Generator

Resultados

[editar]

Esta técnica da un sentido cualitativo del nivel de abstracción que una capa en particular ha conseguido en su comprensión de imágenes. Llamando a esta técnica "inceptionism" en referencia a la arquitectura de red neuronal utilizada.[4][11][12]

En algunos casos la red neuronal no representa precisamente lo que se le pide. Como ejemplo, la red diseña un pensamiento que parecen ser pesas de gimnasia, pero no hay una imagen de la mancuerna completa, sin un levantador de pesas ahí. En este caso la red neuronal no pudo rescatar la esencia de una pesa, tal vez porque en el aprendizaje nunca se le mostró una mancuerna sin un brazo que la sostenga.

Se le pide a la red: "lo que ves ahí, quiero más de eso". Entonces, si una nube se ve como un pájaro, la red hará que se vea más como un pájaro; esto a su vez hace que la red reconozca al ave con más fuerza, hasta que aparezca un pájaro muy detallado. Obteniendo así, un resultado de sobre-interpretación, tal como cuando los niños disfrutan viendo las nubes e interpretando sus formas.[4]

Enigmas en estudio

[editar]

¿Por qué el sueño de una inteligencia artificial refleja escenas similares a alucinaciones humanas?

Citas de Lucas Sjulson (Profesor asistente de investigación en el Instituto de Neurociencia Langone de la Universidad de Nueva York):

  • "una cosa importante a recordar es que toda percepción sensorial en los seres humanos son alucinaciones limitadas por la información sensorial."
  • "La gente piensa que el globo ocular es una cámara, pero no es una cámara." Los ojos permiten ver, pero el cerebro, en última instancia da sentido a lo que se ve.
  • Cuando la gente toma drogas como LSD, que provocan una parte de la corteza cerebral que "conduce a la generabilidad de estos tipos de patrones". Esto es probablemente una especie de fenómeno similar."
  • "El cerebro evolucionó durante largos períodos de tiempo para resolver problemas, y lo hace de una manera muy optimizada. Las cosas se aprenden con el desarrollo humano a través de la evolución y luego también a través de la experiencia visual."[13]

Referencias

[editar]
  1. Chayka, Kyle (10 de julio de 2015). «Why Google's Deep Dream Is Future Kitsch.» (en inglés). Pacific Standard. Consultado el 13 de diciembre de 2015. 
  2. «Deep Dream Generator (en inglés). Consultado el 13 de diciembre de 2015. 
  3. McCormick, Rich (7 de julio de 2015). «Fear and Loathing in Las Vegas is terrifying through the eyes of a computer» (en inglés). The Verge. Consultado el 13 de diciembre de 2015. 
  4. a b c d Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (17 de junio de 2015). Google Research Blog, ed. «Inceptionism: Going Deeper into Neural Networks». Consultado el 13 de diciembre de 2015. 
  5. Titcomb, James (2 de julio de 2015). «Google unleashes machine dreaming software on the public, nightmarish images flood the internet» (en inglés). The Telegraph. Consultado el 13 de diciembre de 2015. 
  6. González, Juan Carlos (8 de septiembre de 2014). «Google afina la detección de imágenes: sabe qué hay, qué es y dónde está». xataka. Consultado el 13 de diciembre de 2015. 
  7. Szegedy, Christian (5 de septiembre de 2014). Google Research Blog, ed. «Building a deeper understanding of images» (en inglés). Consultado el 13 de diciembre de 2015. 
  8. Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (1 de julio de 2015). Google Research Blog, ed. «DeepDream - a code example for visualizing Neural Networks» (en inglés). Consultado el 13 de diciembre de 2015. 
  9. Campillo, Santiago (1 de julio de 2015). «Así sueñan las redes neuronales artificiales de Google». Hipertextual. 
  10. Pino, Raúl; Gómez, Alberto; de Abajo, Nicolás (2001). «Capítulo 6». Introducción a la Inteligencia Artificial. España, Oviedo: Editorial Servicios de Publicaciones Universidad de Oviedo. pp. 37-40. 
  11. Szondy, David (28 de junio de 2015). «Google's neural networks create bizarre "Inceptionism" art». gizmag. Consultado el 13 de diciembre de 2015. 
  12. Szegedy, Christian; Liu, Wei; Jia, Yangqing; Sermanet, Pierre (2014). Going deeper with convolutions. 
  13. Lafrance, Adrienne (3 de septiembre de 2015). «When Robots Hallucinate». The Atlantic. Consultado el 13 de diciembre de 2015. 

Enlaces externos

[editar]