Autor: Javier Insa Cabrera Director: José Hernández Orallo 26 de septiembre de 2011.

download Autor: Javier Insa Cabrera Director: José Hernández Orallo 26 de septiembre de 2011.

of 26

  • date post

    07-Feb-2015
  • Category

    Documents

  • view

    0
  • download

    0

Embed Size (px)

Transcript of Autor: Javier Insa Cabrera Director: José Hernández Orallo 26 de septiembre de 2011.

  • Diapositiva 1
  • Autor: Javier Insa Cabrera Director: Jos Hernndez Orallo 26 de septiembre de 2011
  • Diapositiva 2
  • Introduccin Sistema de evaluacin Requisitos Aprendizaje por refuerzo Complejidad de los entornos Factible Clase de entornos Evaluacin de un algoritmo de IA Evaluacin y comparacin de distintos sistemas inteligentes Conclusiones y trabajo futuro 2/26
  • Diapositiva 3
  • CAPTCHA Discrimina entre humanos y mquinas. Cada vez discrimina menos. Tests psicomtricos (por ejemplo, tests IQ) Son antropomrficos. Problemas obtenidos de manera subjetiva y validados de manera emprica. Evaluacin de IA Problemas especficos. No se sabe muy bien lo que se est midiendo. Psicologa comparada Compara distintas especies. Inteligencia general: Aptitud para dar respuesta a problemas de diferente ndole. 3/26 Precedentes en evaluacin de inteligencia Actualmente no existe ningn mtodo apropiado para evaluar la inteligencia general en mquinas.
  • Diapositiva 4
  • Introduccin Sistema de evaluacin Requisitos Aprendizaje por refuerzo Complejidad de los entornos Factible Clase de entornos Evaluacin de un algoritmo de IA Evaluacin y comparacin de distintos sistemas inteligentes Conclusiones y trabajo futuro 4/26
  • Diapositiva 5
  • Requisitos deseables de un sistema de evaluacin universal de inteligencia general: 1.Debe evaluar y discriminar cualquier tipo de sistema inteligente conocido o aun por construir/descubrir. 2.Debe medir cualquier nivel de inteligencia y cualquier escala de tiempo. 3.Lo que se est midiendo ha de representar la nocin ms general de inteligencia. 4.Debe derivarse de nociones computacionales bien fundadas. 5.La precisin depender sobretodo de la cantidad de tiempo que se evale. 6.Debe ser factible. Cmo trata de conseguir todo esto? 5/26
  • Diapositiva 6
  • Agente Entorno Observacin Accin Recompensa Interaccin Cmo les decimos a los sujetos que vamos a evaluar su inteligencia? Condicionamiento por recompensas. Debe evaluar cualquier tipo de sistema inteligente conocido o aun por construir/descubrir 6/26
  • Diapositiva 7
  • Debe medir cualquier nivel de inteligencia Los entornos deben poder ser de distintas complejidades. Cmo medimos la complejidad? Complejidad para describir el entorno. Complejidad Kolmogorov. 7/26
  • Diapositiva 8
  • Distribucin universal. Discriminativo. Sensible a las recompensas. Interacciones computables e instantneas desde el punto de vista del agente. Cmo seleccionar los entornos? Debe discriminar cualquier tipo de sistema inteligente Lo que se est midiendo ha de representar la nocin ms general de inteligencia Cmo medimos la inteligencia? 8/26
  • Diapositiva 9
  • +1 1 2 3 Espacio: 9/26
  • Diapositiva 10
  • GE +1 +1 +1 Recompensas: Good y Evil no pueden estar simultneamente en la misma celda. Se elige aleatoriamente cual se mueve. Good y Evil siguen un patrn de comportamiento. 10/26
  • Diapositiva 11
  • G E Recompensas 1 Iteracin: 2 Iteracin: 3 Iteracin: 4 Iteracin: Recompensa media: +1+0.5+0.25 +1 0 Sesin de evaluacin: +0.67 11/26
  • Diapositiva 12
  • Introduccin Sistema de evaluacin Requisitos Aprendizaje por refuerzo Complejidad de los entornos Factible Clase de entornos Evaluacin de un algoritmo de IA Evaluacin y comparacin de distintos sistemas inteligentes Conclusiones y trabajo futuro 12/26
  • Diapositiva 13
  • Probar si un algoritmo de IA obtiene resultados coherentes en esta clase de entornos. Agentes evaluados Q-learning Aleatorio Seguidor trivial Orculo 13/26
  • Diapositiva 14
  • 3 Celdas 6 Celdas 9 Celdas Entornos donde hemos evaluado: Distintas complejidades. Promedio de 100 entornos con 10.000 iteraciones. Patrn de Good y Evil con 100 movimientos en promedio. 14/26
  • Diapositiva 15
  • 9 CeldasTodos los entornos Complejidad de los entornos: 15/26
  • Diapositiva 16
  • Introduccin Sistema de evaluacin Requisitos Aprendizaje por refuerzo Complejidad de los entornos Factible Clase de entornos Evaluacin de un algoritmo de IA Evaluacin y comparacin de distintos sistemas inteligentes Conclusiones y trabajo futuro 16/26
  • Diapositiva 17
  • Probar si el sistema de evaluacin discrimina correctamente a dos tipos distintos de sistemas inteligentes en funcin de su inteligencia real. Agentes evaluados Agente biolgico: Seres humanos Tcnica de IA: Q-learning 17/26
  • Diapositiva 18
  • Experimento: 20 tests. Configuracin de cada test. Hay que evaluar a los humanos en un periodo de tiempo razonable. Aproximadamente alrededor de 20 - 25 minutos. 18/26
  • Diapositiva 19
  • Interfaz: b:E:Ga:: Algoritmos de IAHumanos 19/26
  • Diapositiva 20
  • Resultados: 20/26
  • Diapositiva 21
  • Resultados: 21/26
  • Diapositiva 22
  • Introduccin Sistema de evaluacin Requisitos Aprendizaje por refuerzo Complejidad de los entornos Factible Clase de entornos Evaluacin de un algoritmo de IA Evaluacin y comparacin de distintos sistemas inteligentes Conclusiones y trabajo futuro 22/26
  • Diapositiva 23
  • Conclusiones Es la primera vez que se evalan diferentes sistemas de IA con un test general no dedicado a ninguna tarea concreta. Es la primera vez que se usa el mismo test general para evaluar humanos y mquinas. El sistema de evaluacin ofrece resultados coherentes al evaluar un algoritmo de IA. El sistema de evaluacin no discrimina correctamente dos sistemas inteligentes. Conocimiento adquirido Este sistema de evaluacin no evala la inteligencia general, aunque es posible que s parte de ella. Es muy difcil proporcionar un entorno complejo. 23/26
  • Diapositiva 24
  • Trabajo futuro Introducir comportamiento social en los entornos. Construir el test autoajustando la complejidad de los entornos en funcin de la inteligencia del sujeto y adaptarse mejor con una distribucin adaptativa. Volver a evaluar distintos tipos de sistemas inteligentes y comprobar si con los cambios realizados se obtienen resultados ms coherentes. 24/26
  • Diapositiva 25
  • Evaluating a reinforcement learning algorithm with a general intelligence test. CAEPIA, volume 7023. LNAI series, Springer, 2011. (to appear) J. Insa-Cabrera and D.L. Dowe and J. Hernndez-Orallo Comparing humans and AI agents. Artificial General Intelligence, volume 6830 of Lecture Notes in Computer Science, pages 122-132. Springer Berlin / Heidelberg, 2011. J. Insa-Cabrera and D. Dowe and S. Espaa-Cubillo and M.V. Hernndez-Lloreda and J. Hernndez-Orallo. On more realistic environment distributions for defining, evaluating and developing intelligence. Artificial General Intelligence, volume 6830 of Lecture Notes in Computer Science, pages 82-91. Springer Berlin / Heidelberg, 2011. J. Hernndez-Orallo and D.L. Dowe and S. Espaa-Cubillo and M.V. Hernndez-Lloreda and J. Insa-Cabrera 25/26
  • Diapositiva 26
  • http://users.dsic.upv.es/proy/anynt/human1/test.html Gracias por su atencin