Ir al contenido

En la Universidad Carnegie Mellon, el aprendizaje automático se torna social

En Carnegie Mellon, el equipo de Articulab quería entender cómo podían colaborar los asistentes robóticos con las personas para realizar tareas y establecer relaciones en lugar de simplemente reemplazar el trabajo de los asistentes humanos. Para estudiar las interacciones robóticas con los humanos y capacitar a sus agentes con sentido social, utilizaron Machine Learning Engine de Google Cloud.

Le damos a la inteligencia artificial algunas funciones sociales

La Reunión Anual de los Nuevos Campeones de 2016, que se realizó en Tianjin, China, incluyó, entre otras cosas, un notable debut: SARA, la asistente robótica con sentido social que puede interactuar con las personas de una forma completamente novedosa. En lugar de simplemente reemplazar la función de un asistente humano o de procesar y entregar información de manera impersonal, SARA fue diferente: intuitiva, amigable y simpática. Además, estaba diseñada para "colaborar" con usuarios humanos, reconocer sus expresiones faciales y responder a ellas, aprender las preferencias de los demás y mejorar el desempeño de las tareas en función de los usuarios con los que interactuaba. Asimismo, esta asistente virtual estaba programada para aprender ciertas señales sociales, como asentir con la cabeza mientras un usuario habla y comprender diferentes entonaciones.

Medio año más tarde, en enero de 2017, el proyecto se presentó en el Foro Económico Mundial en Davos, Suiza, y fue la única demostración que se exhibió en el Centro de Congresos de Davos. SARA actuó como una asistente personal virtual que les brindaba a los participantes información sobre las sesiones que se realizarían, les presentaba a otros participantes relevantes, recomendaba lugares para comer y mucho más.

En un principio, SARA cumplía la función de una asistente personal virtual con una aplicación específica que ofrecía ayuda durante la conferencia y, además, interactuaba con los invitados. Pudo aprender sobre los intereses y los objetivos de los líderes globales para, luego, recomendarles sesiones que les resultaran útiles y atractivas. Y lo que es aún mejor, SARA pudo usar sus conversaciones para formar relaciones con cada persona que habló con ella y, de esa forma, obtuvo más información sobre sus preferencias y objetivos. Luego, con estos datos, pudo ofrecer una ayuda aún más personalizada en las conversaciones posteriores, lo que mejoró el desempeño de las tareas.

SARA fue la creación de Articulab, un pequeño equipo de la Universidad Carnegie Mellon cuya misión consiste en el estudio de la interacción humana en contextos sociales y culturales como dato para los sistemas informáticos, los cuales, a su vez, nos ayudan a comprender mejor esta interacción. ¿Cómo se comunican las personas con la tecnología y cómo podría mejorarse esa comunicación con el tiempo? Al igual que para las personas, el establecimiento de lazos sociales es fundamental. Tal como lo señaló el equipo de Articulab en relación con SARA, "en vez de ignorar los lazos socioemocionales que forman la estructura de la sociedad, SARA depende de esos lazos para mejorar sus habilidades de colaboración".

"Google Cloud acelera la investigación académica de la IA".

Yoichi Matsuyama, becario posdoctoral del Instituto de Tecnologías del Lenguaje y líder del proyecto SARA

Usamos las herramientas de Google para crear SARA

El equipo de Articulab, dirigido por Justine Cassell, vicedecana de Impacto y Estrategia de Tecnología de la Facultad de Informática de la Universidad Carnegie Mellon, conocía Google Cloud antes de la creación de SARA gracias a las herramientas y el financiamiento que se le habían proporcionado para otros proyectos de investigación. "Dado que habíamos utilizado TensorFlow para varias tareas de aprendizaje automático, nos resultó natural comenzar a usar Google Cloud para los recientes proyectos de aprendizaje profundo", comenta Yoichi Matsuyama, becario posdoctoral del Instituto de Tecnologías del Lenguaje y líder del proyecto SARA. "También utilizamos varias API de Google, como la API de Google Speech (reconocimiento de voz) para nuestros agentes comunicacionales y Firebase para los marcos de trabajo de recolección colectiva de datos". El uso de Google Cloud sigue vigente mientras SARA se expande hacia nuevos dominios y aplicaciones. "Aún estamos en la fase de implementación", afirma. Más adelante, agrega: "Google Cloud acelera la investigación académica de la IA".

Matsuyama afirma que el laboratorio utiliza mucho Compute Engine, incluidas las instancias de GPU con 4 x Nvidia Tesla K80 y TensorFlow. Este año, el equipo ha trabajado en modelos como el Refuerzo sólido del razonamiento social basado en el aprendizaje en los contextos de tareas y la Generación de lenguajes naturales condicionados socialmente.

Al evaluar lo que podría describirse como SARA 1.0, la implementación que se llevó a cabo en el Foro Económico Mundial, Matsuyama afirma: "Logramos que más de 250 asistentes intentaran usar SARA durante una conferencia de cuatro días. Por lo tanto, en términos generales, ese aspecto fue exitoso. Sin embargo, aún intentamos analizar los hallazgos, los puntos positivos y los puntos negativos". Agrega: "Uno de los hallazgos más importantes que nos proporcionaron esos datos fue que lo que llamamos 'lazo', es decir, las relaciones interpersonales, y que en realidad está relacionado con el desempeño de las tareas y, en este caso, afectó la aceptación de las recomendaciones. Dado que SARA establecía bien la relación con los usuarios, cuando el lazo era sólido, era más probable que estos aceptaran los resultados de sus recomendaciones. Ese es nuestro hallazgo más importante hasta el momento, pero continuaremos analizando los datos".

Nos expandimos hacia nuevos dominios, incluida la educación

Al parecer, el trabajo de SARA acaba de comenzar. Hasta ahora, las otras aplicaciones de la "inteligencia artificial con sentido social" de Articulab han incluido el campo de la educación, como la asistencia a niños de escuelas públicas con bajos recursos y el fomento de la colaboración entre pares (que resultaron ser muy importantes para las metas de aprendizaje). También incluyeron la asistencia a niños autistas con alto rendimiento y niños con Asperger a fin de que pudieran practicar habilidades sociales interactivas que les permitieran mejorar las relaciones con sus compañeros.

Michael Madaio, estudiante doctoral del Instituto de Interacción entre Humanos y Computadoras y líder del proyecto "Tutor de pares con sentido de empatía" (RAPT), señala que, en los datos de tutoría entre pares humanos que recopilaron, "la empatía entre los alumnos que colaboraron está altamente relacionada con su participación en la tarea, la resolución de problemas y, en esencia, el aprendizaje". En otras palabras, el trabajo conjunto en un entorno social puede beneficiar a todos.

A medida que trabajan en la comprensión de los lazos en el aprendizaje y analizan cómo incorporar este componente en las aplicaciones educativas, Madaio afirma que quieren ofrecer herramientas que no solo ayuden a los alumnos a aprender. "Ya existen las plataformas de aprendizaje", explica, "pero las investigaciones educativas indican que los alumnos no son solo máquinas de procesamiento de información que computan números. Existen otros aspectos sociales. Es por eso que, para aprender, es importante forjar ese lazo con otros alumnos. También resulta valioso cuando un tutor virtual tiene que brindar sus comentarios. Si debe decirle a un niño que está equivocado, ¿cómo lo hace? Tal vez, al principio, se tiende a ser más amable y más indirecto a fin de amortiguar el golpe. Sin embargo, con el tiempo, se puede establecer una relación y, por lo tanto, se puede ser un poco más directo y brindar comentarios específicos que realmente ayuden al alumno".

Si un tutor virtual es exitoso, se pueden aumentar "las probabilidades de que los usuarios regresen", agrega, lo cual es importante, al igual que la participación de los alumnos. "No se trata solo de si los alumnos regresan en busca de ayuda, sino de la manera en que interactúan con el tutor virtual: ¿son más comunicativos?, ¿se sienten cómodos al compartir información sobre sus objetivos de aprendizaje y sus preocupaciones?". Es un lazo, al igual que cualquier otro, que debe desarrollarse a lo largo del tiempo. Sin embargo, lo extraordinario es que, tal como lo demostró SARA, ese lazo puede formarse.

Hasta el momento, en las aplicaciones educativas, la respuesta ha sido positiva. Sin embargo, según Madaio, "aún no realizamos la implementación en una escuela. Parte del desafío de diseño que realizamos este año consiste en comprender la naturaleza de las implementaciones a gran escala". Están intentando imaginar cómo podría ser esa futura implementación, como la creación de asistentes para los deberes o tutores de alfabetización para los alumnos que tienen dificultades para leer.

Si bien no hay planes para implementar un sistema de tutoría virtual en Carnegie Mellon, es probable que el equipo implemente un asistente personal que pueda informar a los alumnos sobre las próximas charlas que se realicen en el campus, ofrecerles recomendaciones de eventos y mucho más. Tal vez el objetivo más ambicioso de Articulab sea crear una versión de SARA que pueda funcionar no solo en una conferencia de cuatro días, sino que pueda hacerlo en varios dominios las 24 horas, todos los días. Eso, aunque supone un gran desafío, es una idea apasionante que abre un sinnúmero de posibilidades.

"No se trata solo de si los alumnos regresan en busca de ayuda, sino de la manera en que interactúan con el tutor virtual: ¿son más comunicativos?, ¿se sienten cómodos al compartir información sobre sus objetivos de aprendizaje y sus preocupaciones?"

Michael Madaio, estudiante doctoral, Instituto de Interacción entre Humanos y Computadoras

Regístrate aquí para recibir novedades, información importante, recursos y mucho más.