À la Carnegie Mellon University, le machine learning devient social

Le laboratoire Articulab de la Carnegie Mellon University s'est intéressé à la manière dont les robots assistants pourraient collaborer avec les humains pour effectuer des tâches à leur place et nouer des relations avec eux, au lieu de simplement remplacer des assistants de chair et d'os. Pour étudier les interactions des robots avec les humains et ajouter une dimension sociale à la formation de ses agents, l'équipe s'est appuyée sur le moteur de machine learning (apprentissage automatique) de Google Cloud Platform.

Doter l'intelligence artificielle de capacités sociales

Parmi les différents projets exposés, SARA a fait des débuts remarqués lors de l'édition 2016 de la conférence annuelle New Champions à Tianjin, en Chine. Ce robot assistant socialement attentif est capable d'interagir avec les humains de façon totalement inédite. SARA ne se contente pas de faire le travail d'un assistant humain, ou de traiter et donner froidement des informations. Ce robot-ci est différent. SARA est une assistante intuitive, conviviale et avenante qui a été conçue pour "collaborer" avec les humains. Elle s'adapte à son interlocuteur et réagit à ses expressions faciales, retient ses préférences et améliore ses performances. SARA a également été programmée pour interpréter plusieurs intonations de voix et mémoriser certaines conventions sociales (elle hoche de la tête quand on lui parle, par exemple).

Six mois plus tard, en janvier 2017, le projet était présenté au Forum économique mondial de Davos, en Suisse. Ce fut d'ailleurs le seul et unique produit en démonstration au Centre des congrès de Davos. Pendant l'événement, SARA a joué le rôle d'assistant personnel virtuel, renseignant les participants sur les sessions en cours, les présentant à des personnes ciblées, recommandant des services de restauration, et plus encore.

Au début de la conférence, SARA devait remplir une mission bien précise : proposer de l'aide aux invités et interagir avec eux. Au fil du temps, elle a été capable de mémoriser les centres d'intérêt et les objectifs des grands de ce monde, pour leur recommander ensuite des sessions susceptibles de les intéresser. Mieux encore, elle a su utiliser ses conversations pour établir une relation avec chaque personne qui lui avait parlé, et cerner précisément ses préférences et ses attentes. Au final, cela lui a permis d'être plus performante lors des conversations suivantes en proposant une aide encore plus personnalisée.

SARA est le fruit du travail de l'Articulab, une petite équipe de la Carnegie Mellon University qui étudie les interactions humaines dans la sphère sociale et culturelle, pour intégrer ensuite ces informations dans des systèmes de calcul qui nous aident justement à mieux comprendre les interactions humaines. Comment les humains communiquent-ils avec la technologie ? Comment faire en sorte que cette communication s'améliore avec le temps ? Les liens sociaux sont fondamentaux et doivent être entretenus. "SARA n'ignore pas les liens sociaux-émotionnels qui forment le tissu de la société. Au contraire, elle dépend de ces liens pour améliorer ses compétences collaboratives", explique l'équipe de l'Articulab à propos du robot assistant.

"GCP donne un coup d'accélérateur à la recherche universitaire sur l'intelligence artificielle."

Yoichi Matsuyama, chercheur post-doctorant au Language Technologies Institute et responsable du projet SARA

SARA, un robot créé à l'aide des outils Google

Dirigé par Justine Cassell, Associate Dean pour le département Technology Strategy and Impact à la School of Computer Science de la Carnegie Mellon University, l'Articulab connaissait déjà Google Cloud Platform (GCP). L'équipe avait en effet bénéficié de ses outils et de financements pour d'autres projets de recherche. "Nous utilisions déjà TensorFlow pour plusieurs programmes de machine learning. C'est donc tout naturellement que nous sommes passés à GCP pour nos derniers projets de deep learning", explique Yoichi Matsuyama, chercheur post-doctorant au Language Technologies Institute et responsable du projet SARA. "Nous utilisons également les API de Google, dont l'API de reconnaissance vocale Google Speech pour nos agents conversationnels, ainsi que Firebase pour les frameworks de collecte de données basée sur le crowdsourcing." GCP reste la plateforme de prédilection alors que les domaines d'application de SARA se multiplient. "La phase de déploiement n'est pas terminée", ajoute Yoichi Matsuyama, qui constate d'ailleurs que "GCP donne un coup d'accélérateur à la recherche universitaire sur l'intelligence artificielle."

Le laboratoire "utilise essentiellement" Compute Engine, dont 4 accélérateurs GPU NVIDIA Tesla K80 et TensorFlow. Cette année, l'équipe travaille notamment sur des modèles de génération de langage naturel socialement conditionné et de raisonnement social basé sur le deep reinforcement learning pour l'exécution de tâches.

Voici ce que Yoichi Matsuyama pense du produit lancé au Forum économique mondial, la version 1.0 de SARA en quelque sorte : "Plus de 250 personnes ont pu utiliser SARA pendant une conférence qui s'est étalée sur quatre jours. Dans l'ensemble, le projet a été une réussite. Mais nous n'avons pas encore fini l'analyse des résultats, de ce qui fonctionne ou pas." Il ajoute : "Les données ont notamment révélé une corrélation entre l''entente', c'est-à-dire les relations entre les personnes, et les performances d'exécution des tâches. En l'occurrence, cette entente a conditionné le fait qu'un participant accepte ou refuse la recommandation faite par le robot. Lorsque l'entente était forte et que SARA parvenait à nouer une relation avec l'utilisateur, ce dernier acceptait plus volontiers les recommandations. C'est notre principale découverte pour l'instant, mais l'analyse des données n'est pas terminée."

De nouveaux domaines d'application, dont le milieu éducatif

Les travaux autour du projet SARA commencent tout juste, et l'"intelligence artificielle socialement attentive" de l'Articulab a déjà trouvé d'autres applications dans le milieu éducatif. Elle aide notamment les élèves des établissements publics manquant de ressources et favorise la collaboration entre pairs (une approche reconnue comme indispensable pour l'apprentissage). Ce type d'intelligence accompagne aussi les enfants autistes de haut niveau ainsi que ceux atteints du syndrome d'Asperger en leur proposant de mettre en pratique des compétences sociales afin d'améliorer leur relationnel avec les autres enfants.

Michael Madaio est étudiant en doctorat au Human-Computer Interaction Institute et dirige le projet RAPT (Rapport-Aware Peer Tutor, en français "tuteur homologue attentif à l'entente"). Il explique que grâce aux données collectées sur le tutorat entre humains, l'équipe a appris que "l'entente entre les étudiants qui collaborent est étroitement liée à l'engagement dans le travail, à la résolution du problème et, in fine, à l'apprentissage." Autrement dit, travailler ensemble, en interaction, profite à tous.

L'équipe de Michael Madaio poursuit actuellement ses recherches sur le rôle de l'entente dans le processus d'apprentissage à des fins éducatives. L'idée n'est pas seulement de proposer des outils qui aident les élèves à apprendre. "Il existe déjà des plates-formes d'apprentissage pour ça. En revanche, ce que nous savons grâce à la recherche, c'est que les élèves ne sont pas que des machines de traitement de l'information qui exécutent des calculs. Il ne faut pas oublier la dimension sociale. Pour apprendre, il est important de créer ce lien avec les autres élèves. Le constat vaut également pour un tuteur virtuel : si l'enfant s'est trompé, comment le lui dire ? Au début, vous serez sans doute poli, vous y mettrez les formes, pour que le coup soit moins rude. Mais au fil du temps, vous construirez cette relation et pourrez vous permettre plus de franchise, pour finalement lui donner des conseils avisés qui l'aideront véritablement."

Si le tuteur virtuel est efficace, vous augmentez "les chances que l'étudiant souhaite le réinterroger". Cela compte, de même que la façon dont les élèves interagissent avec lui. "L'important n'est pas seulement de savoir si les étudiants redemandent de l'aide, mais comment ils se comportent avec le tuteur virtuel. Se montrent-ils plus ouverts ? Partagent-ils plus facilement leurs attentes et leurs angoisses ?" Ce lien se tisse avec le temps, comme n'importe quelle autre relation. Mais ce qui est extraordinaire ici, c'est qu'un tel lien peut réellement exister. La preuve en est avec SARA.

Si le robot assistant est accueilli à bras ouvert par le milieu scolaire, Michael Madaio précise : "Le projet n'a été déployé dans aucun établissement pour le moment. Une partie de notre travail de conception cette année consistera à imaginer un déploiement d'envergure." Faut-il créer un camarade pour l'aide aux devoirs ? Un tuteur pour faciliter l'apprentissage de la lecture ? L'équipe est actuellement en phase de réflexion.

La Carnegie Mellon University n'envisage pas de s'équiper de tuteurs virtuels. En revanche, elle pourrait bien faire appel à un assistant personnel pour renseigner les étudiants sur les prochaines conférences prévues sur le campus, suggérer des événements, etc. L'objectif sans doute le plus ambitieux de l'Articulab est de développer une version de SARA opérationnelle 24h/24 et 7j/7, pas seulement pendant quatre jours à l'occasion d'une conférence, et qui soit utilisable dans des domaines variés. Un projet à la fois complexe, excitant et aux possibilités infinies.

"L'important n'est pas seulement de savoir si les étudiants redemandent de l'aide, mais comment ils se comportent avec le tuteur virtuel. Se montrent-ils plus ouverts ? Partagent-ils plus facilement leurs attentes et leurs angoisses ?"

Michael Madaio, étudiant en doctorat, Human-Computer Interaction Institute

Merci de vous être inscrit !

Parlez-nous de vos centres d'intérêt.