Connect with us

Technologie

La recherche islandaise pourrait révolutionner l’IA

Published

on


En 2020, Systèmes Ciscoa accordé une subvention de recherche avancée de deux ans à l’Institut islandais des machines intelligentes (IIIM) pour développer un prototype d’un nouveau type d’intelligence artificielle (IA).

La nouvelle approche, menée par Kristinn Thórisson, directeur de l’IIIM et professeur à l’Université de Reykjavik, diffère des approches existantes de l’IA de plusieurs façons. Il repose sur un apprentissage auto-supervisé, ce qui permet à un système d’apporter des améliorations au fil du temps. L’apprentissage est basé sur une forme de « raisonnement » – où le système génère de manière autonome des hypothèses et les teste.

En outre, la nouvelle approche fait plus que simplement repérer les corrélations – elle reconnaît les relations causales.

Thórisson espère développer une IA capable d’apprendre de l’expérience dans un large éventail de situations et de transférer son apprentissage en douceur d’un contexte à l’autre. La nouvelle IA sera même capable d’expliquer pourquoi elle fait ce qu’elle fait.

IA faible versus IA forte

Pour comprendre l’importance de la recherche menée par Thórisson et son équipe – avec des membres en Allemagne, en France et en Islande – il est utile de comprendre la différence entre une IA forte et une IA faible. L’IA forte, également connue sous le nom d’intelligence générale artificielle (AGI) ou d’intelligence artificielle générale, fait référence à un système capable de résoudre des problèmes dans plusieurs domaines. Une IA forte apprend au fil du temps grâce à l’expérience.

Aujourd’hui, une IA forte n’existe qu’en théorie. Tous les systèmes existants sont classés comme une IA faible et ne peuvent effectuer que des tâches spécifiques dans un seul domaine, comme jouer aux échecs ou répondre à des questions sur un produit spécifique. L’IA faible apprend grâce à l’apprentissage supervisé, ce qui nécessite une intervention humaine pour préparer les données d’entraînement afin d’aider l’IA à repérer les caractéristiques pertinentes de l’ensemble de données.

Une fois qu’une IA faible passe par le processus d’apprentissage, il est impossible de prédire ce que le système fera. Les ensembles de données utilisés pour la formation sont tout simplement trop volumineux et compliqués pour être analysés par les humains, de sorte que l’IA prend souvent des décisions que personne ne comprend pleinement.

Les systèmes d’IA faibles recherchent des corrélations dans les données et supposent que certains modèles d’entrée conduiront à certains modèles de sortie. Selon Thórisson, la corrélation ne suffit pas; ce qu’il faut, c’est un système qui comprend la logique et qui peut comprendre la causalité.

L’approche de Thórisson, architecture réfléchissante endogène auto-catalytique (AERA), peut changer son comportement à la volée. Il prend de nouvelles informations et « pense » à ce qu’il sait déjà et à ce que les nouvelles données indiquent.

Les objectifs sont un élément clé de l’AERA. Compte tenu des objectifs explicites, il compare les objectifs avec les actions et les résultats. Si un ensemble d’actions lui permet d’atteindre un objectif donné, il tente alors de déterminer quelles actions mèneront à un objectif différent. De cette façon, on peut dire que le système pense à la façon dont il pense afin de s’adapter à l’évolution des objectifs.

« Notre système utilise l’abduction, la déduction et l’induction – et même un peu d’analogie », a déclaré Thórisson. « L’enlèvement est ce dans quoi Sherlock Holmes est si bon. Vous avez un scénario, quelque chose s’est passé. Vous avez un état et vous essayez de déduire ce qui s’est passé, comment cela s’est passé.

« Notre approche donnera lieu à des systèmes capables de proposer de nouveaux concepts à partir de zéro. Ces systèmes seront capables de gérer des ensembles inconnus de variables. Si, par exemple, vous avez un système de contrôle de la circulation aérienne qui détecte un avion de plus que prévu, il ne s’étouffe pas. L’un des principaux objectifs de notre recherche est la construction de systèmes qui, grâce aux principes fondamentaux de leur fonctionnement, peuvent gérer l’inconnu.

Alors que l’AERA promet de fournir des systèmes qui vont bien au-delà de ce que les IA existantes peuvent faire, l’équipe de Thórisson n’est pas le seul groupe de recherche à explorer une IA forte. Une autre approche similaire à AERA est appelée système de raisonnement non axiomatique (NARS). Cet effort est en cours d’élaboration par Pei Wang à l’Université Temple aux États-Unis depuis plus de 20 ans, plus récemment avec l’aide d’une équipe.

Comme AERA, le projet NARS espère développer des systèmes d’IA solides qui peuvent « penser » et suivre les mêmes principes que l’esprit humain. Les deux projets visent à développer des systèmes capables de résoudre des problèmes dans une multitude de domaines. Cependant, l’une des façons dont AERA se démarque est qu’elle peut apprendre de n’importe quel nouveau domaine – et avec un seuil supérieur « doux », ce qui signifie qu’elle n’a pas de limite supérieure sur le nombre de variables ou de concepts avec lesquels elle travaille.

Progrès réalisés jusqu’à présent sur l’AERA

Thórisson utilisera le Cisco funds de développer un code qui démontrera son approche plus complètement, afin que les deux groupes de recherche puissent apprendre l’un de l’autre. Mais ce ne sera pas la première démonstration de l’AERA. Il y a environ 10 ans, Thórisson et son équipe ont développé un modèle de travail qui a appris à mener une simulation d’interview télévisée en temps réel en observant deux personnes parler du recyclage des matériaux.

« C’était la première fois que nous prenions cela au sérieux, que nous codifiions notre propre méthodologie et que nous la suivions à la lettre », a déclaré Thórisson. « Le système que nous avons créé a dépassé toutes nos attentes les plus élevées. Il pourrait apprendre continuellement à la volée et pourrait effectuer des tâches non spécifiées et atteindre de nouveaux objectifs. Il pourrait apprendre par l’observation à partir de descriptions de très haut niveau d’une tâche.

« Ce système a fonctionné bien au-delà de nos rêves les plus fous. Nous avons passé beaucoup de temps à déconstruire ce qu’il a fait pour essayer de condenser les principes qui le sous-tendent. Parce que c’est tellement différent du courant dominant, il a été assez difficile d’expliquer en utilisant uniquement la terminologie traditionnelle.

En développant plus de code à publier en open source – et en organisant plus de démonstrations – Thórisson espère prendre l’élan qui lui permettra d’élargir l’équipe et de créer une communauté de chercheurs intéressés à pousser ces idées plus loin.

« Il a fallu plusieurs années à Wang pour créer une petite équipe de personnes hautement compétentes pour travailler sur NARS – et c’était même après avoir eu une très bonne base de code avec une version open source », a déclaré Thórisson. « Au cours des dernières années, ils ont fait des démonstrations vraiment incroyables, en partie avec l’aide de Cisco Systems.

« Cisco finance mon équipe pour faire quelque chose de similaire. NARS et AERA sont très compatibles au niveau conceptuel et méthodologiquement parlant. Il est possible d’apprendre des deux systèmes et d’amener l’IA à un nouveau niveau. »

Thórisson a ajouté : « Si nous pouvions mettre en œuvre seulement 50 % de nos idées, ce serait formidable. Ce serait déjà bien au-delà de ce que fait l’IA actuelle. »

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Tendance