Des IA apprennent le travail d’équipe en jouant à cache-cache


Des IA apprennent le travail d’équipe en jouant à cache-cache:

L’intelligence artificielle se développe à une vitesse impressionnante. Il y a deux mois, Pluribus a marqué l’Histoire en battant cinq joueurs de poker à la fois. Au début de l’année, l’IA de Google, Deepmind a battu des joueurs professionnels à Starcraft II.

Cette fois-ci, c’est l’initiative d’OpenAI qui attire l’attention. L’IA américaine a prouvé sa capacité à apprendre en jouant en équipe à des parties de cache-cache.

De plus en plus fortes au cache-cache

On ne présentera pas le jeu du cache-cache. En revanche, lorsque ce jeu mondialement connu est présenté à une intelligence artificielle, celui-ci peut révéler comment cette dernière gère l’importance des décisions
auxquelles elle est confrontée.

OpenAI, qui est basée à San Francisco, a rendu open-source un environnement d’entraînement destiné aux IA. Cet environnement a déjà été utilisé, mettant en scène différents acteurs contrôlés par des IA. Ceux-ci ont eu pour objectif de se cacher et
de se trouver, déployant des techniques de plus en plus sophistiquées pour y parvenir. On retrouve sur les images ci-dessous l’évolution de ces techniques : si, dans un premier temps, les IA ont pu se contenter de se cacher, elles ont par la suite improvisé
des constructions et détourné l’utilisation d’objets. Et surtout, ces IA ont travaillé ensemble pour atteindre un but commun.

Bien sûr, l’intelligence artificielle aura dû jouer un (très) grand nombre de parties pour parfaire son apprentissage. Ce n’est qu’après 25 millions de « matches » que les IA impliquées ont commencé à bâtir des abris improvisés. Avec 75 millions
de matches supplémentaires, les « chercheurs » ont eu l’idée d’utiliser boîtes et rampes pour sauter dans ces abris.

OpenAI IA entrainement

© OpenAI

L’intérêt pour les travaux futurs

À terme, les IA impliquées ont réussi à élaborer des stratégies complexes dans un environnement qu’elles ne connaissaient pas a priori. Les chercheurs d’OpenAI expliquent ainsi : « Les succès rencontrés laissent penser que ces environnements pourraient permettre à des IA d’acquérir un nombre conséquent de… compétences. Ceci amène à un comportement centré sur des compétences beaucoup plus pertinentes pour l’être humain que d’autres méthodes d’apprentissage par renforcement ».

En d’autres termes, et au-delà des environnements de jeu, ces tests montrent que l’IA peut apprendre à élaborer elle-même de nouvelles techniques utiles, par exemple, dans le diagnostic médical ou la découverte de structures de protéines complexes.

Dans une précédente interview, Demis Hassabis, le co-fondateur de l’IA Alphabet Deepmind, a déclaré auprès du site VentureBeat : « À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles… et aider les experts de ces secteurs ».

Source : Venture Beat

Originalement publié sur Tumblr: https://ift.tt/2nuKOjG

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

WordPress.com.

Retour en haut ↑

%d blogueurs aiment cette page :