Deepmind, l’IA de Google, de plus en plus fort sur Starcraft II !

Deepmind, l’IA de Google, de plus en plus fort sur Starcraft II !
Innovation

Après avoir infligé une sévère défaite à deux champions de Starcraft II, en début d’année, Alphastar, la version « Starcraft » de Deepmind, l’IA de Google, ne cesse de perfectionner ses techniques. Elle est désormais capable de battre la quasi-totalité des joueurs du monde, grâce à une technique d’apprentissage originale. L’ensemble des informations collectées sera réutilisées par Google dans des applications pratiques de l’IA.

Voici quelques années, Deepmind avait fait sensation, en battant des champions d’échec, puis des champions de Go. Mais ces jeux de pure logique, à tableau ouvert (où les positions et les coups de l’adversaire sont connus), sont devenus trop simple pour l’IA de Google, et AlphaGo avait pris une retraite méritée.

Starcraft II : terrain d’expérimentation idéal pour l’IA

Les efforts des ingénieurs de Google, en terme de jeu, se sont alors porté sur Starcraft II, un jeu à information imparfaite, puisqu’une partie de la carte est cachée, empêchant le joueur de connaître les actions de son adversaires. Cette part d’aléatoire rend beaucoup plus complexes les calculs et algorithmes nécessaires à une victoire contre un adversaire humain. D’où l’idée de Google de développer une IA, Alphastar, dédiée à ce jeu vidéo.

Début 2019, le premier combat public avait tourné au massacre. Deux champions humains, réunis sous la bannière de la Team Liquid, s’étaient vus infliger une cuisante défaite 10-1 (et encore, la victoire humaine a été rendue possible en modifiant les paramètres de l’IA, pour la rendre plus « humaine »).

Deepmind a encore boosté les capacités d’Alphastar…

Mauvaise nouvelle pour l’humanité : depuis cette historique et médiatique rencontre, Alphastar a continué de progresser, vitesse grand V. Deepmind a en effet transformé sa méthode d’apprentissage par renforcement.

Alphastar continue ainsi d’apprendre en effectuant des parties contre lui-même en utilisant deux algorithmes adverses, mais les ingénieurs se sont inspirés des méthodes d’entraînement des joueurs professionnels de Starcraft II et ont ajouté une subtilité : le premier algorithme continue de calculer la manière de maximiser ses chances de gagner, mais le second expose les failles dans la stratégie du premier.

L’ensemble a permis à Alphastar une progression exponentielle : l’IA a atteint le niveau « grand maître », c’est à dire qu’Alphastar est capable de battre 99,98% de tous les joueurs humains. Toutes ces technologies seront ensuite utilisées par Google dans des applications concrètes de l’IA, de prévisions météorologiques et climatiques aux assistants numériques, robots ou voitures autonomes.