DeepMind apprend à l’IA à jouer au football


La division d’intelligence artificielle de Google, DeepMind, a appris aux humanoïdes de l’IA comment travailler en équipe afin de jouer au football ensemble.

Les chercheurs ont formé une IA simulée physiquement pour jouer à des jeux à deux contre deux, dans une expérience qui visait à faire progresser la coordination entre les systèmes d’IA et à offrir de nouvelles voies vers la construction d’une intelligence générale artificielle (AGI) qui est d’un niveau similaire à celui d’un humain.

« Nos agents ont acquis des compétences telles que la locomotion agile, les passes et la division du travail, comme le démontrent une série de statistiques », ont écrit les chercheurs de DeepMind dans un article de blog.

« Les joueurs font preuve à la fois d’un contrôle moteur agile à haute fréquence et d’une prise de décision à long terme qui implique l’anticipation des comportements de leurs coéquipiers, conduisant à un jeu d’équipe coordonné. »

Les joueurs ont appris à se bousculer pour le ballon, à effectuer des balles à leur coéquipier et à ébrécher et tacler leurs adversaires.

Des simulations séparées ont vu les humanoïdes apprendre à effectuer des tâches complexes avec leurs bras, comme lancer et attraper une balle.

Grâce à leurs découvertes dans le domaine numérique, les chercheurs de DeepMind ont pu demander à des robots humanoïdes et chiens de marcher et de dribbler un ballon de football d’une « manière naturelle et robuste ».

La recherche a été détaillée dans une étude intitulée « Du contrôle moteur au jeu d’équipe dans le football humanoïde simulé », publiée dans la revue Robotique scientifique mercredi.

Il décrit comment l’IA a été formée pour imiter les compétences spécifiques au football et a été récompensée si les mouvements ont conduit à une amélioration des performances, comme un but. La tâche nécessitait un contrôle moteur, une prise de décision à long terme et la capacité de se coordonner avec d’autres IA.

« Nous avons optimisé des équipes d’agents pour jouer au football simulé via l’apprentissage par renforcement, limitant l’espace de solution à celui de mouvements plausibles appris à l’aide de données de capture de mouvement humain », indique l’étude.

« Le résultat est une équipe de joueurs de football humanoïdes coordonnés qui présentent un comportement complexe à différentes échelles, quantifié par une gamme d’analyses et de statistiques. »

Laisser un commentaire