Android

Quels sont les pouvoirs du robot openai qui a battu dendi

AlphaGo - The Movie | Full Documentary

AlphaGo - The Movie | Full Documentary

Table des matières:

Anonim

La semaine dernière, l’histoire a été créée dans les domaines de Dota 2 et AI. À l'International, Dendi, l'un des meilleurs joueurs du jeu, a été battu sans merci en 1v1, par un bot, deux fois de suite. Le bot en question a été créé par OpenAI, une startup d’Elon Musk.

Vous avez maintenant des questions. Qu'est-ce que Dota? Qu'est-ce que OpenAI? Et pourquoi est-ce même important? Pour commencer, Dota est un jeu MOBA gratuit dans lequel vous contrôlez Heroes et dont le but est de détruire les adversaires Ancient. Beaucoup de fans de Dota peuvent s'offusquer de la dernière phrase tant il y a tellement à Dota que je l'ai résumé.

Le jeu est très complexe avec une courbe d'apprentissage très raide. Je m'étais lancé dans une mission pour apprendre Dota il y a quelque temps et il m'a fallu une semaine pour visionner une vidéo de base sur le " To To ", où ils expliquent la stratégie du jeu, quelles armes, sorts, comment font les héros et comment les exploiter. Et cela rend toute la bataille de l' IA contre Dendi importante, car elle illustre à quel point l'IA et le ML sont devenus avancés. Voyons donc ce qui alimente ce bot et devons-nous avoir peur du soulèvement de l'IA.

Montée de la planète de l'IA

Devenir le Skynet est un problème discutable. Elon Musk pense que s’il n’est pas maîtrisé, un scénario semblable à celui de Skynet risque de se produire. Mark Zuckerberg, quant à lui, affirme que l'intelligence artificielle est inoffensive et qu'elle ne causera pas le scénario du jour du jugement. Elon Musk a lancé OpenAI avec cet objectif.

Pour prévenir le mauvais usage de l'IA et la recherche sur l'IA qui ne se retournera pas contre nous. Et je suis de son côté.

Mais ce n'est pas ce que nous sommes ici pour discuter. Le sujet principal est de savoir ce qui alimente le bot créé par OpenAI. Pour en comprendre le sens, j'ai lu des articles de recherche et des blogs sur le sujet et j'ai également contacté mon ami Anmol Sharma, chercheur en IA et ML.

Apprentissage par renforcement

C'est le nom de la technologie derrière le bot Dota d'OpenAI. Mais avant d’approfondir la question, nous devons comprendre le fonctionnement de l’intelligence artificielle générale, ou plus particulièrement de l’intelligence artificielle dans les jeux vidéo. L'intelligence artificielle est un terme très utilisé qui contient de nombreux sujets, tels que l'apprentissage automatique, l'apprentissage approfondi et les réseaux de neurones, pour n'en citer que quelques-uns. Pour définir grossièrement l'IA, nous pouvons dire que c'est la capacité d'un ordinateur à apprendre de l'information et à prendre des décisions en fonction de son apprentissage. Plus il en apprend, plus la précision de la décision augmente.

Comment est-il différent de la normale Bot?

Les robots dans les jeux vidéo en général peuvent sembler intelligents, mais ce n'est pas une vraie forme d'IA. Presque tous ces robots dans les jeux sont programmés en fonction des déclarations If..This..Then..That. Ils suivent simplement les déclarations et prennent des mesures en fonction des conditions écrites dans la déclaration.

Ci-dessus, j'ai montré un exemple très simple. Les déclarations dans les jeux réels sont beaucoup plus complexes avec des conditions dans les conditions. Plus ces déclarations sont bien définies et détaillées, plus le bot semble intelligent.

Récompenses et punitions

Dans le langage artificiel, ce que nous appelons bot est appelé agent. Le but est de faire en sorte que l'agent apprenne ce que nous voulons qu'il apprenne. L'agent apprend par la même méthode que son chien, par des récompenses et des punitions. Chaque fois que l'agent commet une erreur, il est pénalisé et chaque fois qu'il fait la devinette ou donne la réponse correcte, il est récompensé. Grâce à ce système, l'agent apprend à associer les actions qu'il ne doit pas faire pour éviter les pénalités et à effectuer l'action (ou des actions similaires) générant des récompenses.

Si vous y réfléchissez bien, cela revient à prendre des décisions en fonction de certaines conditions, un peu comme les algorithmes le font. Comme je l'ai montré ci-dessus, un robot de jeu tombant sur un baril d'explosif prendra des mesures conformément à l'algorithme. Les algorithmes dans l'IA, sont évidemment beaucoup plus complexes que cela, ce qui rend le système entier intelligent.

Selon nos développeurs, notre bot OpenAI a appris tout le jeu en deux semaines. Pendant tout le temps de 2 semaines, il était en ligne 24 × 7 et jouait contre une copie de lui-même. C'est une étape remarquable compte tenu de la complexité du jeu et du fait qu'il pourrait battre Dendi.

Pourquoi les voitures sans conducteur ne sont-elles toujours pas présentes?

C’est l’une des premières questions qui m’est venue à l’esprit lorsque j’ai entendu parler de tout cet événement. Si un bot peut apprendre un tel jeu et s’entraîner au point de battre les meilleurs joueurs, pourquoi sommes-nous toujours au volant? Et c’est la même question que j’ai posée à mon ami, M. Anmol Sharma, qui a également fait des recherches sur des voitures sans moteur. C'est ce qu'il avait à dire.

Dans un jeu développé par un humain, le nombre de variables est inférieur. De plus, si l'agent (bot) commet une erreur, la pénalité la plus lourde est une défaite arrondie. Dans le monde réel, une erreur est la mort.

Même si Dota est un jeu complexe, les combinaisons possibles de coups, sorts et tactiques, bien qu'assez grandes, restent limitées. Et les erreurs sont permises sans pénalité réelle. Mais dans le cas d'un agent de voiture sans conducteur, des erreurs peuvent entraîner des accidents dangereux, voire la mort.

Dans le monde réel, le nombre de variables que l'agent doit surveiller est infini et les situations dues à ces variables, comme une autre voiture qui change de voie soudainement, les piétons qui sautent devant la voiture, sont également infinies. De plus, comme Jeremy Clarkson l'a dit, ils devront prendre des décisions morales et éthiques au bord d'un accident immédiat (bien que sa théorie ne soit pas valable).

L'avenir

Nous savons déjà qu'un robot contrôlé par l'homme effectue des chirurgies intrinsèques. Le prochain saut est celui des robots contrôlés par l'IA qui l'exécutent. Et ce n'est que dans le domaine médical. L'intelligence artificielle sera certainement la nouvelle technologie dominante au cours de la prochaine décennie dans de nombreux domaines. Mais, l'IA peut également être utilisée à des fins néfastes telles que les attaques par DDoS, les robots Ransomware et le piratage d'autres PC ou systèmes de sociétés.

En ce qui concerne Dota et d’autres jeux, on peut s’attendre à voir de tels robots intelligents fabriqués pour d’autres jeux également, contre lesquels les joueurs peuvent s’entraîner pour encore mieux performer. Et ai-je mentionné que OpenAI ferait un 5v5 à l'International de l'année prochaine? Je vais donc mettre à niveau mes compétences dans Dota pour au moins vaincre les bots stupides intégrés. Divine Rapier ici je viens!