Me encontré con este video de un tipo que entrena inteligencia artificial para pasar un juego de Pokémon y me pareció muy interesante. Creo que este video ilustra muy bien la manera en la que funcionan estos modelos que le permiten al software aprender, mediante incentivos programados, cómo comportarse en un ambiente complejo.
Si nunca has tenido experiencia programando algo así, este video te sirve como una gran introducción a ello.
https://youtu.be/DcYLT37ImBY?feature=shared