preguntar acerca de reinforcement-learning

3
réponses

Comment comprendre L’algorithme D’optimisation des politiques proximales dans RL?

je connais les bases de L'apprentissage du renforcement, mais quels termes il est nécessaire de comprendre pour pouvoir lire arxiv PPO paper ? Quelle est la feuille de route pour apprendre et utiliser PPO ? ... …
demandé sur 1970-01-01 00:33:37
5
réponses

Quelle est la différence entre Q-learning et SARSA?

je sais Bien que SARSA est-ce politique, tandis que d' Q-learning est hors-politique, en regardant leurs formules il est difficile (pour moi) de voir une différence entre ces deux algorithmes. Selon le livre Renforcement De L'Apprentissage: Une In …
demandé sur 1970-01-01 00:33:31
7
réponses

Comment former un réseau de neurones artificiels pour jouer à Diablo 2 en utilisant une entrée visuelle?

j'essaie actuellement d'obtenir une ANN pour jouer à un jeu vidéo et j'espérais obtenir de l'aide de la merveilleuse communauté ici. je me suis installé sur Diablo 2. Le jeu est donc en temps réel et d'un point de vue isométrique, le joueur …
demandé sur 1970-01-01 00:33:31