Download for Windows Premium
Q-Learning - Engels-FransFrans-Engels
Publiciteit
Q-Learning
Q learning
Q-learning
L'élément principal de l'algorithme de Q-learning est la table d'état/action.
The main element of the Q learning algorithm is the state/action table.
Le but du Q-learning est d'avoir une sorte d'aide-mémoire.
The aim of Q learning is to have a sort of "cheat sheet".
Dans cet article, les auteurs utilisèrent un algorithme standard, Q-Learning avec approximation de fonction, dont l'approximateur était un RNC.
In this paper, the authors used a standard algorithm (Q Learning with function approximation). Their function approximator for this algorithm was a CNN.
Cette implémentation d'un algorithme de Deep Q-Learning est très simple.
This implementation of a Deep Q Learning algorithm is very simple.
C'est pourquoi Deep Q-Learning a été introduit.
That's why Deep Q Learning was introduced.
Le Deep Q-Learning est l'algorithme introduit par la publication de DeepMind en 2013.
Deep Q Learning is the algorithm introduced by the DeepMind paper in 2013.
A l'aide de l'équation de Bellman, nous pouvons obtenir la fonction de Q-learning, qui nous permet de mettre à jour la Q-table après avoir exécuté une action.
Using the Bellman equation, we can get the Q learning function, which enables us to update Q-values after performing an action.
Ensuite, nous comparons les performances de plusieurs HH décrites dans la littérature pour le second problème abordé reposant sur différentes méthodes de sélection heuristique telles que la sélection aléatoire, la fonction de choix, une approche de Q-Learning et un algorithme de colonie de fourmis.
Then, we compare the performances of several HHs described in the literature for the latter problem, which embed different heuristic selection methods such as a random selection, a choice function, a Q-Learning approach, and an ant colony based algorithm.
Le Q-Learning a alors été remplacé par l'algorithme du Dyna-Q que nous avons adapté à la commande de systèmes non déterministes en ajoutant un historique des dernières transitions.
Then, the Q-Learning algorithm was replaced by the Dyna-Q algorithm which we adapted to the control of no deterministic systems by using a chronological account of the last transitions.
Q-learning, une approche d'apprentissage de renforcement populaire, a récemment été utilisée pour estimer les régimes de traitement dynamiques.
Q-learning, a popular reinforcement learning approach, has recently been applied to estimate dynamic treatment regimes.
Le premier est le Q-learning hystérétique qui repose sur des agents "à tendance optimiste réglable".
The first one, called hysteretic Q-learning, is based on agents with "adjustable optimistic tendency".
Une implémentation neuronale de l'algorithme de Q-learning, utilisant les transitions, est réalisée de manière biologiquement plausible en s'inspirant des ganglions de la base.
A biologically plausible neural implementation of the Q-learning algorithm, using transitions, is made by taking inspiration from the basal ganglia.
Une implémen- tation neuronale de l'algorithme de Q-learning, utilisant les transitions, est réalisée de manière biologiquement plausible en s'inspirant des ganglions de la base.
A biologically plausible neural implementation of the Q-learning algorithm, using transitions, is made by taking inspiration from the basal ganglia.
Er zijn geen resultaten gevonden voor deze term.

Synoniemen voor Q-Learning in het Frans

Publiciteit

Suggesties

Resultaten: 28. Exact: 28. Verstreken tijd: 27 ms.