Download for Windows Premium
Publiciteit
q-learning algorithm

Vertaling van "q-learning algorithm" in Frans

We konden deze vermelding niet vinden. Er worden benaderende resultaten weergegeven. Controleer je spelling of stel voor deze term aan het woordenboek toe te voegen.
algorithme de Q-learning
algorithme Q-learning
A biologically plausible neural implementation of the Q-learning algorithm, using transitions, is made by taking inspiration from the basal ganglia.
Une implémentation neuronale de l'algorithme de Q-learning, utilisant les transitions, est réalisée de manière biologiquement plausible en s'inspirant des ganglions de la base.
A biologically plausible neural implementation of the Q-learning algorithm, using transitions, is made by taking inspiration from the basal ganglia.
Une implémen- tation neuronale de l'algorithme de Q-learning, utilisant les transitions, est réalisée de manière biologiquement plausible en s'inspirant des ganglions de la base.
We use Q-learning algorithm to dynamically update path costs and to select the next hop each time a packet is forwarded toward a given gateway; learning agents in each mesh router learn the best link to forward an incoming packet and explore new alternatives in the future.
Nous utilisons l'algorithme de Q-learning pour mettre à jour dynamiquement les coûts des chemins, sélectionner les prochains nœuds pour faire suivre les paquets vers les passerelles choisies et explorer d'autres nœuds voisins.
Because the Q-learning algorithm is a greedy algorithm, it will always choose the action that yields the best Q-value for the current network.
Parce que l'algorithme de Q-learning est un algorithme avide, il choisira toujours l'action qui produit la meilleure valeur Q pour le modèle actuel.
The fact that it does not take into accounts the future rewards makes using the Q-learning algorithm less interesting, and we cannot yet beat real-world players at any game of poker.
Le fait qu'il ne prenne pas en compte les récompenses futures rend l'utilisation de l'algorithme Q-learning moins intéressante, et nous ne pouvons pas encore battre les joueurs du monde réel à aucun jeu de poker.
The intention of this hybridization is overcome the drawbacks of Q-learning algorithm to highlight a new approach able to handle context, select and adapt service.
L'hybridation de ces deux algorithmes permet surmonter les inconvénients de Q-learning pour aboutir à une nouvelle approche capable de gérer le contexte, sélectionner et adapter le service.
The second approach extends the Deep Q-learning algorithm with a continuous transfer process.
La seconde approche propose d'inclure un mécanisme d'apprentissage par transfert dans l'exécution d'un algorithme d'apprentissage profond par renforcement, Deep Q-learning.
Then, the Q-Learning algorithm was replaced by the Dyna-Q algorithm which we adapted to the control of no deterministic systems by using a chronological account of the last transitions.
Le Q-Learning a alors été remplacé par l'algorithme du Dyna-Q que nous avons adapté à la commande de systèmes non déterministes en ajoutant un historique des dernières transitions.
The solution is based on the fuzzy Q-learning that consists in tuning a fuzzy inference system (which represents the energy arbitrage in the system) with the Q-learning algorithm.
La solution s'appuie sur le fuzzy Q-learning qui consiste à combiner le système d'inférence floue avec l'algorithme Q-learning.
Next, we also illustrate how a Deep Q-learning algorithm can be used to heuristically solve the same problem.The second part of this thesis considers sequential models in deep learning.
Ensuite, nous illustrons également comment un algorithme d'apprentissage Deep Q peut être utilisé pour résoudre heuristiquement le même problème.
More specifically, we propose two RL models, one based on Q-learning and a second based on Deep Q-learning algorithm formulated as a POMDP (Partially observable Markov decision process).
Le second modèle, plus scalable car basé sur une approche Deep Q-learning, a été formulé sous la forme d'un processus de type POMDP (Partially observable Markov decision process).
In: 10th International ESA Conference on Guidance, evaluation of a Q-Learning Algorithm for Model-free Autonomous Soaring.
In: 23ème Congrès Français de Modélisation et caractérisation expérimentale d'un résonateur microruban reconfigurable en fréquence par décharge plasma.
Er zijn geen resultaten gevonden voor deze term.

Synoniemen voor q-learning algorithm in het Engels

Woord & uitdrukking van de dag
Afbeelding van de dag
nest: structure built by birds for laying eggs
Ontdek het woord
Publiciteit

Resultaten: 12. Exact: 12. Verstreken tijd: 29 ms.