Apprentissage par renforcement

Fiabilité
Points-Clés

L'apprentissage par renforcement est une méthode d'apprentissage automatique où un agent apprend à prendre des décisions en interagissant avec son environnement, recevant des récompenses pour des actions correctes et des pénalités pour des actions incorrectes, afin de maximiser sa récompense globale.

Que signifie l’apprentissage par renforcement

L’apprentissage par renforcement, dans le contexte de l’apprentissage automatique et de l’intelligence artificielle (IA), est un type de programmation dynamique qui entraîne des algorithmes en utilisant un système de récompense et de punition.

Un algorithme d’apprentissage par renforcement, également appelé agent, apprend en interdisant avec son environnement. L’agent reçoit des récompenses pour des actions correctes et des pénalités pour des actions incorrectes. L’agent apprend sans intervention humaine en maximisant sa récompenses et en minimisant sa pénalité

Techopedia explique l’apprentissage par renforcement

L’apprentissage par renforcement est une approche de l’apprentissage automatique inspirée de la psychologie béhavioriste. Cela ressemble à la manière dont un enfant apprend à accomplir une nouvelle tâche. L’apprentissage par renforcement se distingue des autres approches d’apprentissage automatique au fait que l’algorithme n’est pas explicitement informé de la manière de réaliser une tâche, mais travaille sur le problème par lui-même.

En tant qu’agent, qui peut être une voiture autonome ou un programme jouant aux échecs. Il interagit avec son environnement, il reçoit un état de récompense en fonction de sa performance. Comme conduire en toute sécurité jusqu’à la destination ou remporter une partie. En revanche, l’agent reçoit une pénalité s’il se comporte de manière incorrecte. Comme sortir de la route ou être mis en échec.

Au fil du temps, l’agent prend des décisions pour maximiser sa récompense et minimiser sa pénalité en utilisant la programmation dynamique. L’avantage de cette approche en intelligence artificielle est qu’elle permet à un programme d’IA d’apprendre sans qu’un programmeur détaille comment un agent devrait effectuer la tâche.

Termes connexes

Margaret Rouse
Experte en technologie

Margaret Rouse est une écrivaine technique primée et enseignante reconnue pour sa capacité à expliquer des sujets techniques complexes à un public non technique et commercial. Au cours des vingt dernières années, ses explications ont été publiées sur les sites Web de TechTarget et elle a été citée comme une autorité dans des articles du New York Times, du Time Magazine, de USA Today, de ZDNet, de PC Magazine et de Discovery Magazine. L'idée que Margaret se fait d'une journée amusante est d'aider les professionnels de l'informatique et des affaires à apprendre à parler leurs langages hautement spécialisés respectifs. Si…