Dans cette vidéo on s’interesse à un algorithme important dans l’apprentissage par renforcement: Policy Gradient.
Retourner au début de la série sur l’apprentissage par renforcement
Dans cette vidéo on s’interesse à un algorithme important dans l’apprentissage par renforcement: Policy Gradient.
Retourner au début de la série sur l’apprentissage par renforcement