Programa del Curso

Introducción

Conceptos básicos de aprendizaje de refuerzo

Técnicas básicas de aprendizaje de refuerzo

Introducción a BURLAP

Convergencia de valor e iteración de política

Reward Shaping

Exploración

Generalización

Parcialmente MDP observables

Opciones

logística

TD Lambda

Gradientes de política

Deep Q-Learning

Temas en la teoría de juegos

Resumen y Conclusión

Requerimientos

  • Competencia en Python
  • Una comprensión de cálculo universitario y álgebra lineal
  • Comprensión básica de probabilidad y estadística
  • Python y Numpy

Audiencia

  • Desarrolladores
  • Científicos de datos
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas