$180 + IVA (no miembros)
Online
Duración
Fechas
Martes y jueves
Online
Duración
Cualquier información puede contactarse a nuestro correo electrónicos en el siguiente link
• Ejercicios numéricos simples sobre implementación algorítmica
Evaluación
Aplicaciones prácticas en Python
• Nivel básico en programación orientada a objetos y Python
• Conocimiento previo en Aprendizaje de Máquina
• Conceptos básicos de Cadenas de Márkov
• Fundamentos en algoritmos de optimización simples como Descenso del Gradiente
• Conceptos básicos de Sistemas Retroalimentados (apreciados, pero no necesarios)
• Se proveerá material audiovisual para el aprendizaje por parte del docente.
• El cursante entregará ejecutables para la evaluación.
• Diferenciar el Aprendizaje por Refuerzo de otros paradigmas de Aprendizaje de Maquina
• Determinar si un problema dado puede formularse a través de Aprendizaje por Refuerzo
• Formalizar problemas en este contexto
• Identificar los algoritmos necesarios para resolver dichos problemas junto con el software para implementarlas.
Introducción y formalismo del Aprendizaje por Refuerzo
• Aplicaciones y ejemplos a motivar
Bandidos Multibrazo
• Ejemplos Numéricos
• Programacion
Procesos de Decisión de Márkov [MDPs]
• Procesos de Márkov
• Procesos de Recompensa de Márkov
• Procesos de Decisión de Márkov
MDPs (cont.) y Ecuaciones de Bellman
Programación Dinámica
Métodos de Monte Carlo
Programación Dinámica
Monte Carlo (cont.)
• Control y Predicción
• Fuera/En política
Monte Carlo Fuera de Política
Monte Carlo, Programación
Aprendizaje por Diferencias Temporales [TD]
TD & Bootstrapping en n-pasos
TD-Lambda y Trazas de Elegibilidad
• Perspectivas: Hacia adelante/atrás
TD-Lambda y Trazas de Elegibilidad (cont.)
Aproximación de la Función de Valor
TD-Learning: Programación
Aproximación de la Función de Valor (cont.)
• Métodos Incrementales
Construyendo Características Lineares
Control con Funciones Aproximadas
Métodos Fuera de Política con Aproximaciones
Política Gradiente
• Con Baseline
• Métodos Actor-Critico
Introducción al Aprendizaje de Refuerzo Profundo