Aprendizaje por Refuerzo

Presentación

El Aprendizaje por Refuerzo (Reinforcement Learning, RL) es un área de la inteligencia artificial que se centra en cómo los agentes pueden aprender a tomar decisiones óptimas a través de la experiencia, mediante la interacción con un entorno. A diferencia del aprendizaje supervisado, donde se trabaja con datos etiquetados, en RL el agente explora, actúa y recibe recompensas que guían su comportamiento.

Esta presentación ofrece una introducción clara al RL, comenzando con sus conceptos básicos: estados, acciones, recompensas y políticas. Se explica cómo un agente puede aprender estrategias efectivas probando diferentes decisiones y observando sus consecuencias, con el objetivo de maximizar la recompensa acumulada a largo plazo.

Se exploran técnicas fundamentales como Q-learning y métodos basados en políticas, que permiten al agente aprender a comportarse sin necesidad de conocer previamente cómo funciona el entorno. Luego, se presenta el uso de redes neuronales en entornos complejos mediante el enfoque conocido como aprendizaje profundo por refuerzo (Deep RL), ejemplificado con algoritmos como Deep Q-Network (DQN). También se discuten desafíos clave como el equilibrio entre exploración y explotación, y se muestra una implementación práctica en un entorno simulado. Finalmente, se presentan nuevas direcciones de investigación y aplicaciones en el mundo real

Objetivos

  • Comprender los fundamentos del aprendizaje por refuerzo, incluyendo su estructura básica y cómo se diferencia de otros tipos de aprendizaje automático.
  • Identificar los elementos clave en un entorno de aprendizaje por refuerzo, como el agente, el entorno, las acciones, las recompensas y las políticas de decisión.
  • Reconocer las principales estrategias de aprendizaje utilizadas por los agentes, tanto en problemas simples como en contextos más complejos.
  • Explorar cómo el aprendizaje profundo se aplica al aprendizaje por refuerzo, y entender el rol de técnicas como las redes neuronales en este campo.
  • Analizar los desafíos comunes del aprendizaje por refuerzo, como el equilibrio entre exploración y explotación y la estabilidad del proceso de entrenamiento.
  • Observar en la práctica cómo aprende un agente en un entorno simulado, e interpretar su comportamiento a lo largo del tiempo.
  • Reflexionar sobre las posibles aplicaciones del aprendizaje por refuerzo en diferentes sectores, así como su proyección futura y sus implicaciones ética

Destinatarios y requisitos

Destinado a personas con experiencia previa en programación.

Duración y modalidad 

2 horas, online

Fechas y lugar de impartición 

19 de mayo de 10:00 a 12:00 horas

Imparte

Jaime Duque Domingo, Profesor Permanente Laboral del Área de Ingeniería de Sistemas y Automática de la Escuela de Ingenierías Industriales de la Universidad de Valladolid y miembro del Grupo de Técnicas Avanzadas de la Producción (ITAP). También es el coordinador del grupo de Visión Artificial del Comité Español de Automática (CEA). Ha realizado estancias en la Carnegie Mellon University (CMU, Pittsburgh, Estados Unidos), donde realizó investigación sobre modelos de difusión generativa, y en la Universidad Federico II de Nápoles. Es autor de dos libros en el campo de la visión artificial y de numerosos artículos científicos.

Organiza

Centro de Inteligencia Artificial de la Universidad de Valladolid (UVaIA), Ayuntamiento de Valladolid, Agencia de Innovación y Desarrollo Económico (Ideva), Vicerrectorado de Innovación Docente y Transformación Digital de la Universidad de Valladolid y Centro VirtUVa.

Programa

  1. Introducción al Aprendizaje por Refuerzo
  2. Fundamentos de la Toma de Decisiones
  3. Estrategias Básicas de Aprendizaje
  4. Escalamiento a Problemas Complejos
  5. Retos del Aprendizaje por Refuerzo
  6. Demostración Práctica
  7. Perspectivas y Futuro del Campo
  8. Tendencias actuales y proyecciones futuras

Este curso se integra dentro de un paquete formativo impulsado desde el Centro de Inteligencia Artificial de la Universidad de Valladolid (UVaIA) en colaboración con el Ayuntamiento de Valladolid, a través de la Agencia de Innovación y Desarrollo Económico (IdeVA), el Vicerrectorado de Investigación de la Universidad de Valladolid y el Centro Virtuva.
El centro UVaIA se estrenó en mayo de 2024 integrado por expertos de diferentes áreas de la Universidad de Valladolid para impulsar la investigación en IA, la formación, transferencia y divulgación.

Scroll al inicio