Entrada

Clase del 18 de enero.

En nuestras casas avanzamos un poco el Blog, nuestro día se basó en comentar nuestras ideas y ponernos al día sobre la información que cada uno recopiló, lo que avanzamos en el Blog y las ideas que teníamos para perfeccionarlo. Entre la información obtenida, destaca la siguiente:

El método de la inteligencia artificial en el que se le da recompensas en función de su comportamiento ante ciertas situaciones se conoce como “aprendizaje por refuerzo”. En este enfoque, un agente de inteligencia artificial toma decisiones secuenciales con el objetivo de maximizar la recompensa acumulada a lo largo del tiempo. El agente aprende a través de la interacción con un entorno, donde recibe retroalimentación positiva o negativa en forma de recompensas o castigos, respectivamente, en función de sus acciones. El objetivo es que el agente aprenda a tomar las decisiones que maximicen la recompensa a largo plazo. Este enfoque se ha utilizado en una variedad de aplicaciones, como juegos, robótica, gestión de recursos y más.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.