deep reinforcement learning
0 aprendizaje profundo por refuerzo
Aprendizaje que combina redes neuronales artificiales con un marco de aprendizaje por refuerzo que ayuda a los agentes de software a aprender cómo alcanzar sus objetivos. Une la aproximación de funciones y la optimización de objetivos, asignando estados y acciones a las recompensas a las que conducen.