También conocido como Deep Learning, tiene como objetivo principal la construcción de modelos con alto rendimiento en la toma de decisiones, tomando en consideración las experiencias pasadas, es decir, el conocimiento se obtiene de la propia experiencia. El proceso consiste en prueba y error, y se refuerza con una recompensa cuando se realiza una decisión correcta, esto permite el ajuste en el comportamiento para realizar acciones en el futuro.