Aprendizado por reforço é uma subcategoria de [[Inteligência artificial]] na qual um agente específico aprenderá a atingir um objetivo particular com base na exploração do ambiente e no recebimento de recompensas/punições.
**:: Referência ::** [[Course - CS50's Introduction to Computer Science - Artificial Intelligence]]