Aprendizagem por Reforço Clássica e Conexionista: análise de aplicações
Resumo
A aprendizagem por reforço é um paradigma do tipo não supervisionado, onde o agente aprende sem um professor – sem exemplos rotulados. Assim, pode-se aprender em tempo real, pela experiência de executar uma ação e avaliar seu sucesso. Neste artigo apresenta-se dois exemplos de aprendizagem por reforço: um baseado no modelo clássico, utilizando o algoritmo Q-Learning, o outro baseado em sistema conexionista, utilizando uma rede neural artificial. No último caso, a aplicação é voltada à Tecnologia Assistiva. Em ambos os exemplos, mostra-se que o agente aprendeu com suas próprias ações, melhorando seu desempenho com o tempo.