Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/31657
Tipo: TCC
Título: Usando Aprendizado por Reforçoo com Demonstrações e Habilidades para Jogar Sonic com Recompensas Esparsas
Autor(es): Silva, Lucas Isaac Pissaia da
Primeiro Orientador: Rêgo, Thais Gaudencio do
Resumo: Aprendizado por reforço consegue lidar com vários tipos de ambientes, no entanto, pode o fazer de forma ineficiente, exigindo milhões de passos de aprendizado para possuírem performance satisfatória, o que limita seu uso no mundo real. Usando demonstrações no pré-treino e habilidades, sequência de ações que executam uma sub tarefa, treinamos um agente que consegue completar o primeiro nível e progredir no segundo e terceiro nível, os quais o agente nunca viu antes, do jogo Sonic The Hedgehog. Usamos recompensas esparsas, com recompensa sendo dada somente quando um nível ´e completado, algo que técnicas comuns de aprendizado por reforço não conseguiriam fazer, e entrada imagética usando Skill-based Model-based Reinforcement Learning (Shi; Lim; Lee, 2022), originalmente usado em robótica. Os nossos resultados mostram como o uso de demonstrações e habilidades conseguem acelerar o treinamento e possibilitam o uso de aprendizado por reforço em ambiente com recompensa esparsa
Abstract: Reinforcement learning can handle many types of environments, but it does so inefficiently, requiring millions of learning steps to achieve good per formance, which limits its use in the real world. Using demonstrations on pre training and skills, a sequence of actions that perform a sub-task, we trained an agent that can complete the first level and achieve progress in the second and third levels, which the agent has never seen before, of the game Sonic The Hedgehog. We used sparse rewards, with rewards being given only when a level is completed, something that common reinforcement learning techniques would not be able to do, andimageinput using Skill-based Model-based Reinforcement Learning, originally used in robotics. Our results show how the use of demons trations and skills can speed up training and enable the use of reinforcement learning in a sparse reward environment.
Palavras-chave: Aprendizado por reforço
Aprendizado com demonstrações
Inteligência artificial
Aprendizado de máquina
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/31657
Data do documento: 29-Nov-2023
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Lucas Isaac Pissaia da Silva_TCC.pdfTCC665,07 kBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons