Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/31657| Tipo: | TCC |
| Título: | Usando Aprendizado por Reforçoo com Demonstrações e Habilidades para Jogar Sonic com Recompensas Esparsas |
| Autor(es): | Silva, Lucas Isaac Pissaia da |
| Primeiro Orientador: | Rêgo, Thais Gaudencio do |
| Resumo: | Aprendizado por reforço consegue lidar com vários tipos de ambientes, no entanto, pode o fazer de forma ineficiente, exigindo milhões de passos de aprendizado para possuírem performance satisfatória, o que limita seu uso no mundo real. Usando demonstrações no pré-treino e habilidades, sequência de ações que executam uma sub tarefa, treinamos um agente que consegue completar o primeiro nível e progredir no segundo e terceiro nível, os quais o agente nunca viu antes, do jogo Sonic The Hedgehog. Usamos recompensas esparsas, com recompensa sendo dada somente quando um nível ´e completado, algo que técnicas comuns de aprendizado por reforço não conseguiriam fazer, e entrada imagética usando Skill-based Model-based Reinforcement Learning (Shi; Lim; Lee, 2022), originalmente usado em robótica. Os nossos resultados mostram como o uso de demonstrações e habilidades conseguem acelerar o treinamento e possibilitam o uso de aprendizado por reforço em ambiente com recompensa esparsa |
| Abstract: | Reinforcement learning can handle many types of environments, but it does so inefficiently, requiring millions of learning steps to achieve good per formance, which limits its use in the real world. Using demonstrations on pre training and skills, a sequence of actions that perform a sub-task, we trained an agent that can complete the first level and achieve progress in the second and third levels, which the agent has never seen before, of the game Sonic The Hedgehog. We used sparse rewards, with rewards being given only when a level is completed, something that common reinforcement learning techniques would not be able to do, andimageinput using Skill-based Model-based Reinforcement Learning, originally used in robotics. Our results show how the use of demons trations and skills can speed up training and enable the use of reinforcement learning in a sparse reward environment. |
| Palavras-chave: | Aprendizado por reforço Aprendizado com demonstrações Inteligência artificial Aprendizado de máquina |
| CNPq: | CNPQ::OUTROS |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal da Paraíba |
| Sigla da Instituição: | UFPB |
| Departamento: | Computação Científica |
| Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
| URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
| URI: | https://repositorio.ufpb.br/jspui/handle/123456789/31657 |
| Data do documento: | 29-Nov-2023 |
| Aparece nas coleções: | TCC - Ciência da Computação - CI |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Lucas Isaac Pissaia da Silva_TCC.pdf | TCC | 665,07 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
