Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/tede/6119
Registro completo de metadados
Campo DCValorIdioma
dc.creatorMedeiros, Thiago Rodrigues-
dc.date.accessioned2015-05-14T12:36:47Z-
dc.date.accessioned2018-07-21T00:14:36Z-
dc.date.available2014-08-27-
dc.date.available2018-07-21T00:14:36Z-
dc.date.issued2014-02-14-
dc.identifier.citationMEDEIROS, Thiago Rodrigues. Análise e Implementação de Algoritmos para a Aprendizagem por Reforço. 2014. 120 f. Dissertação (Mestrado em Informática) - Universidade Federal da Paraí­ba, João Pessoa, 2014.por
dc.identifier.urihttps://repositorio.ufpb.br/jspui/handle/tede/6119-
dc.description.abstractThe Reinforcement Learning is a subfield of machine learning and can be defined as a learning problem. An intelligent system that faces this problem, understands from rewards if the actions you are performing in the environment are good or bad. There are several methods and algorithms found in the literature to solve the problems of reinforcement learning. However, each of them have their advantages and disadvantages. From this, this paper presents a statistical analysis of some algorithms and a library of reinforcement learning, called AILibrary-RL. The AILibrary-RL is a library that has the objective to facilitate, organize and promote reusability of code, to implement systems that have this kind of problem. Before its development, a bibliographic survey of the main methods that solve this problem, aimed at statistical analysis of the data was performed in order to evaluate its advantages and disadvantages in different environments. This dissertation described the whole process of this work, since the survey bibliographic, analysis of the methods, mechanisms and library construction.eng
dc.description.provenanceMade available in DSpace on 2015-05-14T12:36:47Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) Previous issue date: 2014-02-14eng
dc.description.provenanceMade available in DSpace on 2018-07-21T00:14:36Z (GMT). No. of bitstreams: 2 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) arquivototal.pdf.jpg: 4056 bytes, checksum: 416116249d9f0559edbbf07f5be7a32b (MD5) Previous issue date: 2014-02-14en
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior-
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUniversidade Federal da Paraí­bapor
dc.rightsAcesso abertopor
dc.subjectAprendizado de Máquinapor
dc.subjectAprendizado por Reforçopor
dc.subjectAnálisepor
dc.subjectBibliotecapor
dc.subjectMachine Learningeng
dc.subjectReinforcement Learningeng
dc.subjectLibraryeng
dc.subjectStatistical Analysiseng
dc.titleAnálise e Implementação de Algoritmos para a Aprendizagem por Reforçopor
dc.typeDissertaçãopor
dc.contributor.advisor1Formiga, Andrei de Araujo-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0506569373440954por
dc.creator.Latteshttp://lattes.cnpq.br/3747782060037756por
dc.description.resumoA Aprendizagem por Reforço é um subcampo do Aprendizado de Máquina e pode ser definido como um problema de aprendizagem. Um sistema inteligente que enfrenta esse problema, entende a partir de recompensas, se as ações que está realizando no ambiente são boas ou ruins. Existem vários métodos e algoritmos encontrados na literatura para resolver os problemas de aprendizagem por reforço, no entanto, cada um deles possuem suas vantagens e desvantagens. A partir disso, esse trabalho apresenta uma análise estatística de alguns algoritmos e uma biblioteca de aprendizagem por reforço, chamada AILibrary-RL. A AILibrary-RL é uma biblioteca que possui o objetivo de facilitar, organizar e promover a reusabilidade de código, para a implementação de sistemas que possuem esse tipo de problemática. Antes de seu desenvolvimento, foi realizado um levantamento bibliográfico dos principais métodos que solucionam a problemática de AR, visando a análise estatística dos mesmos, com o objetivo de avaliar suas vantagens e desvantagens em ambientes variados. Nesta dissertação está descrito todo o processo deste trabalho, desde o levantamento bibliográfico, análise dos métodos, mecanismos e construção da biblioteca.por
dc.publisher.countryBRpor
dc.publisher.departmentInformáticapor
dc.publisher.programPrograma de Pós Graduação em Informáticapor
dc.publisher.initialsUFPBpor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.thumbnail.urlhttp://tede.biblioteca.ufpb.br:8080/retrieve/14853/arquivototal.pdf.jpg*
Aparece nas coleções:Centro de Informática (CI) - Programa de Pós-Graduação em Informática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
arquivototal.pdf6,12 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.