Análise e Implementação de Algoritmos para a Aprendizagem
por Reforço

Medeiros, Thiago Rodrigues

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/tede/6119

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Medeiros, Thiago Rodrigues	-
dc.date.accessioned	2015-05-14T12:36:47Z	-
dc.date.accessioned	2018-07-21T00:14:36Z	-
dc.date.available	2014-08-27	-
dc.date.available	2018-07-21T00:14:36Z	-
dc.date.issued	2014-02-14	-
dc.identifier.citation	MEDEIROS, Thiago Rodrigues. Análise e Implementação de Algoritmos para a Aprendizagem por Reforço. 2014. 120 f. Dissertação (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2014.	por
dc.identifier.uri	https://repositorio.ufpb.br/jspui/handle/tede/6119	-
dc.description.abstract	The Reinforcement Learning is a subfield of machine learning and can be defined as a learning problem. An intelligent system that faces this problem, understands from rewards if the actions you are performing in the environment are good or bad. There are several methods and algorithms found in the literature to solve the problems of reinforcement learning. However, each of them have their advantages and disadvantages. From this, this paper presents a statistical analysis of some algorithms and a library of reinforcement learning, called AILibrary-RL. The AILibrary-RL is a library that has the objective to facilitate, organize and promote reusability of code, to implement systems that have this kind of problem. Before its development, a bibliographic survey of the main methods that solve this problem, aimed at statistical analysis of the data was performed in order to evaluate its advantages and disadvantages in different environments. This dissertation described the whole process of this work, since the survey bibliographic, analysis of the methods, mechanisms and library construction.	eng
dc.description.provenance	Made available in DSpace on 2015-05-14T12:36:47Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) Previous issue date: 2014-02-14	eng
dc.description.provenance	Made available in DSpace on 2018-07-21T00:14:36Z (GMT). No. of bitstreams: 2 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) arquivototal.pdf.jpg: 4056 bytes, checksum: 416116249d9f0559edbbf07f5be7a32b (MD5) Previous issue date: 2014-02-14	en
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	-
dc.format	application/pdf	por
dc.language	por	por
dc.publisher	Universidade Federal da Paraíba	por
dc.rights	Acesso aberto	por
dc.subject	Aprendizado de Máquina	por
dc.subject	Aprendizado por Reforço	por
dc.subject	Análise	por
dc.subject	Biblioteca	por
dc.subject	Machine Learning	eng
dc.subject	Reinforcement Learning	eng
dc.subject	Library	eng
dc.subject	Statistical Analysis	eng
dc.title	Análise e Implementação de Algoritmos para a Aprendizagem por Reforço	por
dc.type	Dissertação	por
dc.contributor.advisor1	Formiga, Andrei de Araujo	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0506569373440954	por
dc.creator.Lattes	http://lattes.cnpq.br/3747782060037756	por
dc.description.resumo	A Aprendizagem por Reforço é um subcampo do Aprendizado de Máquina e pode ser definido como um problema de aprendizagem. Um sistema inteligente que enfrenta esse problema, entende a partir de recompensas, se as ações que está realizando no ambiente são boas ou ruins. Existem vários métodos e algoritmos encontrados na literatura para resolver os problemas de aprendizagem por reforço, no entanto, cada um deles possuem suas vantagens e desvantagens. A partir disso, esse trabalho apresenta uma análise estatística de alguns algoritmos e uma biblioteca de aprendizagem por reforço, chamada AILibrary-RL. A AILibrary-RL é uma biblioteca que possui o objetivo de facilitar, organizar e promover a reusabilidade de código, para a implementação de sistemas que possuem esse tipo de problemática. Antes de seu desenvolvimento, foi realizado um levantamento bibliográfico dos principais métodos que solucionam a problemática de AR, visando a análise estatística dos mesmos, com o objetivo de avaliar suas vantagens e desvantagens em ambientes variados. Nesta dissertação está descrito todo o processo deste trabalho, desde o levantamento bibliográfico, análise dos métodos, mecanismos e construção da biblioteca.	por
dc.publisher.country	BR	por
dc.publisher.department	Informática	por
dc.publisher.program	Programa de Pós Graduação em Informática	por
dc.publisher.initials	UFPB	por
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	por
dc.thumbnail.url	http://tede.biblioteca.ufpb.br:8080/retrieve/14853/arquivototal.pdf.jpg	*
Aparece nas coleções:	Centro de Informática (CI) - Programa de Pós-Graduação em Informática

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
arquivototal.pdf		6,12 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

Repositório Institucional da UFPB