Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/tede/6119Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Medeiros, Thiago Rodrigues | - |
| dc.date.accessioned | 2015-05-14T12:36:47Z | - |
| dc.date.accessioned | 2018-07-21T00:14:36Z | - |
| dc.date.available | 2014-08-27 | - |
| dc.date.available | 2018-07-21T00:14:36Z | - |
| dc.date.issued | 2014-02-14 | - |
| dc.identifier.citation | MEDEIROS, Thiago Rodrigues. Análise e Implementação de Algoritmos para a Aprendizagem por Reforço. 2014. 120 f. Dissertação (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2014. | por |
| dc.identifier.uri | https://repositorio.ufpb.br/jspui/handle/tede/6119 | - |
| dc.description.abstract | The Reinforcement Learning is a subfield of machine learning and can be defined as a learning problem. An intelligent system that faces this problem, understands from rewards if the actions you are performing in the environment are good or bad. There are several methods and algorithms found in the literature to solve the problems of reinforcement learning. However, each of them have their advantages and disadvantages. From this, this paper presents a statistical analysis of some algorithms and a library of reinforcement learning, called AILibrary-RL. The AILibrary-RL is a library that has the objective to facilitate, organize and promote reusability of code, to implement systems that have this kind of problem. Before its development, a bibliographic survey of the main methods that solve this problem, aimed at statistical analysis of the data was performed in order to evaluate its advantages and disadvantages in different environments. This dissertation described the whole process of this work, since the survey bibliographic, analysis of the methods, mechanisms and library construction. | eng |
| dc.description.provenance | Made available in DSpace on 2015-05-14T12:36:47Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) Previous issue date: 2014-02-14 | eng |
| dc.description.provenance | Made available in DSpace on 2018-07-21T00:14:36Z (GMT). No. of bitstreams: 2 arquivototal.pdf: 6270725 bytes, checksum: 85c195f570753865adfc82909842b1d3 (MD5) arquivototal.pdf.jpg: 4056 bytes, checksum: 416116249d9f0559edbbf07f5be7a32b (MD5) Previous issue date: 2014-02-14 | en |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | - |
| dc.format | application/pdf | por |
| dc.language | por | por |
| dc.publisher | Universidade Federal da Paraíba | por |
| dc.rights | Acesso aberto | por |
| dc.subject | Aprendizado de Máquina | por |
| dc.subject | Aprendizado por Reforço | por |
| dc.subject | Análise | por |
| dc.subject | Biblioteca | por |
| dc.subject | Machine Learning | eng |
| dc.subject | Reinforcement Learning | eng |
| dc.subject | Library | eng |
| dc.subject | Statistical Analysis | eng |
| dc.title | Análise e Implementação de Algoritmos para a Aprendizagem por Reforço | por |
| dc.type | Dissertação | por |
| dc.contributor.advisor1 | Formiga, Andrei de Araujo | - |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0506569373440954 | por |
| dc.creator.Lattes | http://lattes.cnpq.br/3747782060037756 | por |
| dc.description.resumo | A Aprendizagem por Reforço é um subcampo do Aprendizado de Máquina e pode ser definido como um problema de aprendizagem. Um sistema inteligente que enfrenta esse problema, entende a partir de recompensas, se as ações que está realizando no ambiente são boas ou ruins. Existem vários métodos e algoritmos encontrados na literatura para resolver os problemas de aprendizagem por reforço, no entanto, cada um deles possuem suas vantagens e desvantagens. A partir disso, esse trabalho apresenta uma análise estatística de alguns algoritmos e uma biblioteca de aprendizagem por reforço, chamada AILibrary-RL. A AILibrary-RL é uma biblioteca que possui o objetivo de facilitar, organizar e promover a reusabilidade de código, para a implementação de sistemas que possuem esse tipo de problemática. Antes de seu desenvolvimento, foi realizado um levantamento bibliográfico dos principais métodos que solucionam a problemática de AR, visando a análise estatística dos mesmos, com o objetivo de avaliar suas vantagens e desvantagens em ambientes variados. Nesta dissertação está descrito todo o processo deste trabalho, desde o levantamento bibliográfico, análise dos métodos, mecanismos e construção da biblioteca. | por |
| dc.publisher.country | BR | por |
| dc.publisher.department | Informática | por |
| dc.publisher.program | Programa de Pós Graduação em Informática | por |
| dc.publisher.initials | UFPB | por |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | por |
| dc.thumbnail.url | http://tede.biblioteca.ufpb.br:8080/retrieve/14853/arquivototal.pdf.jpg | * |
| Aparece nas coleções: | Centro de Informática (CI) - Programa de Pós-Graduação em Informática | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| arquivototal.pdf | 6,12 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
