Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/31756
Tipo: TCC
Título: Um método determinístico para redução de conjuntos de dados genéricos grandes utilizando Difusão Geométrica Markoviana
Autor(es): Chaves, Thomás Augusto Gouveia
Primeiro Orientador: Souza, Leandro Carlos de
Resumo: Técnicas de redução de instâncias podem ser utilizadas para viabilizar a exploração de grandes conjuntos de dados gerais para obtenção de informação. O Difusão Geométrica Markoviana Estendido(DGM-E) ´ e um método de seleção de instâncias para grandes conjuntos de dados genéricos, que não possuem estrutura geométrica intrinsecamente definida. Por este motivo, o DGM-E conta com um algoritmo de estruturação de dados, o qual ´ e responsável por escalonar os dados, participionar o espaço de dados e determinar a vizinhança de cada elemento, de maneira probabilística, dentre os elementos de uma mesma partição. Este trabalho apresenta uma nova abordagem determinística para construção da vizinhança, que infere os k-vizinhos mais próximos de cada elemento. O algoritmo de redução de instâncias DGM-E ´e capaz de inferir o grau de representatividade de cada instância do conjunto de dados. A partir deste dado, pode ser aplicada a técnica de redução de elementos, com a qual as instâncias menos importantes são removidas.
Abstract: Instance reduction techniques can be used to enable the exploration of large sets of general data to obtain information. Extended Markovian Geometric Diffusion (DGM-E) is an instance selection method for large generic datasets, which do not have an intrinsically defined geometric structure. For this reason, the DGM-E has a data structuring algorithm, which is responsible for scaling the data, partitioning the data space and determining the neighborhood of each element, in a probabilistic way, among the elements of the same partition. This work presents a new deterministic approach to neighborhood construction, which infers the k-nearest neighbors of each element. The DGM-E instance reduction algorithm is able to infer the degree of representativeness of each instance of the dataset. From this data, the element reduction technique can be applied, with which less important instances are removed.
Palavras-chave: Método probabilístico
Difusão geométrica markoviana
Simplificação de conjunto de dados
Seleção de instâncias
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/31756
Data do documento: 29-Jun-2022
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Thom ́as Augusto Gouveia Chaves - TCC.pdfTCC872,54 kBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons