Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/21205
Tipo: | Dissertação |
Título: | Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores |
Autor(es): | Souza, Rafael Alexandrino Spíndola de |
Primeiro Orientador: | Araújo, Tiago Maritan Ugulino de |
Resumo: | Com quantidades cada vez maiores de dados para serem analisados e corretamente interpretados, a Detecção de Anomalias (ou Outliers) surge como uma das áreas de grande impacto no contexto da Mineração de Dados (MD). Suas aplicações estendem-se aos mais diversos campos da atuação humana, notadamente na medicina, administração, gestão de processos, ciência da informação, física, economia e em muitas outras atividades. Neste trabalho, propõe-se um Sistema não paramétrico de apoio à detecção de eventos aberrantes em bases de dados estacionárias, provenientes da Administração Pública e relacionadas aos Dados de Dispensas e Inexigibilidades de Licitações do Governo Federal entre 2014 e 2019, aos Dados Orçamentários do Fundo Municipal de Saúde de João Pessoa – PB, entre 2016 e 2020, e aos Dados relativos ao Gerenciamento de Frotas do Estado da Paraíba, entre 2017 e 2019. A solução proposta reúne múltiplos algoritmos de detecção supervisionada e não supervisionada (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest e Robust Covariance) para classificar os eventos como anomalias. Os resultados mostraram que, do total de eventos retornados pela solução, em média, 90,07% deles foram corretamente identificados como outliers. Portanto, há indicativos de que a solução proposta tem potencial de contribuir para as atividades de apoio a auditoria governamental, bem como para os processos de gerenciamento e tomada de decisão, estes decorrentes da interpretação dos fenômenos presentes nos dados. |
Abstract: | With increasing amounts of data to be analyzed and correctly interpreted, Anomaly Detection (or Outliers) appears as one of the areas of significant impact in the context of Data Mining (DM). Its applications extend to the most diverse human activity fields, such as medicine, administration, process management, information science, physics, economics, and many other activities. In this work, we propose a non-parametric system to support the detection of aberrant events in stationary databases. The database comes from the Public Administration and related to the Federal Government’s Disbursement and Bidding Data between 2014 and 2019, to the Fund’s Budget Data Municipal Health of João Pessoa - PB, between 2016 and 2020, and Data on the Fleet Management of the State of Paraíba between 2017 and 2019. The proposed solution combines some supervised and unsupervised detection algorithms (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest, and Robust Covariance) to classify events as anomalies. The results showed that the solution identifies an average of 90.07% correctly events as outliers. Therefore, there are indications that the proposed solution can contribute to government audit support activities and management and decision-making processes, these arising from the interpretation of the phenomena present in the data. |
Palavras-chave: | Detecção de anomalias Detecção de outliers Aprendizagem supervisionada Aprendizagem não supervisionada Mineração de dados Dados governamentais Anomaly detection Outlier detection Supervised learning Unsupervised learning Data mining Government data |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Departamento: | Informática |
Programa: | Programa de Pós-Graduação em Informática |
Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/21205 |
Data do documento: | 15-Abr-2021 |
Aparece nas coleções: | Centro de Informática (CI) - Programa de Pós-Graduação em Informática |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
RafaelAlexandrinoSpíndolaDeSouza_Dissert.pdf | 40,93 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons