Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/23455
Registro completo de metadados
Campo DCValorIdioma
dc.creatorCastro, Katy Sylvia Batista-
dc.date.accessioned2022-07-14T20:34:50Z-
dc.date.available2022-04-27-
dc.date.available2022-07-14T20:34:50Z-
dc.date.issued2022-03-30-
dc.identifier.urihttps://repositorio.ufpb.br/jspui/handle/123456789/23455-
dc.description.abstractThe task of clustering is part of everyday life and human nature. The literature that deals with clustering provides techniques, metrics and algorithms to accomplish this task. In particular, the clustering of observed data over time and in the form of intervals represents a challenge, with new methods being proposed for this purpose. The advantage of adaptive distances is that they assign different weights to the variables of clusters, and an algorithm that succeeds in adapting to this can bring results far superior to algorithms that treat all variables in the same way, with the same level of importance. Moreover, kernelization makes it possible to work with data in a new space, different from the original space, where the groups will present a better separation. The objective of this work is to consider new distances for the KMeans method in the clustering of interval time series. We will use adaptive distances and distances calculated through the kernelization of the metric and the feature space. To validate the proposed algorithms, we performed a study with time series generated from the parameters of Space-Time Autoregressive (STAR) models, using Monte Carlo simulations as well as real data. The comparison will take place through external and internal indices. The results obtained in the simulations demonstrate that the proposed algorithms performed better than the existing methods. The application to real data considered cryptocurrency series and traditional indices such as gold, oil, stock exchanges, among others. The results point to insights that can be used for future work in machine learning and economics.pt_BR
dc.description.provenanceSubmitted by Fernando Augusto Alves Vieira (fernandovieira@biblioteca.ufpb.br) on 2022-07-11T17:13:23Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) KatySylviaBatistaCastro_Dissert.pdf: 3634222 bytes, checksum: b5b2e57c97aa258cc61cf226a1663d44 (MD5)en
dc.description.provenanceApproved for entry into archive by Biblioteca Digital de Teses e Dissertações BDTD (bdtd@biblioteca.ufpb.br) on 2022-07-14T20:34:50Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) KatySylviaBatistaCastro_Dissert.pdf: 3634222 bytes, checksum: b5b2e57c97aa258cc61cf226a1663d44 (MD5)en
dc.description.provenanceMade available in DSpace on 2022-07-14T20:34:50Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) KatySylviaBatistaCastro_Dissert.pdf: 3634222 bytes, checksum: b5b2e57c97aa258cc61cf226a1663d44 (MD5) Previous issue date: 2022-03-30en
dc.description.sponsorshipNenhumapt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Paraíbapt_BR
dc.rightsAcesso abertopt_BR
dc.rightsAttribution-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/br/*
dc.subjectDistâncias adaptativaspt_BR
dc.subjectDistâncias kernelizadaspt_BR
dc.subjectAgrupamento de séries temporaispt_BR
dc.titleDistâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalopt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Lima Neto, Eufrásio de Andrade-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5580004940091667pt_BR
dc.contributor.advisor2Ferreira, Marcelo R. Portela-
dc.contributor.advisor2Latteshttp://lattes.cnpq.br/2620157217100077pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1352268659077751pt_BR
dc.description.resumoA tarefa de agrupar faz parte do cotidiano e da natureza humana. A literatura que trata de agrupamentos disponibiliza técnicas, métricas e algoritmos para realizar essa tarefa. Em particular, o agrupamento de dados observados ao longo do tempo e em forma de intervalos representa um desafio, com novos métodos sendo propostos para essa finalidade. A vantagem das distâncias adaptativas é que elas atribuem pesos diferentes às variáveis do agrupamentos, e um algoritmo que consegue se adaptar a isso pode trazer resultados muito superiores aos algoritmos que tratam todas as variáveis da mesma forma, com o mesmo nível de importância. Ademais, a kernelização torna possível trabalhar com dados em um novo espaço, diferente do espaço original, onde os grupos venham a apresentar uma melhor separação. O objetivo deste trabalho é considerar novas distâncias para o método K-Means no agrupamento de séries temporais de dados tipo intervalo. Utilizaremos distâncias adaptativas e distâncias calculadas através da kernelização da métrica e do espaço de características. Para validar os algoritmos propostos realizamos um estudo com séries temporais geradas a partir dos parâmetros de modelos Autorregressivo Espaço-Tempo (STAR, do inglês Space-Time Autoregressive), utilizando simulações Monte Carlo, bem como dados reais. A comparação dar-se-á através de índices externos e internos. Os resultados obtidos nas simulações demonstram que os algoritmos propostos apresentaram desempenho superior em relação aos métodos existentes. A aplicação a dados reais considerou séries de criptomoedas e índices tradicionais como ouro, petróleo, bolsas de valores, entre outros. Os resultados apontam insights que poderão ser usados para trabalhos futuros na área de aprendizagem de máquina e economia.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInformáticapt_BR
dc.publisher.programPrograma de Pós-Graduação em Modelagem Matemática e computacionalpt_BR
dc.publisher.initialsUFPBpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:Centro de Informática (CI) - Programa de Pós-Graduação em Modelagem Matemática Computacional

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
KatySylviaBatistaCastro_Dissert.pdf3,55 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons