Novos métodos de programação linear inteira mista para o problema das árvores de classificação ótimas

Koehler, Victor José de Sousa

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/34179

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Koehler, Victor José de Sousa	-
dc.date.accessioned	2025-04-07T12:45:51Z	-
dc.date.available	2024-08-22	-
dc.date.available	2025-04-07T12:45:51Z	-
dc.date.issued	2024-05-29	-
dc.identifier.uri	https://repositorio.ufpb.br/jspui/handle/123456789/34179	-
dc.description.abstract	Classification trees are very useful techniques in the field of machine learning due to the ease of human interpretation of their predictions. Motivated by the improvement of algorithms and hardware capacity for solving integer programming problems, recent works address the creation of optimal classification trees through linear models, the most general model being entitled Optimal Classification Trees (OCT). We propose in this work a reformulation of the OCT, valid inequalities based on the precedence graph of the learning input and a branch-and-cut strategy on the restrictions that depend on the number n of points that is very large in several instances of the literature. In addition, we present techniques and strategies to mitigate the high computational cost linked to this high dimensionality of points through their reduction, by means of heuristics and exact models, aiming to establish a trade-off between assertiveness, representativeness and models execution time. The results demonstrate that the model reformulation reduces on average 57% the computational time of the OCT, and that the precedence inequalities decrease in 58% the number of nodes solved by the branch-and-bound strategies.	pt_BR
dc.description.provenance	Submitted by Jackson R. L. A. Nunes (jackson@biblioteca.ufpb.br) on 2025-04-07T12:45:51Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) VictorJoséDeSousaKoehler_Dissert.pdf: 1349006 bytes, checksum: a0b5796c2dc5a04bc0c65cb2e6ac852a (MD5)	en
dc.description.provenance	Made available in DSpace on 2025-04-07T12:45:51Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) VictorJoséDeSousaKoehler_Dissert.pdf: 1349006 bytes, checksum: a0b5796c2dc5a04bc0c65cb2e6ac852a (MD5) Previous issue date: 2024-05-29	en
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal da Paraíba	pt_BR
dc.rights	Acesso aberto	pt_BR
dc.rights	Attribution-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nd/3.0/br/	*
dc.subject	Árvore classificação - Estrutura de dados	pt_BR
dc.subject	Programação inteira mista	pt_BR
dc.subject	Optimal Classification Trees (OCT)	pt_BR
dc.subject	Classification	pt_BR
dc.subject	Decision tree	pt_BR
dc.subject	Mixed integer programming	pt_BR
dc.title	Novos métodos de programação linear inteira mista para o problema das árvores de classificação ótimas	pt_BR
dc.type	Dissertação	pt_BR
dc.contributor.advisor1	Sousa Filho, Gilberto Farias de	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/1129941438253617	pt_BR
dc.contributor.advisor-co1	Silva, Thiago Gouveia da	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/2049877991330408	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5516398050336349	pt_BR
dc.description.resumo	Árvores de classificação são um recurso muito útil na área de aprendizado de máquina pela facilidade de interpretação humana de suas predições. Motivado pela melhoria dos algoritmos e da capacidade de hardware para resolução de problemas de programação inteira, trabalhos recentes abordam a criação de árvores de classificação ótima através de modelos lineares, sendo o modelo mais geral intitulado Optimal Classification Trees (OCT). Propomos neste trabalho uma reformulação do OCT, inequações válidas baseada no grafo de precedência dos pontos de aprendizado e uma estratégia de branchand- cut sobre restrições que dependem do número n de pontos, que é muito grande em várias instâncias de entrada da literatura. Ademais, apresentamos técnicas e estratégias para mitigar o alto custo computacional atrelado a essa alta dimensionalidade dos pontos através da sua redução, por meio de heurísticas e modelos exatos, visando estabelecer um trade-off entre assertividade, representatividade e tempo de execução dos modelos. Os resultados demonstram que a reformulação do modelo reduz em média 57% do tempo computacional do OCT, e que as inequações de precedência diminuem em 58% o número de nós resolvidos pela estratégias de branch-and-bound.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Informática	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Informática	pt_BR
dc.publisher.initials	UFPB	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
Aparece nas coleções:	Centro de Informática (CI) - Programa de Pós-Graduação em Informática

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
VictorJoséDeSousaKoehler_Dissert.pdf		1,32 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons

Repositório Institucional da UFPB