Classificação de Distúrbios Vocais  Utilizando Aprendizado de Máquina e  Análise Espectral

Souza, Analaura Rufino de

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/34740

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Souza, Analaura Rufino de	-
dc.date.accessioned	2025-06-05T18:38:58Z	-
dc.date.available	2025-05-22	-
dc.date.available	2025-06-05T18:38:58Z	-
dc.date.issued	2025-05-07	-
dc.identifier.uri	https://repositorio.ufpb.br/jspui/handle/123456789/34740	-
dc.description.abstract	This work proposes a machine learning-based approach for detecting voice disor ders, utilizing acoustic features extracted from audio, such as Mel-Frequency Cepstral Coefficients (MFCCs) and voice perturbation parameters, such as jitter and shimmer. Additionally, a comparison was made using data augmentation to expand the dataset and improve the model’s accuracy. The adopted methodology divides the signal into 16 frequency bands for feature extraction. After extraction, each frequency band is used to train a machine learning model, totaling 16 models. The results from each individual model are then combined into a meta-model, responsible for determining the final classifi cation of the audio. In the data augmentation scenario, the trained meta-model achieved an accuracy of 82.33%, while one of the individual models reached an accuracy of 89.16%. The approach proved to be effective, as it surpassed convolutional neural network-based methods, even when using fewer resources.	pt_BR
dc.description.provenance	Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2025-06-05T18:38:58Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Analaura Rufino de Souza_TCC.pdf: 849663 bytes, checksum: 11aa6d2061b28f2622be7f52e33b09a4 (MD5)	en
dc.description.provenance	Made available in DSpace on 2025-06-05T18:38:58Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Analaura Rufino de Souza_TCC.pdf: 849663 bytes, checksum: 11aa6d2061b28f2622be7f52e33b09a4 (MD5) Previous issue date: 2025-05-07	en
dc.language	por	pt_BR
dc.publisher	Universidade Federal da Paraíba	pt_BR
dc.rights	Acesso aberto	pt_BR
dc.rights	Attribution-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nd/3.0/br/	*
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Coeficientes Mel	pt_BR
dc.subject	Análise espectral	pt_BR
dc.title	Classificação de Distúrbios Vocais Utilizando Aprendizado de Máquina e Análise Espectral	pt_BR
dc.type	TCC	pt_BR
dc.contributor.advisor1	Batista, Leonardo Vidal	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/1047122596139990	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/1506927596794334	pt_BR
dc.description.resumo	Este trabalho propõe uma abordagem baseada em aprendizado de máquina para A detecção de distúrbios vocais, utilizando características acústicas extraídas dos áudios, como coeficientes Mel-Frequência e parâmetros de perturbação da voz, como jitter e shimmer. Além disso, foi realizada uma comparação utilizando data augmentation para expandir a base de dados e aprimorar a acurácia do modelo. A metodologia adotada divide o sinal em 16 faixas de frequência para a extração das características. Após a Extração, cada faixa de frequência é utilizada para treinar um modelo de aprendizado de Máquina, totalizando 16 modelos. Os resultados de cada modelo individual são, então, combinados em um meta-modelo, responsável por determinar a classificação final do áudio. No cenário com data augmentation, o meta-modelo treinado alcançou uma acurácia de. 82,33%, enquanto um dos modelos individuais atingiu 89,16% de acurácia. A abordagem demonstrou ser eficaz, pois, mesmo utilizando menos recursos, superou métodos baseados. em redes neurais convolucionais.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Computação Científica	pt_BR
dc.publisher.initials	UFPB	pt_BR
dc.subject.cnpq	CNPQ::OUTROS	pt_BR
Aparece nas coleções:	TCC - Ciência da Computação - CI

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Analaura Rufino de Souza_TCC.pdf	TCC	829,75 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons

Repositório Institucional da UFPB