Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/34740
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Souza, Analaura Rufino de | - |
dc.date.accessioned | 2025-06-05T18:38:58Z | - |
dc.date.available | 2025-05-22 | - |
dc.date.available | 2025-06-05T18:38:58Z | - |
dc.date.issued | 2025-05-07 | - |
dc.identifier.uri | https://repositorio.ufpb.br/jspui/handle/123456789/34740 | - |
dc.description.abstract | This work proposes a machine learning-based approach for detecting voice disor ders, utilizing acoustic features extracted from audio, such as Mel-Frequency Cepstral Coefficients (MFCCs) and voice perturbation parameters, such as jitter and shimmer. Additionally, a comparison was made using data augmentation to expand the dataset and improve the model’s accuracy. The adopted methodology divides the signal into 16 frequency bands for feature extraction. After extraction, each frequency band is used to train a machine learning model, totaling 16 models. The results from each individual model are then combined into a meta-model, responsible for determining the final classifi cation of the audio. In the data augmentation scenario, the trained meta-model achieved an accuracy of 82.33%, while one of the individual models reached an accuracy of 89.16%. The approach proved to be effective, as it surpassed convolutional neural network-based methods, even when using fewer resources. | pt_BR |
dc.description.provenance | Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2025-06-05T18:38:58Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Analaura Rufino de Souza_TCC.pdf: 849663 bytes, checksum: 11aa6d2061b28f2622be7f52e33b09a4 (MD5) | en |
dc.description.provenance | Made available in DSpace on 2025-06-05T18:38:58Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Analaura Rufino de Souza_TCC.pdf: 849663 bytes, checksum: 11aa6d2061b28f2622be7f52e33b09a4 (MD5) Previous issue date: 2025-05-07 | en |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal da Paraíba | pt_BR |
dc.rights | Acesso aberto | pt_BR |
dc.rights | Attribution-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/br/ | * |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Coeficientes Mel | pt_BR |
dc.subject | Análise espectral | pt_BR |
dc.title | Classificação de Distúrbios Vocais Utilizando Aprendizado de Máquina e Análise Espectral | pt_BR |
dc.type | TCC | pt_BR |
dc.contributor.advisor1 | Batista, Leonardo Vidal | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1047122596139990 | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/1506927596794334 | pt_BR |
dc.description.resumo | Este trabalho propõe uma abordagem baseada em aprendizado de máquina para A detecção de distúrbios vocais, utilizando características acústicas extraídas dos áudios, como coeficientes Mel-Frequência e parâmetros de perturbação da voz, como jitter e shimmer. Além disso, foi realizada uma comparação utilizando data augmentation para expandir a base de dados e aprimorar a acurácia do modelo. A metodologia adotada divide o sinal em 16 faixas de frequência para a extração das características. Após a Extração, cada faixa de frequência é utilizada para treinar um modelo de aprendizado de Máquina, totalizando 16 modelos. Os resultados de cada modelo individual são, então, combinados em um meta-modelo, responsável por determinar a classificação final do áudio. No cenário com data augmentation, o meta-modelo treinado alcançou uma acurácia de. 82,33%, enquanto um dos modelos individuais atingiu 89,16% de acurácia. A abordagem demonstrou ser eficaz, pois, mesmo utilizando menos recursos, superou métodos baseados. em redes neurais convolucionais. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Computação Científica | pt_BR |
dc.publisher.initials | UFPB | pt_BR |
dc.subject.cnpq | CNPQ::OUTROS | pt_BR |
Aparece nas coleções: | TCC - Ciência da Computação - CI |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Analaura Rufino de Souza_TCC.pdf | TCC | 829,75 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons