Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/36575
Tipo: Tese
Título: Dificuldade no julgamento perceptivo-auditivo da qualidade vocal : uma abordagem baseada em aprendizado de máquina
Autor(es): Paiva, Maxsuel Alves Avelino de
Primeiro Orientador: Lopes, Leonardo Wanderley
Segundo Orientador: Lima Filho, Luiz de Medeiros de Araújo
Primeiro Coorientador: Palm, Bruna Gregory
Resumo: O Julgamento Perceptivo-auditiva da voz (JPA) é amplamente utilizada na prática clínica e na formação em Fonoaudiologia, porém apresenta elevada variabilidade entre juízes, o que compromete sua confiabilidade. Tradicionalmente, os estudos focam em fatores ligados ao juiz ou à tarefa de fala, negligenciando a possibilidade de que a própria voz apresente graus distintos de dificuldade para julgamento. O objetivo deste trabalho é desenvolver um sistema de classificação de padrões para predizer a dificuldade do JPA da voz com base em modelos de AM treinados com dados de concordância e medidas acústicas. As vozes analisadas neste estudo pertencem ao banco de dados do Laboratório Integrado de Estudos da Voz (LIEV), da instituição de origem, sendo frequentemente utilizadas em pesquisas desenvolvidas pelo grupo. Inicialmente, técnicas de agrupamentos foram aplicadas para agrupar 295 vozes segundo o grau de dificuldade do JPA, considerando o coeficiente de variação do JPA e concordância fuzzy entre cinco juízes especialistas em voz. O algoritmo K-means foi selecionado por apresentar o melhor índice interno de validade (Calinski-Harabasz) e melhor separação visual entre os grupos. As vozes foram classificadas em três níveis de dificuldade: fácil, médio e difícil. Posteriormente, quatorze modelos de aprendizado de classificação supervisionada foram treinados para classificar, com base em medidas acústicas, o grau de dificuldade de julgamento das vozes. Os modelos de Regressão Multinomial, Multilayer Perceptron e Random Forest apresentaram os melhores desempenhos para diferentes parâmetros vocais. Os achados demonstram o potencial da combinação de métodos não supervisionados e supervisionados para classificar a dificuldade do JPA, contribuindo para a criação de sistemas de treinamento mais objetivos e fundamentados em evidência. A proposta fornece subsídios para o desenvolvimento de simuladores de treinamento com progressão baseada na dificuldade perceptiva das vozes, com impacto direto na formação e na prática clínica em Fonoaudiologia.
Abstract: Auditory-Perceptual Judgment (APJ) of voice is widely used in clinical practice and speech-language pathology training, but it presents high variability among judges, which compromises its reliability. Traditionally, studies focus on factors related to the judge or the speech task, neglecting the possibility that the voice itself presents different degrees of difficulty for judgment. The objective of this work is to develop a pattern classification system to predict the difficulty of the APJ of voice based on ML models trained with concordance data and acoustic measurements. The voices analyzed in this study belong to the database of the Integrated Laboratory of Voice Studies (LIEV) at the home institution and are frequently used in research developed by the group. Initially, clustering techniques were applied to group 295 voices according to the degree of APJ difficulty, considering the APJ coefficient of variation and fuzzy concordance among five expert voice judges. The K-means algorithm was selected because it presented the best internal validity index (Calinski-Harabasz) and the best visual separation between groups. The voices were classified into three difficulty levels: easy, medium, and difficult. Subsequently, fourteen supervised classification learning models were trained to classify, based on acoustic measurements, the degree of voice judgment difficulty. The Multinomial Regression, Multilayer Perceptron, and Random Forest models performed best for different vocal parameters. The findings demonstrate the potential of combining unsupervised and supervised methods to classify JPA difficulty, contributing to the creation of more objective and evidence-based training systems. The proposal provides support for the development of training simulators with progression based on the perceptual difficulty of voices, with a direct impact on training and clinical practice in Speech-Language Pathology.
Palavras-chave: Percepção auditiva
Acústica
Voz
Aprendizado de máquina
Fonoaudiologia
Auditory perception
Machine learning
Acoustics
Auditory training
Voice
Speech-language pathology
CNPq: CNPQ::CIENCIAS DA SAUDE::SAUDE COLETIVA
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Ciências Exatas e da Saúde
Programa: Programa de Pós-Graduação em Modelos de Decisão e Saúde
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/36575
Data do documento: 21-Jul-2025
Aparece nas coleções:Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Modelos de Decisão e Saúde

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MaxsuelAlvesAvelinoDePaiva_Tese.pdf2,54 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons