Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/37347| Tipo: | Dissertação |
| Título: | Modelos de aprendizado de máquina para a predição do estágio de prontidão para terapia de voz |
| Autor(es): | Soares, Maria Júlia Galindo |
| Orientador: | Almeida, Anna Alice Figueirêdo de |
| Orientador: | Silva, Ana Hermínia Andrade e |
| Orientador: | Ferreira, Marcelo Rodrigo Portela |
| Orientador: | Lopes, Leonardo Wanderley |
| Orientador: | Teixeira, Leticia Caldas |
| Resumo: | A avaliação da voz é multidimensional por abordar diversos aspectos, como os principais métodos de avaliação: o julgamento perceptivo-auditivo (JPA), a avaliação acústica, a avaliação laringológica e a autoavaliação. Esta última contempla a perspectiva do paciente e proporciona informações da vivência sobre sintomas, impactos na qualidade de vida e aspectos cognitivos comportamentais relativos à voz. O estágio de prontidão para terapia de voz surge nesse contexto e reflete a disposição do paciente em adotar mudanças que contribuam para o seu comportamento vocal. Identificar o estágio do indivíduo permite uma intervenção mais direcionada e eficaz. Ademais, a utilização de modelos de aprendizado de máquina (AM) para a predição dos estágios de prontidão representa uma inovação para agregar a tomada de decisão clínica na área de avaliação e tratamento de disfonia. Desta forma, o objetivo desta pesquisa é avaliar e comparar o desempenho de modelos de AM para predição do estágio de prontidão para terapia fonoaudiológica de voz. Trata-se de um estudo observacional, analítico e quantitativo, de delineamento transversal, conduzido a partir da análise retrospectiva de dados clínicos, com aplicação de modelos preditivos de AM para predição do estágio de prontidão. As fontes de dados para alimentar os modelos foram obtidas da avaliação fonoaudiológica e da avaliação laringológica iniciais de pacientes, de ambos os sexos, que buscam atendimento no Laboratório Integrado de Estudos da Voz, da Universidade Federal da Paraíba. Foram extraídos os dados do Protocolo de Anamnese e Avaliação Vocal e a Escala University of Rhode Island Change Assessment - Voice Validated, do Índice de Desvantagem Vocal, das Escalas de Qualidade de Vida em Voz, Sintomas Vocais e de Desconforto do Trato Vocal e dos dados do JPA, da acústica e do diagnóstico laríngeo. A amostra foi composta por 236 indivíduos, divididos em dois grupos dos estágios de prontidão: contemplação e manutenção. Foi realizada a análise estatística descritiva das variáveis quantitativas e qualitativas e foram testados algoritmos de AM supervisionado: regressão logística, k-nearest neighbors (KNN), naive bayes, árvore de decisão e floresta aleatória. O desempenho dos modelos foi avaliado por meio de acurácia, sensibilidade, especificidade, entre outras medidas. Os resultados indicam que os modelos KNN e Floresta Aleatória apresentaram melhor desempenho nos dados da anamnese. Para os dados do JPA, diagnóstico laríngeo e classificação da disfonia, os modelos Regressão Logística e Naive Bayes demonstraram desempenho balanceado entre sensibilidade e especificidade. Nos dados dos instrumentos de autoavaliação e das medidas acústicas, os modelos apresentaram desempenho inferior. Nos modelos com dados combinados das diferentes dimensões da avaliação vocal, o KNN se destacou, apresentando alta acurácia. Embora ainda apresentem limitações em seu poder preditivo, esses achados sugerem que os modelos de AM possuem potencial para contribuir na identificação do estágio de prontidão, possibilitando estratégias de intervenção mais direcionadas na terapia de voz. |
| Abstract: | Voice assessment is multidimensional as it addresses various aspects, including the main evaluation methods: perceptual-auditory judgment (PAJ), acoustic assessment, laryngological evaluation, and self-assessment. The latter encompasses the patient’s perspective and provides information on the experience of symptoms, impacts on quality of life, and cognitive-behavioral aspects related to voice. The stage of readiness for voice therapy emerges in this context and reflects the patient’s willingness to adopt changes that contribute to their vocal behavior. Identifying the individual’s stage allows for a more targeted and effective intervention. Moreover, the use of machine learning (ML) models to predict stages of readiness represents an innovation to support clinical decision-making in the evaluation and treatment of dysphonia. The objective of this research is to evaluate and compare the performance of ML models for predicting the stage of readiness for speech-language voice therapy. This is an observational, analytical, and quantitative study with a cross-sectional design, conducted through the retrospective analysis of clinical data, applying predictive ML models to predict the stage of readiness. The data sources for the models were obtained from the initial speech-language and laryngological assessments of patients of both sexes seeking care at the Integrated Voice Studies Laboratory of the Federal University of Paraíba. Data were extracted from the Anamnesis and Vocal Assessment Protocol, the University of Rhode Island Change Assessment – Voice Validated Scale, the Vocal Handicap Index, the Voice-Related Quality of Life Scales, Vocal Symptoms and Vocal Tract Discomfort Scales, and from PAJ, acoustic measures, and laryngological diagnosis. The sample comprised 236 individuals, divided into two readiness stage groups: contemplation and maintenance. Descriptive statistical analysis was performed for quantitative and qualitative variables, and supervised ML algorithms were tested, including logistic regression, k-nearest neighbors (KNN), naive Bayes, decision tree, and random forest. Model performance was evaluated through accuracy, sensitivity, specificity, among other measures. Results indicate that the KNN and Random Forest models performed best with the anamnesis data. For PAJ data, laryngological diagnosis, and dysphonia classification, the Logistic Regression and Naive Bayes models demonstrated balanced performance between sensitivity and specificity. For self-assessment instruments and acoustic measures, the models showed lower performance. In models combining data from different dimensions of voice assessment, KNN stood out, presenting high accuracy. Although still limited in predictive power, these findings suggest that ML models have the potential to contribute to identifying the stage of readiness, enabling more targeted intervention strategies in voice therapy. |
| Palavras-chave: | Modelo transteórico Voz Disfonia Fonoaudiologia Aprendizado de máquina Transtheoretical model Voice Dysphonia Speech therapy Machine learning |
| CNPq: | CNPQ::CIENCIAS DA SAUDE::SAUDE COLETIVA |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal da Paraíba |
| Sigla da Instituição: | UFPB |
| Departamento: | Ciências Exatas e da Saúde |
| Programa: | Programa de Pós-Graduação em Modelos de Decisão e Saúde |
| Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
| URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
| URI: | https://repositorio.ufpb.br/jspui/handle/123456789/37347 |
| Data do documento: | 25-Ago-2025 |
| Aparece nas coleções: | Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Modelos de Decisão e Saúde |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| MariaJúliaGalindoSoares_Dissert.pdf | 5,06 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
