Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/34687
Tipo: TCC
Título: Reconhecimento de Emoções na Fala em Português usando Redes Neurais
Autor(es): Aguiar, Joelder Victor Antonino
Primeiro Orientador: Brito, Alisson Vasconcelos de
Resumo: Oreconhecimento de emoções na fala tem se tornado uma área de grande relevância dentro da computação afetiva, devido à sua aplicação em sistemas que buscam interações mais naturais entre humanos e máquinas. Esta monografia apresenta o desenvolvimento de um sistema para o reconhecimento de emoções em áudios em português, utilizando técnicas de aprendizado de máquina com redes neurais profundas, especificamente redes neurais convolucionais (Convolutional Neural Networks- CNNs, do inglês) e redes de memória de curto e longo prazo (Long Short-Term Memory Networks- LSTM, do inglês). O principal desafio no reconhecimento automático de emoções reside na variabili dade das expressões emocionais entre indivíduos e culturas, além das dificuldades ineren tes à extração e análise de características prosódicas e acústicas. A metodologia proposta busca superar essas limitações com a utilização da base de dados emoUERJ, que contém gravações em português com expressões de diferentes emoções. A partir da análise de espectrogramas e do uso de técnicas de processamento de sinais, o modelo desenvolvido foi testado em cenários com e sem ruído, atingindo resultados significativos. Os experimentos realizados indicam que a combinação de CNNs e LSTMs oferece um desempenho robusto, permitindo a extração automática de características relevantes diretamente dos dados brutos, e demonstram a eficácia do modelo proposto na tarefa de reconhecimento de emoções na fala em português.
Abstract: Speech emotion recognition has become an important area within affective com puting due to its application in systems aiming for more natural human-machine interac tions. This monograph presents the development of a system for recognizing emotions in Portuguese audio using deep neural networks, specifically Convolutional Neural Networks (CNN) and Long Short-Term Memory Networks (LSTM). The main challenge in automatic emotion recognition lies in the variability of emo tional expressions among individuals and cultures, in addition to the inherent difficulties in extracting and analyzing prosodic and acoustic features. The proposed methodology aims to overcome these limitations by utilizing the emoUERJ dataset, which contains Portuguese recordings expressing different emotions. Through the analysis of spectro grams and the use of signal processing techniques, the developed model was tested in both noise-free and noisy scenarios, achieving significant results. The experiments indicate that the combination of CNNs and LSTMs offers robust performance, allowing for the automatic extraction of relevant features directly from raw data. The proposed model demonstrates effectiveness in the task of emotion recognition in Portuguese speech.
Palavras-chave: Reconhecimento de emoções
Redes neurais convulsionais
Redes de memória
Computação afetiva
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/34687
Data do documento: 22-Out-2024
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Joelder Victor Antonino Aguiar_TCC.pdfTCC1,05 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons