Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/34687| Tipo: | TCC |
| Título: | Reconhecimento de Emoções na Fala em Português usando Redes Neurais |
| Autor(es): | Aguiar, Joelder Victor Antonino |
| Primeiro Orientador: | Brito, Alisson Vasconcelos de |
| Resumo: | Oreconhecimento de emoções na fala tem se tornado uma área de grande relevância dentro da computação afetiva, devido à sua aplicação em sistemas que buscam interações mais naturais entre humanos e máquinas. Esta monografia apresenta o desenvolvimento de um sistema para o reconhecimento de emoções em áudios em português, utilizando técnicas de aprendizado de máquina com redes neurais profundas, especificamente redes neurais convolucionais (Convolutional Neural Networks- CNNs, do inglês) e redes de memória de curto e longo prazo (Long Short-Term Memory Networks- LSTM, do inglês). O principal desafio no reconhecimento automático de emoções reside na variabili dade das expressões emocionais entre indivíduos e culturas, além das dificuldades ineren tes à extração e análise de características prosódicas e acústicas. A metodologia proposta busca superar essas limitações com a utilização da base de dados emoUERJ, que contém gravações em português com expressões de diferentes emoções. A partir da análise de espectrogramas e do uso de técnicas de processamento de sinais, o modelo desenvolvido foi testado em cenários com e sem ruído, atingindo resultados significativos. Os experimentos realizados indicam que a combinação de CNNs e LSTMs oferece um desempenho robusto, permitindo a extração automática de características relevantes diretamente dos dados brutos, e demonstram a eficácia do modelo proposto na tarefa de reconhecimento de emoções na fala em português. |
| Abstract: | Speech emotion recognition has become an important area within affective com puting due to its application in systems aiming for more natural human-machine interac tions. This monograph presents the development of a system for recognizing emotions in Portuguese audio using deep neural networks, specifically Convolutional Neural Networks (CNN) and Long Short-Term Memory Networks (LSTM). The main challenge in automatic emotion recognition lies in the variability of emo tional expressions among individuals and cultures, in addition to the inherent difficulties in extracting and analyzing prosodic and acoustic features. The proposed methodology aims to overcome these limitations by utilizing the emoUERJ dataset, which contains Portuguese recordings expressing different emotions. Through the analysis of spectro grams and the use of signal processing techniques, the developed model was tested in both noise-free and noisy scenarios, achieving significant results. The experiments indicate that the combination of CNNs and LSTMs offers robust performance, allowing for the automatic extraction of relevant features directly from raw data. The proposed model demonstrates effectiveness in the task of emotion recognition in Portuguese speech. |
| Palavras-chave: | Reconhecimento de emoções Redes neurais convulsionais Redes de memória Computação afetiva |
| CNPq: | CNPQ::OUTROS |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal da Paraíba |
| Sigla da Instituição: | UFPB |
| Departamento: | Computação Científica |
| Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
| URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
| URI: | https://repositorio.ufpb.br/jspui/handle/123456789/34687 |
| Data do documento: | 22-Out-2024 |
| Aparece nas coleções: | TCC - Ciência da Computação - CI |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Joelder Victor Antonino Aguiar_TCC.pdf | TCC | 1,05 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
