Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/34687
Registro completo de metadados
Campo DCValorIdioma
dc.creatorAguiar, Joelder Victor Antonino-
dc.date.accessioned2025-06-05T12:52:41Z-
dc.date.available2024-10-29-
dc.date.available2025-06-05T12:52:41Z-
dc.date.issued2024-10-22-
dc.identifier.urihttps://repositorio.ufpb.br/jspui/handle/123456789/34687-
dc.description.abstractSpeech emotion recognition has become an important area within affective com puting due to its application in systems aiming for more natural human-machine interac tions. This monograph presents the development of a system for recognizing emotions in Portuguese audio using deep neural networks, specifically Convolutional Neural Networks (CNN) and Long Short-Term Memory Networks (LSTM). The main challenge in automatic emotion recognition lies in the variability of emo tional expressions among individuals and cultures, in addition to the inherent difficulties in extracting and analyzing prosodic and acoustic features. The proposed methodology aims to overcome these limitations by utilizing the emoUERJ dataset, which contains Portuguese recordings expressing different emotions. Through the analysis of spectro grams and the use of signal processing techniques, the developed model was tested in both noise-free and noisy scenarios, achieving significant results. The experiments indicate that the combination of CNNs and LSTMs offers robust performance, allowing for the automatic extraction of relevant features directly from raw data. The proposed model demonstrates effectiveness in the task of emotion recognition in Portuguese speech.pt_BR
dc.description.provenanceSubmitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2025-06-05T12:52:41Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Joelder Victor Antonino Aguiar_TCC.pdf: 1076051 bytes, checksum: 6f2c84025fd91e9468fb8a27a2b72367 (MD5)en
dc.description.provenanceMade available in DSpace on 2025-06-05T12:52:41Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Joelder Victor Antonino Aguiar_TCC.pdf: 1076051 bytes, checksum: 6f2c84025fd91e9468fb8a27a2b72367 (MD5) Previous issue date: 2024-10-22en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Paraíbapt_BR
dc.rightsAcesso abertopt_BR
dc.rightsAttribution-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/br/*
dc.subjectReconhecimento de emoçõespt_BR
dc.subjectRedes neurais convulsionaispt_BR
dc.subjectRedes de memóriapt_BR
dc.subjectComputação afetivapt_BR
dc.titleReconhecimento de Emoções na Fala em Português usando Redes Neuraispt_BR
dc.typeTCCpt_BR
dc.contributor.advisor1Brito, Alisson Vasconcelos de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6321676636193625pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/0175601634959479pt_BR
dc.description.resumoOreconhecimento de emoções na fala tem se tornado uma área de grande relevância dentro da computação afetiva, devido à sua aplicação em sistemas que buscam interações mais naturais entre humanos e máquinas. Esta monografia apresenta o desenvolvimento de um sistema para o reconhecimento de emoções em áudios em português, utilizando técnicas de aprendizado de máquina com redes neurais profundas, especificamente redes neurais convolucionais (Convolutional Neural Networks- CNNs, do inglês) e redes de memória de curto e longo prazo (Long Short-Term Memory Networks- LSTM, do inglês). O principal desafio no reconhecimento automático de emoções reside na variabili dade das expressões emocionais entre indivíduos e culturas, além das dificuldades ineren tes à extração e análise de características prosódicas e acústicas. A metodologia proposta busca superar essas limitações com a utilização da base de dados emoUERJ, que contém gravações em português com expressões de diferentes emoções. A partir da análise de espectrogramas e do uso de técnicas de processamento de sinais, o modelo desenvolvido foi testado em cenários com e sem ruído, atingindo resultados significativos. Os experimentos realizados indicam que a combinação de CNNs e LSTMs oferece um desempenho robusto, permitindo a extração automática de características relevantes diretamente dos dados brutos, e demonstram a eficácia do modelo proposto na tarefa de reconhecimento de emoções na fala em português.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentComputação Científicapt_BR
dc.publisher.initialsUFPBpt_BR
dc.subject.cnpqCNPQ::OUTROSpt_BR
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Joelder Victor Antonino Aguiar_TCC.pdfTCC1,05 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons