Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/34699
Tipo: TCC
Título: Impacto da Variedade Instrumental na Performance de Modelos de Alinhamento ÁudioPartitura
Autor(es): Martins, Luiz Henrique Oliveira
Primeiro Orientador: Rêgo, Thaís Gaudencio do
Resumo: O alinhamento de áudio e partitura é uma área desafiadora do processamento de áudio, especialmente quando envolve uma ampla variedade de instrumentos e estilos. Este es tudo investiga o impacto da variedade instrumental no treinamento de modelos de alinha mento áudio-partitura utilizando Redes Neurais Siamesas (SNN) e Dynamic Time Warping (DTW). A hipótese central é que a diversidade de instrumentos no conjunto de dados de treinamento melhora a precisão e eficiência do alinhamento. Para testar essa hipótese, foram utilizadas bases de dados de áudio de diferentes instrumentos, incluindo bateria, violão, piano e flauta, e foram criados conjuntos separados para cada tipo de instrumento, além de um conjunto misto. Os modelos foram treinados e avaliados em cenários intra instrumental, inter-instrumental e misto. Os resultados indicaram que as características intra-instrumentais são mais relevantes para a generalização dos modelos, e que há degra dação de performance em bases inter-instrumentais diluídas, destacando a importância da qualidade de dados dentro do mesmo escopo instrumental. Modelos treinados puramente em bases de dados individuais apresentaram melhor desempenho em generalização para outros instrumentos e em cenários mistos.
Abstract: The alignment of audio with its score is a challenging area of audio processing, especially when it involves a wide variety of instruments and styles. This study investigates the impact of instrumental variety on the training of audio-to-score alignment models using Siamese Neural Networks (SNN) and Dynamic Time Warping (DTW). The central hypothesis is that the diversity of instruments in the training dataset improves the accuracy and effici ency of the alignment. To test this hypothesis, audio databases of different instruments, including drums, guitar, piano, and flute, were used, and separate datasets were created for each type of instrument, as well as a mixed dataset. The models were trained and evalu ated in intra-instrumental, inter-instrumental, and mixed scenarios. The results indicated that intra-instrumental characteristics are more relevant for model generalization and that there is a performance degradation in diluted inter-instrumental databases, highlighting the importance of data quality within the same instrumental scope. Models trained purely on individual databases showed better performance in generalizing to other instruments and in mixed scenarios.
Palavras-chave: Alinhamento áudio-partitura
Redes neurais siamesas
Dynamic time warping
Qualidade de dados
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/34699
Data do documento: 29-Jul-2024
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Luiz Henrique Oliveira Martins_TCC.pdfTCC1,24 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons