Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/34699
Tipo: | TCC |
Título: | Impacto da Variedade Instrumental na Performance de Modelos de Alinhamento ÁudioPartitura |
Autor(es): | Martins, Luiz Henrique Oliveira |
Primeiro Orientador: | Rêgo, Thaís Gaudencio do |
Resumo: | O alinhamento de áudio e partitura é uma área desafiadora do processamento de áudio, especialmente quando envolve uma ampla variedade de instrumentos e estilos. Este es tudo investiga o impacto da variedade instrumental no treinamento de modelos de alinha mento áudio-partitura utilizando Redes Neurais Siamesas (SNN) e Dynamic Time Warping (DTW). A hipótese central é que a diversidade de instrumentos no conjunto de dados de treinamento melhora a precisão e eficiência do alinhamento. Para testar essa hipótese, foram utilizadas bases de dados de áudio de diferentes instrumentos, incluindo bateria, violão, piano e flauta, e foram criados conjuntos separados para cada tipo de instrumento, além de um conjunto misto. Os modelos foram treinados e avaliados em cenários intra instrumental, inter-instrumental e misto. Os resultados indicaram que as características intra-instrumentais são mais relevantes para a generalização dos modelos, e que há degra dação de performance em bases inter-instrumentais diluídas, destacando a importância da qualidade de dados dentro do mesmo escopo instrumental. Modelos treinados puramente em bases de dados individuais apresentaram melhor desempenho em generalização para outros instrumentos e em cenários mistos. |
Abstract: | The alignment of audio with its score is a challenging area of audio processing, especially when it involves a wide variety of instruments and styles. This study investigates the impact of instrumental variety on the training of audio-to-score alignment models using Siamese Neural Networks (SNN) and Dynamic Time Warping (DTW). The central hypothesis is that the diversity of instruments in the training dataset improves the accuracy and effici ency of the alignment. To test this hypothesis, audio databases of different instruments, including drums, guitar, piano, and flute, were used, and separate datasets were created for each type of instrument, as well as a mixed dataset. The models were trained and evalu ated in intra-instrumental, inter-instrumental, and mixed scenarios. The results indicated that intra-instrumental characteristics are more relevant for model generalization and that there is a performance degradation in diluted inter-instrumental databases, highlighting the importance of data quality within the same instrumental scope. Models trained purely on individual databases showed better performance in generalizing to other instruments and in mixed scenarios. |
Palavras-chave: | Alinhamento áudio-partitura Redes neurais siamesas Dynamic time warping Qualidade de dados |
CNPq: | CNPQ::OUTROS |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Departamento: | Computação Científica |
Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/34699 |
Data do documento: | 29-Jul-2024 |
Aparece nas coleções: | TCC - Ciência da Computação - CI |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Luiz Henrique Oliveira Martins_TCC.pdf | TCC | 1,24 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons