Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32556
Tipo: TCC
Título: Uma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRAS
Autor(es): Silva, Marcos André Bezerra da
Primeiro Orientador: Araújo, Tiago Maritan Ugulino de
Resumo: A tradução automática de Português para LIBRAS é de suma importância para acessibilidade e inclusão de pessoas surdas na sociedade, porém a escassez de dados e o alto custo para construção de um corpus de sentenças autêntico são desafios significativos. Data augmentation em Tradução Automática Neur o processo de geração de sentenças sintéticas a fim de aumentar a quantidade diversidade do conjunto de treinamento. Este trabalho investiga o uso de técnicas de data augmentation para melhoria do desempenho da tradução automática Português-LIBRAS pela métrica BLEU. Dentre as técnicas analisadas, o back-translation e sua combinação com substituição por sinônimos com uso de part-of-speech tagging se destacaram como as mais eficazes na melhoria do modelo de tradução e podem ser utilizadas pa aumentar a diversidade de conjuntos sub-representados no corpus
Abstract: The automatic translation from Portuguese to LIBRAS is extremely important for accessibility and inclusion of deaf individuals in society, but the scarcity of data and the high cost of building an authentic corpora pose significa challenges. Data Augmentation in Neural Machine Translation is the process of generating synthetic sentences to increase the quantity and diversity of the training set. This work investigates the use of data augmentation techniques to improve the performance of Portuguese-LIBRAS automatic translation using the BLEU metric. Among the techniques analyzed, back-translation and its combination with synonym substitution using part-of-speech tagging stood out as the most effective in enhancing the translation model and can be used increase the diversity of underrepresented datasets.
Palavras-chave: Tradução automática neural
Data augmentation
Libra
Métrica BLEU
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/32556
Data do documento: 10-Mai-2024
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Marcos André Bezerra da Silva_TCC.pdfTCC1,12 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons