Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/32556| Tipo: | TCC |
| Título: | Uma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRAS |
| Autor(es): | Silva, Marcos André Bezerra da |
| Primeiro Orientador: | Araújo, Tiago Maritan Ugulino de |
| Resumo: | A tradução automática de Português para LIBRAS é de suma importância para acessibilidade e inclusão de pessoas surdas na sociedade, porém a escassez de dados e o alto custo para construção de um corpus de sentenças autêntico são desafios significativos. Data augmentation em Tradução Automática Neur o processo de geração de sentenças sintéticas a fim de aumentar a quantidade diversidade do conjunto de treinamento. Este trabalho investiga o uso de técnicas de data augmentation para melhoria do desempenho da tradução automática Português-LIBRAS pela métrica BLEU. Dentre as técnicas analisadas, o back-translation e sua combinação com substituição por sinônimos com uso de part-of-speech tagging se destacaram como as mais eficazes na melhoria do modelo de tradução e podem ser utilizadas pa aumentar a diversidade de conjuntos sub-representados no corpus |
| Abstract: | The automatic translation from Portuguese to LIBRAS is extremely important for accessibility and inclusion of deaf individuals in society, but the scarcity of data and the high cost of building an authentic corpora pose significa challenges. Data Augmentation in Neural Machine Translation is the process of generating synthetic sentences to increase the quantity and diversity of the training set. This work investigates the use of data augmentation techniques to improve the performance of Portuguese-LIBRAS automatic translation using the BLEU metric. Among the techniques analyzed, back-translation and its combination with synonym substitution using part-of-speech tagging stood out as the most effective in enhancing the translation model and can be used increase the diversity of underrepresented datasets. |
| Palavras-chave: | Tradução automática neural Data augmentation Libra Métrica BLEU |
| CNPq: | CNPQ::OUTROS |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal da Paraíba |
| Sigla da Instituição: | UFPB |
| Departamento: | Computação Científica |
| Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
| URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
| URI: | https://repositorio.ufpb.br/jspui/handle/123456789/32556 |
| Data do documento: | 10-Mai-2024 |
| Aparece nas coleções: | TCC - Ciência da Computação - CI |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Marcos André Bezerra da Silva_TCC.pdf | TCC | 1,12 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
