Uma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRAS

Silva, Marcos André Bezerra da

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32556

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Silva, Marcos André Bezerra da	-
dc.date.accessioned	2024-11-22T18:46:08Z	-
dc.date.available	2024-05-16	-
dc.date.available	2024-11-22T18:46:08Z	-
dc.date.issued	2024-05-10	-
dc.identifier.uri	https://repositorio.ufpb.br/jspui/handle/123456789/32556	-
dc.description.abstract	The automatic translation from Portuguese to LIBRAS is extremely important for accessibility and inclusion of deaf individuals in society, but the scarcity of data and the high cost of building an authentic corpora pose significa challenges. Data Augmentation in Neural Machine Translation is the process of generating synthetic sentences to increase the quantity and diversity of the training set. This work investigates the use of data augmentation techniques to improve the performance of Portuguese-LIBRAS automatic translation using the BLEU metric. Among the techniques analyzed, back-translation and its combination with synonym substitution using part-of-speech tagging stood out as the most effective in enhancing the translation model and can be used increase the diversity of underrepresented datasets.	pt_BR
dc.description.provenance	Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-11-22T18:46:08Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5)	en
dc.description.provenance	Made available in DSpace on 2024-11-22T18:46:08Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5) Previous issue date: 2024-05-10	en
dc.language	por	pt_BR
dc.publisher	Universidade Federal da Paraíba	pt_BR
dc.rights	Acesso aberto	pt_BR
dc.rights	Attribution-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nd/3.0/br/	*
dc.subject	Tradução automática neural	pt_BR
dc.subject	Data augmentation	pt_BR
dc.subject	Libra	pt_BR
dc.subject	Métrica BLEU	pt_BR
dc.title	Uma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRAS	pt_BR
dc.type	TCC	pt_BR
dc.contributor.advisor1	Araújo, Tiago Maritan Ugulino de	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6347743344931103	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/1045530229474974	pt_BR
dc.description.resumo	A tradução automática de Português para LIBRAS é de suma importância para acessibilidade e inclusão de pessoas surdas na sociedade, porém a escassez de dados e o alto custo para construção de um corpus de sentenças autêntico são desafios significativos. Data augmentation em Tradução Automática Neur o processo de geração de sentenças sintéticas a fim de aumentar a quantidade diversidade do conjunto de treinamento. Este trabalho investiga o uso de técnicas de data augmentation para melhoria do desempenho da tradução automática Português-LIBRAS pela métrica BLEU. Dentre as técnicas analisadas, o back-translation e sua combinação com substituição por sinônimos com uso de part-of-speech tagging se destacaram como as mais eficazes na melhoria do modelo de tradução e podem ser utilizadas pa aumentar a diversidade de conjuntos sub-representados no corpus	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Computação Científica	pt_BR
dc.publisher.initials	UFPB	pt_BR
dc.subject.cnpq	CNPQ::OUTROS	pt_BR
Aparece nas coleções:	TCC - Ciência da Computação - CI

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Marcos André Bezerra da Silva_TCC.pdf	TCC	1,12 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons

Repositório Institucional da UFPB