Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32556
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSilva, Marcos André Bezerra da-
dc.date.accessioned2024-11-22T18:46:08Z-
dc.date.available2024-05-16-
dc.date.available2024-11-22T18:46:08Z-
dc.date.issued2024-05-10-
dc.identifier.urihttps://repositorio.ufpb.br/jspui/handle/123456789/32556-
dc.description.abstractThe automatic translation from Portuguese to LIBRAS is extremely important for accessibility and inclusion of deaf individuals in society, but the scarcity of data and the high cost of building an authentic corpora pose significa challenges. Data Augmentation in Neural Machine Translation is the process of generating synthetic sentences to increase the quantity and diversity of the training set. This work investigates the use of data augmentation techniques to improve the performance of Portuguese-LIBRAS automatic translation using the BLEU metric. Among the techniques analyzed, back-translation and its combination with synonym substitution using part-of-speech tagging stood out as the most effective in enhancing the translation model and can be used increase the diversity of underrepresented datasets.pt_BR
dc.description.provenanceSubmitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-11-22T18:46:08Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5)en
dc.description.provenanceMade available in DSpace on 2024-11-22T18:46:08Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5) Previous issue date: 2024-05-10en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Paraíbapt_BR
dc.rightsAcesso abertopt_BR
dc.rightsAttribution-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/br/*
dc.subjectTradução automática neuralpt_BR
dc.subjectData augmentationpt_BR
dc.subjectLibrapt_BR
dc.subjectMétrica BLEUpt_BR
dc.titleUma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRASpt_BR
dc.typeTCCpt_BR
dc.contributor.advisor1Araújo, Tiago Maritan Ugulino de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6347743344931103pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1045530229474974pt_BR
dc.description.resumoA tradução automática de Português para LIBRAS é de suma importância para acessibilidade e inclusão de pessoas surdas na sociedade, porém a escassez de dados e o alto custo para construção de um corpus de sentenças autêntico são desafios significativos. Data augmentation em Tradução Automática Neur o processo de geração de sentenças sintéticas a fim de aumentar a quantidade diversidade do conjunto de treinamento. Este trabalho investiga o uso de técnicas de data augmentation para melhoria do desempenho da tradução automática Português-LIBRAS pela métrica BLEU. Dentre as técnicas analisadas, o back-translation e sua combinação com substituição por sinônimos com uso de part-of-speech tagging se destacaram como as mais eficazes na melhoria do modelo de tradução e podem ser utilizadas pa aumentar a diversidade de conjuntos sub-representados no corpuspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentComputação Científicapt_BR
dc.publisher.initialsUFPBpt_BR
dc.subject.cnpqCNPQ::OUTROSpt_BR
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Marcos André Bezerra da Silva_TCC.pdfTCC1,12 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons