Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/32556Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Silva, Marcos André Bezerra da | - |
| dc.date.accessioned | 2024-11-22T18:46:08Z | - |
| dc.date.available | 2024-05-16 | - |
| dc.date.available | 2024-11-22T18:46:08Z | - |
| dc.date.issued | 2024-05-10 | - |
| dc.identifier.uri | https://repositorio.ufpb.br/jspui/handle/123456789/32556 | - |
| dc.description.abstract | The automatic translation from Portuguese to LIBRAS is extremely important for accessibility and inclusion of deaf individuals in society, but the scarcity of data and the high cost of building an authentic corpora pose significa challenges. Data Augmentation in Neural Machine Translation is the process of generating synthetic sentences to increase the quantity and diversity of the training set. This work investigates the use of data augmentation techniques to improve the performance of Portuguese-LIBRAS automatic translation using the BLEU metric. Among the techniques analyzed, back-translation and its combination with synonym substitution using part-of-speech tagging stood out as the most effective in enhancing the translation model and can be used increase the diversity of underrepresented datasets. | pt_BR |
| dc.description.provenance | Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-11-22T18:46:08Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5) | en |
| dc.description.provenance | Made available in DSpace on 2024-11-22T18:46:08Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Marcos André Bezerra da Silva_TCC.pdf: 1145313 bytes, checksum: e7e0894d9cef2c88fca1b95eed67885c (MD5) Previous issue date: 2024-05-10 | en |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal da Paraíba | pt_BR |
| dc.rights | Acesso aberto | pt_BR |
| dc.rights | Attribution-NoDerivs 3.0 Brazil | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/br/ | * |
| dc.subject | Tradução automática neural | pt_BR |
| dc.subject | Data augmentation | pt_BR |
| dc.subject | Libra | pt_BR |
| dc.subject | Métrica BLEU | pt_BR |
| dc.title | Uma Investigação sobre Técnicas de Data Augmentation Aplicadas a Tradução Automática Português-LIBRAS | pt_BR |
| dc.type | TCC | pt_BR |
| dc.contributor.advisor1 | Araújo, Tiago Maritan Ugulino de | - |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6347743344931103 | pt_BR |
| dc.creator.Lattes | http://lattes.cnpq.br/1045530229474974 | pt_BR |
| dc.description.resumo | A tradução automática de Português para LIBRAS é de suma importância para acessibilidade e inclusão de pessoas surdas na sociedade, porém a escassez de dados e o alto custo para construção de um corpus de sentenças autêntico são desafios significativos. Data augmentation em Tradução Automática Neur o processo de geração de sentenças sintéticas a fim de aumentar a quantidade diversidade do conjunto de treinamento. Este trabalho investiga o uso de técnicas de data augmentation para melhoria do desempenho da tradução automática Português-LIBRAS pela métrica BLEU. Dentre as técnicas analisadas, o back-translation e sua combinação com substituição por sinônimos com uso de part-of-speech tagging se destacaram como as mais eficazes na melhoria do modelo de tradução e podem ser utilizadas pa aumentar a diversidade de conjuntos sub-representados no corpus | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Computação Científica | pt_BR |
| dc.publisher.initials | UFPB | pt_BR |
| dc.subject.cnpq | CNPQ::OUTROS | pt_BR |
| Aparece nas coleções: | TCC - Ciência da Computação - CI | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Marcos André Bezerra da Silva_TCC.pdf | TCC | 1,12 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
