Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/31730
Tipo: TCC
Título: Desenvolvimento de um Componente de Sumarização de Sentenças em Português para Uso em Acessibilidade Digital
Autor(es): Ferreira, Rebeca de Macêdo
Primeiro Orientador: Araújo, Tiago Maritan Ugulino de
Resumo: Sumarizar textos é torná-los menores mantendo todas as suas informações importantes de maneira coerente. Alguns experimentos descritos na literatura científica mostram que uma pessoa fala em média quatro palavras por segundo, enquanto que um intérprete é capaz de sinalizar apenas dois sinais neste mesmo intervalo de tempo. No contexto de tradução/interpretação para língua de sinais em vídeos, portanto, existe a necessidade de se extrair da fala apenas as palavras mais importantes a serem interpretadas para que os tempos entre a fala e a interpretação em língua de sinais sejam similares. Considerando este tipo de problema, neste trabalho é apresentada uma análise e solução para sumarização automática extrativa de textos em português, de modo que seja possível aplicá-la, futuramente, em traduções automáticas para Libras. Para isso, utilizou-se Redes de Deep Learning e um conjunto de dados em inglês. Fazendo uso da métrica ROUGE-1, o modelo apresentou média de 66% de acurácia em geração de resumos de um conjunto de testes. Foi realizado testes com usuários aleatórios para avaliar a compreensão e naturalidade dos resumos em língua portuguesa obtidos com o sumarizador automático em conjunto com um tradutor automático.
Abstract: Summarizing texts means making them smaller while keeping all the important information coherent. Some experiments described in scientific literature show that a person speaks an average of four words per second, while an interpreter is capable of signaling only two signals in the same time interval. In the context of translation/interpretation into sign language in videos, therefore, there is a need to extract from speech only the most important words to be interpreted so that the times between speech and interpretation in sign language are similar. Considering this type of problem, this work presents an analysis and solution for automatic extractive summarization of texts in Portuguese, so that it is possible to apply it, in the future, in automatic translations into Libras. For this, Deep Learning Networks and a dataset in English were used. Using the ROUGE-1 metric, the model presented an average of 66% accuracy in generating summaries of a set of tests. Tests were carried out with random users to evaluate the understanding and naturalness of the summaries in Portuguese obtained with the automatic summarizer in conjunction with an automatic translator.
Palavras-chave: Sumarização
Deep Learning
Libras
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/31730
Data do documento: 6-Nov-2023
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Rebeca de Macêdo Ferreira_TCC.pdfTCC1,23 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons