Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/28793
Tipo: Artigo de Periódico
Título: Um conjunto de dados extraído do Twitter para análise de sentimentos na língua portuguesa
Autor(es): Silva, Ewerton Paulo da
Resumo: A grande quantidade de dados gerada por usuarios nas redes sociais ´ tem despertado cada vez mais o interesse na analise das opini ´ oes e sentimen- ˜ tos que estao sendo expressados. Para isso, uma das t ˜ ecnicas mais utilizadas ´ e´ a aprendizagem de maquina, que precisa de grandes conjuntos de dados para ´ funcionar adequadamente. Entretanto, na l´ıngua portuguesa, poucos conjuntos de dados para esse fim estao dispon ˜ ´ıveis, limitando o desenvolvimento de aplicac¸oes nesse idioma. Com isso, este trabalho tem como objetivo a coleta ˜ de mensagens do Twitter e a classificac¸ao do sentimento delas para criac¸ ˜ ao de ˜ um conjunto de dados para a analise de sentimentos. Volunt ´ arios rotularam ´ 2.787 mensagens que estao disponibilizadas publicamente. Utilizando os dados ˜ coletados, conseguiu-se 0,4503 de acuracia m ´ edia atrav ´ es de aprendizagem de ´ maquina, resultado superior aos 0,3523 de acur ´ acia m ´ edia usando o lexicon ´ SenticNet.
Abstract: The large amount of data generated by users on social networks has attracted increasing interest in the analysis of the opinions and feelings that are being expressed. For this, one of the most widely used techniques is machine learning, which needs large datasets to work properly. However, in Portuguese, few datasets for this purpose are available, limiting the development of applications in that language. Therefore, this work aims to collect messages from Twitter and to classify their feelings to create a dataset for sentiment analysis. Volunteers labeled 2787 messages that are publicly available. Using the dataset, we achieved 0.4503 average accuracy through machine learning, a result higher than the 0.3523 average accuracy using the SenticNet lexicon.
Palavras-chave: Twitter
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/28793
Data do documento: 18-Set-2019
Aparece nas coleções:TCC - Sistemas de Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
EwertonPaulodaSilva_TCC.pdfTCC202,45 kBAdobe PDFVisualizar/Abrir
EwertonPaulodaSilva_TERMO.pdfTERMO531,16 kBAdobe PDFVisualizar/Abrir    Solicitar uma cópia


Este item está licenciada sob uma Licença Creative Commons Creative Commons