Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/28793
Tipo: | Artigo de Periódico |
Título: | Um conjunto de dados extraído do Twitter para análise de sentimentos na língua portuguesa |
Autor(es): | Silva, Ewerton Paulo da |
Resumo: | A grande quantidade de dados gerada por usuarios nas redes sociais ´ tem despertado cada vez mais o interesse na analise das opini ´ oes e sentimen- ˜ tos que estao sendo expressados. Para isso, uma das t ˜ ecnicas mais utilizadas ´ e´ a aprendizagem de maquina, que precisa de grandes conjuntos de dados para ´ funcionar adequadamente. Entretanto, na l´ıngua portuguesa, poucos conjuntos de dados para esse fim estao dispon ˜ ´ıveis, limitando o desenvolvimento de aplicac¸oes nesse idioma. Com isso, este trabalho tem como objetivo a coleta ˜ de mensagens do Twitter e a classificac¸ao do sentimento delas para criac¸ ˜ ao de ˜ um conjunto de dados para a analise de sentimentos. Volunt ´ arios rotularam ´ 2.787 mensagens que estao disponibilizadas publicamente. Utilizando os dados ˜ coletados, conseguiu-se 0,4503 de acuracia m ´ edia atrav ´ es de aprendizagem de ´ maquina, resultado superior aos 0,3523 de acur ´ acia m ´ edia usando o lexicon ´ SenticNet. |
Abstract: | The large amount of data generated by users on social networks has attracted increasing interest in the analysis of the opinions and feelings that are being expressed. For this, one of the most widely used techniques is machine learning, which needs large datasets to work properly. However, in Portuguese, few datasets for this purpose are available, limiting the development of applications in that language. Therefore, this work aims to collect messages from Twitter and to classify their feelings to create a dataset for sentiment analysis. Volunteers labeled 2787 messages that are publicly available. Using the dataset, we achieved 0.4503 average accuracy through machine learning, a result higher than the 0.3523 average accuracy using the SenticNet lexicon. |
Palavras-chave: | |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/28793 |
Data do documento: | 18-Set-2019 |
Aparece nas coleções: | TCC - Sistemas de Informação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
EwertonPaulodaSilva_TCC.pdf | TCC | 202,45 kB | Adobe PDF | Visualizar/Abrir |
EwertonPaulodaSilva_TERMO.pdf | TERMO | 531,16 kB | Adobe PDF | Visualizar/Abrir Solicitar uma cópia |
Este item está licenciada sob uma
Licença Creative Commons