Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/31582
Tipo: TCC
Título: Um estudo sobre ferramentas de código aberto para carga de dados de documentos fiscais eletrônicos
Autor(es): Moura Neto, Genival José de
Primeiro Orientador: Kulesza, Raoni
Resumo: Este trabalho levantou o estado da técnica na área de extração, carga e transformação de dados e analisou duas alternativas de código-fonte aberto: LoaderNFE e Airbyte. A primeira é composta de várias ferramentas e atualmente realiza o processo de ETL no projeto da Plataforma de Integração de Dados da SEFAZ-PB de modo não automatizado. A segunda propõe uma alternativa baseada em processos ELT e possui uma interface Web para operação e automação de algumas tarefas. Adicionalmente, as duas ferramentas foram avaliadas no ambiente da SEFAZ-PB para extração, transformação e carga de 33 lotes de notas fiscais eletrônicas do consumidor, cada um com 125.000 documentos. O objetivo foi avaliar as principais diferenças de configuração e operação entre as abordagens e realizar um estudo comparativo de desempenho para verificar a viabilidade de utilizar o Airbyte para realização de sincronismo diário entre a base operacional da SEFAZ-PB e a Plataforma de Integração de Dados. Os resultados obtidos indicam que o Airbyte pode ser utilizado em cenários que requerem uma sincronização automática e mais frequente entre fontes e destinos de dados, mesmo sendo mais lento que o LoaderNFE.
Abstract: This work raised the state of the art in the area of data extraction, loading and transformation and analysis of two open-source code alternatives: LoaderNFE and Airbyte. At first, it composts various tools and currently performs the ETL process of the SEFAZ-PB Data Integration Platform project in a non-automated way. Secondly, it proposes an alternative based on ELT processes and has a Web interface for the operation and automation of some tasks. Additionally, the two tools are endorsed in the environment of SEFAZ-PB for extraction, transformation and loading of 33 batches of consumer electronic tax notes, each with 125,000 documents. The objective was to assess the main differences in configuration and operation between the approaches and carry out a comparative study of performance to verify the feasibility of using Airbyte to perform daily synchronization between the operational base of SEFAZ-PB and the Data Integration Platform. The results obtained indicate that Airbyte can be used in scenarios that require an automatic and more frequent synchronization between data sources and destinations, even being slower than LoaderNFE.
Palavras-chave: Dados
Big data
ELT
Código aberto
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/31582
Data do documento: 30-Jun-2022
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Genival José de Moura Neto - TCC.pdfTCC3,71 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons