Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/33691
Tipo: Dissertação
Título: Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
Autor(es): Medeiros, Isaac Emmanuel Azevedo de
Primeiro Orientador: Villanueva, Juan Moises Mauricio
Resumo: A análise do conteúdo de alarmes industriais é de suma importância para a detecção e prevenção de falhas em processos operacionais. Os alarmes funcionam como um sistema de alerta, sinalizando à equipe de operação sobre condições anormais e potenciais falhas em tempo real. Entretanto, a geração excessiva de registros por parte dos sistemas pode dificultar a identificação e a resposta eficaz diante de situações críticas. Por isso, torna-se imprescindível o desenvolvimento de uma gestão eficiente dos alarmes, a fim de priorizá-los e agrupá-los de maneira inteligente. Além disso, ao realizar uma análise minuciosa dos dados de alarmes industriais, é possível obter um entendimento mais aprofundado das condições operacionais, reconhecer padrões recorrentes e identificar tendências, além de agir de forma proativa para evitar falhas. Neste estudo, foram coletados e utilizados dados de eventos e alarmes extraídos do sistema SCADA (Supervisory Control and Data Acquisition) de uma usina termoelétrica situada no estado da Paraíba. Realizou-se uma análise exploratória, a fim de entender os impactos operacionais causados pela volumetria dos alarmes e, para estes e seus respectivos clusters, buscar padrões envolvendo sequências temporais, que podem sugerir causalidade, bem como auxiliar na determinação de causas raiz para determinados registros. Técnicas de processamento de linguagem natural (PLN) foram utilizadas no pré-processamento dos textos dos alarmes para generalizar informações, eliminando identificadores de equipamentos e elementos com baixa relevância semântica. Foi utilizado o modelo de linguagem BERT (Bidirectional Encoder Representations from Transformers) para a representação numérica do texto, e aplicadas técnicas de clusterização e classificação para o agrupamento eficiente dos alarmes. Por meio da clusterização das mensagens dos alarmes, utilizando o algoritmo K-means, com os os clusters obtidos, aplicou-se o algoritmo de classificação Support Vector Classifier (SVM) com kernel linear, alcançando uma acurácia superior a 99% no conjunto de dados de teste. Foi possível, portanto, rotular uma nova amostra com eficiência considerável. A utilização do BERT para transformar as mensagens dos alarmes em embeddings bem como o pré-processamento de texto contribuíram diretamente para os resultados obtidos. A abordagem realizada nesse trabalho não apenas permite melhorar a gestão dos alarmes, como também contribui para um ambiente operacional mais seguro e eficiente, o que é fundamental para a sustentabilidade e a produtividade da indústria.
Abstract: The analysis of industrial alarm content is of utmost importance for the detection and prevention of failures in operational processes. Alarms function as an alert system, signaling the operations team about abnormal conditions and potential failures in real-time. However, the excessive generation of records by these systems can hinder the identification and effective response to critical situations. Therefore, it is essential to develop efficient alarm management, aiming to prioritize and intelligently group alarms. Additionally, by conducting a thorough analysis of industrial alarm data, it is possible to gain a deeper understanding of operational conditions, recognize recurring patterns, identify trends, and take proactive measures to prevent failures. In this study, event and alarm data were collected and used from the SCADA (Supervisory Control and Data Acquisition) system of a thermoelectric plant located in the state of Paraíba. An exploratory analysis was conducted to understand the operational impacts caused by the volume of alarms, and for these alarms and their respective clusters, patterns involving temporal sequences were sought, which may suggest causality and assist in determining root causes for specific records. Natural language processing (NLP) techniques were used in the preprocessing of alarm texts to generalize information, eliminating equipment identifiers and elements with low semantic relevance. The BERT (Bidirectional Encoder Representations from Transformers) language model was used for the numerical representation of the text, and clustering and classification techniques were applied for the efficient grouping of alarms. By clustering alarm messages using the K-means algorithm, and with the obtained clusters, the Support Vector Classifier (SVM) algorithm with a linear kernel was applied, achieving an accuracy greater than 99% on the test dataset. It was thus possible to label a new sample with considerable efficiency. The use of BERT to transform alarm messages into embeddings, as well as the text preprocessing, directly contributed to the results obtained. The approach taken in this work not only improves alarm management but also contributes to a safer and more efficient operational environment, which is essential for the sustainability and productivity of the industry.
Palavras-chave: Alarmes industriais
Incorporação de palavras
Gerenciamento de alarmes
Industrial Alarms
Alarm Management
Clustering
Classification
Natural Language Processing
Word embedding
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Engenharia Elétrica
Programa: Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/33691
Data do documento: 30-Jul-2024
Aparece nas coleções:Centro de Energias Alternativas e Renováveis (CEAR) - Programa de Pós-Graduação em Engenharia Elétrica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
IsaacEmmanuelAzevêdoDeMedeiros_Dissert.pdf6,74 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons