Please use this identifier to cite or link to this item: https://repositorio.ufpb.br/jspui/handle/123456789/11849
metadata.dc.type: Tese
Title: Análise discriminante linear em duas dimensões para classificação de dados químicos de segunda ordem
metadata.dc.creator: Silva, Adenilton Camilo da
metadata.dc.contributor.advisor1: Araújo, Mário Cesar Ugulino de
metadata.dc.description.resumo: Com os avanços na instrumentação analítica tem sido cada vez mais comum a obtenção de dados de segunda ordem, principalmente pelo uso de técnicas hifenadas. Apesar das vantagens obtidas com o aumento do número informações sobre a amostra, a partir de detectores, a interpretação direta dos dados pode ser um desafio dada a complexidade de algumas matrizes. Diante disso, é importante que novas estratégias quimiométricas sejam propostas a fim de auxiliar na interpretação desse tipo de dado, como é o caso do algoritmo de análise linear discriminante em duas dimensões (2D-LDA). O 2D-LDA foi originalmente proposto no contexto do processamento de imagens de face para a extração de vetores características com alto poder discriminante. Apesar do seu desempenho promissor em tratamento de imagens, o algoritmo 2DLDA ainda não foi utilizado em aplicações que envolvem dados químicos. Neste trabalho foi investigado o uso de 2D-LDA em problemas de classificação envolvendo dados químicos de segunda ordem. Quatro conjuntos de dados foram utilizados:dois conjuntos de dados simulados de espectrometria de fluorescência de matriz de excitação/emissão; um conjunto de espectros de autofluorescência de presunto de Parma e outro conjunto de espectro de fluorescência sincrônica total de óleo vegetais comestíveis. Os resultados foram comparados com aqueles obtidos utilizando: Classificação sem extração de características (NFE); U-PLS-DA (Análise discriminante por mínimos quadrados parciais em dados desdobrados) e LDA usando escores de TUCKER-3 ou PARAFAC. No primeiro conjunto de dados simulados, todos os modelos alcançaram uma taxa de classificação correta de 100%. Contudo, no segundo conjunto de dados simulado apenas o modelo NFE apresentou erros de classificação (30%). Os conjuntos de dados do presunto de Parma e dos óleos vegetais obtiveram maior taxa de classificação utilizando 2DLDA (86%) e TUCKER-3-LDA (100%), em comparação com os modelos sem extração de características (76% e 77%), U-PLS -DA (81% e 92%) e PARAFAC-LDA (86% e 92%). Em geral, o 2D-LDA apresentou resultados comparáveis aos demais algoritmos avaliados, podendo ser considerado como uma estratégia promissora na classificação de dados químicos de segunda ordem.
Abstract: With advances in analytical instrumentation has been increasingly common to obtain second order data by using primarily hyphenated techniques. Despite the advantages obtained by increasing the number of detectors used in sample measurement, the direct data interpretation can be a challenge given the complexity of some matrices. Thus it is important that new chemometric strategies are proposed to support in the interpretation of the data type, such as the twodimensional discriminant linear analysis algorithm (2D-LDA). 2D-LDA was originally proposed in the image processing context for extraction of characteristic vectors with high discriminant power. Despite its promising performance in image processing, the 2D-LDA algorithm has not used in applications involving chemical data. This work investigates the use of 2D-LDA in classification problems involving second order chemical data. Four datasets were used: 2 simulated datasets of excitation / emission matrix fluorescence spectrometry; Auto fluorescence Spectrometry of Parma Ham, Total Synchronous Spectrometry of Edible Vegetable Oil. The results were compared with following algorithms: no feature extraction (NFE); U-PLS-DA (Partial least squares discriminant analysis in unfolded data) and LDA by using TUCKER-3 or PARAFAC scores. In the first simulated data set all models achieved a correct classification rate of 100%. However, in the second simulated data set only NFE model presented classification errors (30%). The Parma ham and vegetable oils data sets obtained the best classification rates by using 2D-LDA and TUCKER-3-LDA (86% and 100%) compared to the models without extraction of characteristics (76% and 77% ), U-PLS-DA (81% and 92%) and PARAFAC-LDA (86% and 92%). In general, the 2D-LDA presented comparable results to the other algorithms and could be considered as a promising strategy in the classification of second order chemical data.
Keywords: 2D-LDA
Segunda ordem
Classificação
PARAFAC
TUCKER
U-PLS-DA
2D-LDA
Second order
Classification
PARAFAC
TUCKER
U-PLS-DA
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal da Paraíba
metadata.dc.publisher.initials: UFPB
metadata.dc.publisher.department: Química
metadata.dc.publisher.program: Programa de Pós-Graduação em Química
metadata.dc.rights: Acesso Aberto
URI: https://repositorio.ufpb.br/jspui/handle/123456789/11849
Issue Date: 21-Aug-2017
Appears in Collections:Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Química

Files in This Item:
File Description SizeFormat 
Arquivototal.pdfArquivo total5,45 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.