Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/23443
Tipo: | Tese |
Título: | Uma estratégia de seleção de variáveis baseada na otimização por colônia de formigas em análise discriminante linear |
Autor(es): | Pontes, Aline Santos de |
Primeiro Orientador: | Silva, Edvan Cirino da |
Resumo: | Neste trabalho é apresentado o uso de uma nova estratégia de otimização bioinspirada em Colônia de Formigas para seleção de variáveis em problemas de classificação via Analise Discriminante Linear (LDA). O algoritmo proposto, denominado ACO-LDA, foi implementado em ambiente MatLab (como também todos os demais cálculos quimiométricos) buscando minimizar uma função de custo associada ao risco médio de erro de classificação Gcost. O ACO-LDA O BA-LDA foi avaliado usando dados espectrométricos de infravermelho próximo (NIR) e de ultravioleta visível (UV-Vis). No primeiro estudo, a espectrometria UV-VIS é adotada para classificar quatro tipos de óleos vegetais comestíveis (milho, soja, canola e girassol). No segundo caso, a espectrometria NIR é usada para discriminar amostras de chás com respeito as suas variedades (preto e verde) e origens geográficas (argentino, brasileiro e srilanquense). No terceiro caso, é empregado dados de espectrometria NIR em sementes de feijões segundo o tipo de cultivar: (perola, pontal e transgênico). Os resultados obtidos foram comparados a outros métodos de seleção de variáveis bem estabelecidos na literatura como Algoritmo genético (GA), o Algoritmo das Projeções Sucessivas (SPA), ambos associados às modelagens LDA e por Análise discriminante por mínimos quadrados parciais (PLS-DA). Nas duas primeiras aplicações, a taxa de classificação correta de previsão foram: 100%, 95,7% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente para classificação das amostras de óleos vegetais (UV-Vis). Enquanto para classificação das amostras de chás (NIR), a taxa de classificação correta foram de 92%, 84% e 100% dos modelos ACO-LDA, GA-LDA e PLS-DA respectivamente. Já na terceira aplicação, a taxa de classificação correta foi de 100% para os quatros modelos (ACO-LDA, GA-LDA, SPA-LDA e PLS-DA) na classificação das amostras de feijões. Dessa forma, os resultados indicam que o ACO-LDA é promissor para classificação de amostras a partir de dados espectrométricos NIR e UV-Vis, possibilitando fornecer resultados compatíveis com aqueles obtidos por ferramentas quimiométricas poderosas e versáteis. |
Abstract: | In this work the use of a new biophysical optimization strategy in Ants' Colony for selection of variables in classification problems via Linear Discriminant Analysis (LDA) is presented. The proposed algorithm, called ACO-LDA, was implemented in MatLab environment (as well as all other chemometric calculations) and evaluated in two databases already studied and a database developed. In the first study, UV-VIS spectrometry was used to classify four types of edible vegetable oils (corn, soybean, canola and sunflower). In the second case, NIR spectrometry is used to discriminate samples of teas with respect to their varieties (black and green) and geographical origins (Argentinean, Brazilian, and Sri Lankan). In the third case, NIR spectrometry data were used in beans seeds according to the type of cultivar: (perola, pontal and transgenic). The results obtained were compared to other methods of selection of variables good established in the literature as Genetic Algorithm (GA), the Algorithm of Successive Projections (SPA), both associated to LDA modeling and the Discriminante Analysis by Partial Least Squares (PLS-DA). In the first two applications, a correct prediction classification rate was: 100%, 95.7% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively for classifying the properties of vegetable plants (UV-Vis). While for the classification of teas (NIR), a correct classification rate was 92%, 84% and 100% of the ACO-LDA, GA-LDA and PLS-DA models respectively. In the third application, a correct classification rate was 100% for the four models (ACO-LDA, GA-LDA, SPA-LDA and PLS-DA) in the classification of debts. Thus, the results indicated that ACO-LDA is promising to classify from NIR and UV-Vis spectrometric data, making it possible to provide results compatible with those chosen by powerful and versatile chemometric tools. |
Palavras-chave: | Seleção de variáveis Colônia de formigas Análise discriminante linear Variable selection Ant colony Linear discriminant analysis |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Departamento: | Química |
Programa: | Programa de Pós-Graduação em Química |
Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/23443 |
Data do documento: | 14-Dez-2020 |
Aparece nas coleções: | Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Química Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Química |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
AlineSantosDePontes_Tese.pdf | 5,68 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons