Ciências Exatas e Tecnológicas

URI permanente desta comunidadehttps://locus.ufv.br/handle/123456789/4

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 2 de 2
  • Imagem de Miniatura
    Item
    New Features of Ordered Predictors Selection for Multivariate Regression and Classification
    (Universidade Federal de Viçosa, 2019-08-02) Roque, Jussara Valente; Teófilo, Reinaldo Francisco; jussara valente roque
    New variable selection methods for multivariate regression and classification based on ordered predictors selection (OPS) were developed in this work. Initially, the new OPS strategies for regression were developed and applied to the six datasets used in the original OPS paper to compare their prediction performances. After that, twelve new datasets were used to test and compare the new OPS approaches for regression with other variable selection methods, genetic algorithm (GA), the interval successive projections algorithm for partial least squares (iSPA), and recursive weighted partial least squares (rPLS). Simulated datasets were used to evaluate the computational performance of variable selection methods, being then the new OPS approaches for regression, GA, iSPA, and rPLS. All methods were evaluated by using a central composite design varying the matrix dimensions of simulated datasets and the number of latent variables. For classification, OPS methods for feature selection in the discriminant analysis (OPSDA) were developed. OPSDA methods were applied to three datasets with different numbers of classes, and classification models were built using different classification methods. The new OPS approaches for regression outperformed the first OPS version and the other variable selection methods. Results showed that in addition to higher predictive capacity, the accuracy in the selection of expected variables is highly superior with the new OPS approaches for regression. The computational performance of OPS approaches was mainly influenced by the number columns of the data matrix, as well as the GA. On the other hand, iSPA and rPLS were mainly influenced by the number of rows. In classification, the OPSDA methods provided the best set of selected variables to build more predictive models using different classification methods. Besides, they could be applied to classification problems, independent of the number of classes. Overall, the new OPS methods provided the best set of selected variables to build more predictive and interpretative regression and classification models. The new OPS methods proved to be efficient for variable selection in different types of datasets. Keywords: Variable Selection, Multivariate Regression, Supervised Pattern Recognition.
  • Imagem de Miniatura
    Item
    Desenvolvimento de modelos de regressão multivariada para determinação de ésteres de forbol em sementes de Jatropha curcas L. usando espectroscopia e quimiometria
    (Universidade Federal de Viçosa, 2015-07-17) Roque, Jussara Valente; Teófilo, Reinaldo Francisco; http://lattes.cnpq.br/7154037221725381
    A construção de modelos de calibração multivariada usando espectroscopias na região do infravermelho próximo (NIR) e ultravioleta (UV), aliada à regressão por quadrados mínimos parciais (PLS), para estimar as concentrações de ésteres de forbol (PEs) em acessos/progênies de Jatropha curcas L. foi o objetivo deste trabalho. A composição da fase móvel para a separação dos compostos via cromatografia líquida de alta eficiência (HPLC) foi otimizada através de um planejamento composto central (CCD) com duas variáveis. A partir disso, análises cromatográficas foram realizadas para determinar a concentração dos PEs que foi expressa em mg mL-1 de equivalente de forbol-12-miristato- 13-acetato (PMA). Os espectros foram obtidos a partir de diferentes materiais: semente com e sem a casca, óleo e extrato do óleo. Os espectros NIR foram obtidos na faixa de 4000 a 10000 cm-1, os espectros UV, na faixa de 210 a 350 nm e os espectros UV-VIS- NIR, na faixa de 250 a 1000 nm. Os modelos foram construídos empregando a regressão PLS e dois algoritmos para seleção de variáveis foram testados: o algoritmo genético (GA) e o método de seleção dos preditores ordenados (OPS). Os modelos obtidos para a semente sem casca e para o óleo, tanto no NIR quanto no UV-VIS-NIR, não foram satisfatórios. A partir dos espectros NIR obtidos via refletância difusa foi possível construir um modelo para a semente com casca após seleção de 130 variáveis com o OPS. Os parâmetros do modelo foram: RMSEP de 0,48; Rp de 0,49; RPD de 0,66 e erro relativo médio na predição de 18,63%. A partir dos espectros UV de absorbância do extrato do óleo, foi possível construir um modelo após seleção de 85 variáveis com o OPS. Os parâmetros do modelo foram: RMSEP de 0,23; Rp de 0,96; RPD de 2,67 e erro relativo médio na predição de 9,26%. O modelo construído para predições a partir da casca pode ser usado para triagem e o modelo construído a partir do extrato do óleo pode ser usado para prever com exatidão os teores de PEs. O método OPS, em todos os casos, proporcionou a construção de modelos mais simples e preditivos quando comparados aqueles obtidos pela seleção de variáveis utilizando o GA. Assim, o método de referência para quantificação de ésteres de forbol pode ser substituído pelos modelos obtidos, uma vez que são mais simples, rápidos e ambientalmente corretos.