Ciências Exatas e Tecnológicas

URI permanente desta comunidadehttps://locus.ufv.br/handle/123456789/4

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 7 de 7

Análise de componentes principais e análise de fatores em acessos de Capsicum annuum L. no estudo de variabilidade genética
(Universidade Federal de Viçosa, 2023-08-30) Santos, Raquel Cordeiro; Cecon, Paulo Roberto; http://lattes.cnpq.br/8324411827990437
As pimenteiras pertencem a família Solanácea e ao gênero Capsicum, a qual representa grande variabilidade de plantas. As pimentas são consumidas em todo o mundo e em razão de seus diversos usos e demanda de mercado é necessário buscar opções de maior qualidade e produtividade, o que pode ser feito pela escolha de genótipos superiores. O objetivo dessa pesquisa foi estudar a variabilidade genética de acessos de pimenta (C. annuum) por meio de técnicas de análise de componentes principais e análise de fatores. Utilizando o delineamento experimental inteiramente casualizado, com quatro repetições foram analisados nove acessos de Capsicum annuum L., são eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. As características avaliadas foram: peso total do fruto (PT, g), comprimento do fruto (COM, mm), largura do fruto (LAR, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NS), massa da matéria total do fruto fresca (MF, g), Massa da matéria total do fruto maduro seco (MS, g), Teor de sólidos solúveis (BRIX), Teor de Vitamina C (VIT, mg100g −1 ). Foi aplicada a técnica de análise multivariada denominada de componentes principais (ACP), que permitiu reduzir a dimensão da amostra, pela qual foram retidos dois componentes que juntos explicaram mais de 90% da variabilidade contida nos dados. A análise de divergência genética entre os acessos foi realizada por meio da técnica de análise multivariada denominada de análise de fatores (AF), seguido da rotação Varimax, levando a identificação de três grupos geneticamente divergentes o que permite abordagens mais direcionadas para otimizar as características-chave relacionadas ao mercado de pimentas. Palavras-chave: Análise multivariada. Variabilidade genética. Pimenta.
Improving the accuracy of multivariate models: a study of sample dehydration and data preprocessing optimization
(Universidade Federal de Viçosa, 2023-03-09) Cardoso, Wilson Júnior; Teófilo, Reinaldo Francisco; http://lattes.cnpq.br/8139535289390889
The aim of this thesis is to study approaches to improve the accuracy of multivariate models. Two approaches were considered, one relating to sample preparation and the other related to data preprocessing. The first chapter aimed to study sample dehydration to improve the prediction of sucrose, glucose, and fructose in sugarcane juice using near-infrared (NIR) spectroscopy and partial least squares (PLS) regression models. Models using the NIR spectra acquired using the liquid (LSJ) and dehydrated sugarcane juice (DSJ) were compared. In addition, the NIR spectra were acquired using a benchtop and a portable instrument. Ordered predictors selection (OPS) was applied to select the most informative variable. The results indicated better predictions for all sugars using the DSJ for both instruments, being the benchtop statistically better than the portable instrument. To sum up, the dehydration approach showed to be a great technique to improve the predictability of PLS-OPS models for sugars in sugarcane juice using NIR spectra by removing the water and concentrating the analytes. The second chapter presented an algorithm that automatically searches for the best preprocessing strategy without fixing their order based on the artifact they fix, i.e., baseline correction, scatter correction, noise removal, and scaling. The number of preprocessing methods in each strategy and their hyperparameters were evaluated. The algorithm was compared with methods presented in the literature by Gerretzen et al. (2015) and Jiao et al. (2020). A fair, extensive, and comprehensive study was carried out, evaluating 67 different calibration datasets. This work demonstrated that not fixing the order in which the preprocessing is applied was essential to find the best models with a significant reduction in the RMSEP values when compared with the other methods, therefore presenting a comprehensive insight into data preprocessing. These results showed that a proper sample preparation and a proper optimization of the data preprocessing strategy are fundamental to build the best models. Keywords: Chemometrics. Sample Preparation. Water Removal. Data Preprocessing.
Robustez de classificadores Naive Bayes híbridos quanto a quebra do pressuposto de independência das variáveis
(Universidade Federal de Viçosa, 2023-02-16) Costa, Noé Mitterhofer Eiterer Ponce de Leon da; Nascimento, Moysés; http://lattes.cnpq.br/9184271760739064
O aumento populacional gera uma demanda para o aumento da produção agrícola, principalmente no quesito da produtividade, uma vez que quase todas as áreas agricultáveis já produzem alimentos. Dentro da demanda do aumento de produtividade, o melhoramento genético aliado a estatística é fundamental para alcançar as atuais demandas. A Estatística oferece diversos métodos para análises dos dados agropecuários, entre esses métodos estão os classificadores. Tais métodos são capazes de alocar cada observação em uma das classes de interesse. Entre os métodos disponíveis, o classificador Naive Bayes (NB) se destaca pela sua simplicidade e bom desempenho. Entretanto, o mesmo tem como pressuposição a independência entre as variáveis preditoras. Diante do fato de que tal pressuposição é dificilmente alcançada na prática, este trabalho tem por objetivo avaliar métodos híbridos na tentativa de melhorar seu desempenho considerando diferentes níveis de dependência entre variáveis. As metodologias combinadas ao NB foram à análise de componentes principais (PCA + NB), componentes esparsos (SPCA + NB) e análise discriminante (AD + NB). Foram simulados dados com diferentes níveis de correlação (0,10; 0,50 e 0,90) e diferentes vetores de médias. Todos os cenários foram avaliados considerando 2, 4, 8 e 16 variáveis. As metodologias usadas na comparação dos métodos propostos foram Random Forest, Bagging e Rede Neural Artificial através do cálculo da acurácia média e o respectivo erro padrão da média. A partir dos resultados obtidos por simulação pôde-se concluir que a pressuposição de independência é importante, uma vez que o aumento na correlação sempre resultou em redução da acurácia média dos classificadores. Os classificadores híbridos propostos no trabalho apresentaram-se como boas alternativas ao NB, uma vez que apresentaram resultados semelhantes ou superiores ao próprio NB e demais métodos avaliados quanto a acurácia média. Palavras-chave: Classificador híbrido. Metodologias combinadas. Simulação.
Análise de variáveis canônicas no software R
(Universidade Federal de Viçosa, 2020-10-26) Barbosa, Wagner Faria; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/7238720100539414
As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.
Avaliação da qualidade de suplementos alimentares de ômega-3 utilizando um espectrofotômetro de infravermelho próximo de baixo custo
(Universidade Federal de Viçosa, 2021-02-24) Souza, Jamille Carvalho de; Hespanhol, Maria do Carmo; http://lattes.cnpq.br/9049739795032218
Suplementos alimentares de ômega-3 são especificados de acordo com a quantidade de ácido eicosapentaenoico (EPA) e ácido docosahexaenóico (DHA). A principal matéria-prima usada é o óleo de peixe. Devido aos efeitos benéficos para a saúde associados ao consumo de ômega-3, existe um grande número de marcas de suplementação. Portanto, faz-se necessário um controle da qualidade desses suplementos. Neste sentido, este trabalho visa utilizar um espectrofotômetro de infravermelho próximo portátil e de baixo custo para avaliar a qualidade de suplementos alimentares de ômega-3. O espectrofotômetro NanoNIR (Texas Instruments Inc., Dallas, Texas, EUA), que possui um custo aproximado de US$ 1000, foi empregado, operando na faixa espectral de 900 – 1700 nm, para obter os espectros de absorção de 83 suplementos de ômega-3, adquiridos nas farmácias e lojas de Minas Gerais e São Paulo – Brasil. Além disso, 43 amostras de óleos vegetais também foram medidas. Os dados espectrais foram pré-tratados, usando-se o método da 2ª derivada (Savitzky-Golay, 15 pontos, polinômio de 2º grau) e submetidos a análise das componentes principais, usando o software quimiométrico Unscrambler 10.5.1 (CAMO - Noruega). Em seguida, uma maneira não convencional de construir modelos de regressão multivariada, com base em regressão de mínimos quadrados parciais, foi proposta para determinar o conteúdo de ômega-3 nos suplementos, na qual poucos valores de referência foram utilizados e o conjunto de dados foi completado com os valores do teor de ômega-3 informados nos rótulos. Os resultados mostraram que a abordagem simples, rápida e econômica proposta pode fornecer informações relevantes relacionadas à qualidade dos suplementos in situ, como triagem do conteúdo dos componentes ativos e identificação de fraudes e/ou não conformidades. Palavras-chave: Espectroscopia de infravermelho próximo. Análise multivariada. Ácidos graxos ômega-3. Suplementos alimentares – Modelos matemáticos.
Aplicação da espectroscopia na região do infravermelho próximo para análise de materiais vegetais
(Universidade Federal de Viçosa, 2020-11-26) Oliveira, Ulisses Fernando de; Teófilo, Reinaldo Francisco; http://lattes.cnpq.br/2430034228599825
Neste trabalho foram construídos modelo de regressão e classificação a partir de espectros na região do infravermelho próximo (NIR) obtidos de materiais vegetais. O primeiro estudo teve como objetivo realizar a quantificação antecipada do teor de óleo usando espectros de NIR obtidos de frutos verdes de macaúba. A espectroscopia NIR e a regressão por quadrados mínimos parciais (PLS) provou ser útil na quantificação precoce do teor de óleo prevendo seu teor com vinte e cinco dias antes do máximo acúmulo de óleo no fruto. A previsão antecipada foi semelhante às previsões para frutos maduros. No segundo estudo, foi realizada a comparação entre dois instrumentos NIR, um de bancada (NIRB) e um portátil (NIRP). A comparação se deu para determinação da amilose aparente (AM) em amostras de fécula de mandioca, usando modelos de regressão e classificação multivariados. Ao contrário do NIRB, os modelos de regressão construídos a partir do instrumento NIRP não apresentaram bons ajustes. Apesar disso, um modelo PLS por análise discriminante (PLS-DA) pode ser aplicado na classificação entre concentrações maiores e menores ou iguais a 20%, obtendo resultados tão confiáveis quanto o NIRB na classificação. No último estudo, foram construídos modelos para a determinações da concentração dos ácidos graxos (AG) palmítico, esteárico, oleico e linoleico do óleo de pinhão-manso. Foram usados espectros do NIRB, NIRP e infravermelho médio (MIR). Os melhores resultados foram para o NIRB, com valores da raiz quadrada do erro quadrático médio de previsão (RMSEP) e do coeficiente de correlação (R p ), respectivamente iguais a 3,85 mg mL -1 e 0,87 para AG palmítico; 2,20 mg mL -1 e 0,87 para AG esteárico; 8,61 mg mL -1 e 0,86 para AG oleico; 15,75 mg mL -1 e 0,85 para AG linoleico. A aplicação do NIR a materiais vegetais teve um papel importante neste trabalho, obtendo métodos mais rápidos, baratos e não-destrutivos, possibilitando seleção de melhores materiais vegetais, auxiliando no melhoramento genético. Palavra-chave: Materiais vegetais. Espectroscopia no infravermelho próximo. Regressão multivariadas. Quadrados mínimos parciais.
Data-driven Cluster Analysis Method: uma nova metodologia para detecção de outliers em dados multivariados
(Universidade Federal de Viçosa, 2021-04-20) Barbosa, Josino José; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/1948800098593563
Metodologias para identificação de outliers multivariados são de grande importância em análise estatística. Observações aberrantes podem revelar informações relevantes para variáveis sob investigação. Aplicações estatís- ticas sem uma prévia identificação de possíveis valores extremos podem apresentar resultados controversos e induzir decisões equivocadas. Além disso, em diversos contextos, os outliers são pontos de grande interesse prático e sua identificação torna-se o principal objetivo. Diante disso, esse estudo tem por objetivo propor uma nova técnica de detecção de outliers multivariados baseada em análise de agrupamentos. A técnica considera informações inerentes ao próprio banco de dados e também informações de conhecimento prévio do pesquisador acerca das populações sob investigação. A avaliação da metodologia foi conduzida através de calibração e comparação com três métodos de detecção já difundidos por meio de dados simulados. A investigação comparativa considera duas técnicas de detecção baseadas na clássica distância de Mahalanobis e uma técnica também baseada em análise de agrupamentos. As medidas de sensibilidade, especificidade e acurácia são utilizadas para aferir a qualidade dos métodos, assim como uma análise quanto ao tempo computacional necessário para a execução dos procedimentos. Além disso, os métodos foram empregados num conjunto de dados reais. A nova técnica proposta revelou uma notória superioridade em relação às demais, tanto na qualidade de detecção de outliers através dos dados simulados, quanto na adequabilidade na aplicação do conjunto de dados reais. Palavras-chave: Outliers multivariados. Simulação. Análise de agrupamentos. DDCAM.

Ciências Exatas e Tecnológicas

Navegar

Filtros

Configurações

Ordenar por

Resultados por página

Resultados da Pesquisa