Abordagens frequentista e bayesiana para descrição das curvas de acúmulo de matéria seca de plantas de alho
Arquivos
Data
2015-12-03
Autores
Macedo, Leandro Roberto de
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Viçosa
Resumo
Este trabalho teve como objetivo identificar modelos de regressão não linear que melhor descrevem as curvas de acúmulo de matéria seca em acessos de alho ao longo do tempo (60, 90, 120 e 150 dias após o plantio) utilizando as abordagens Frequentista e Bayesiana. Objetivou-se também agrupar os acessos similares em cada abordagem com relação às estimativas dos parâmetros e validar este agrupamento via inferência para a igualdade desses parâmetros entre os grupos formados. Para tal estudo foram utilizados 30 acessos de alho registrados no Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). Os modelos Logístico, Gompertz e Von Bertalanffy mostraram-se bons representantes para este tipo de estudo, sendo o modelo Logístico o que melhor se ajustou aos dados. Após a escolha do melhor modelo em cada uma das abordagens, as estimativas dos parâmetros das curvas provenientes do ajuste deste modelo foram submetidas a análise de agrupamento, em que as estimativas foram consideradas como variáveis. Para o agrupamento foi utilizando o algoritmo de Ward e a distância generalizada de Mahalanobis como medida de proximidade. O número ótimo de grupos, segundo o método de Mojena, foi de três para a abordagem Frequentista e quatro para a Bayesiana. A inferência sobre igualdade de parâmetros das curvas entre os grupos formados indicou que o método Bayesiano mostrou-se eficiente e caracterizou-se como uma ferramenta útil para o estudo das curvas de acúmulo de matéria seca em plantas de alho visto que não apresentou problemas de convergência e reportou estimativas com baixos desvios padrão a posteriori, além de determinar de forma mais efetiva o número de grupos.
This thesis aimed to identify nonlinear regression models that best describe dry matter accumulation curves in garlic accessions over time (60, 90, 120, and 150 days after planting). When doing so, frequentist and Bayesian technics of estimation were analyzed. It was also intended to cluster similar garlic accessions according to their estimated parameters in each estimation approach, and to validate such clustering by means of tests for the equality of parameters. Dataset comprised 30 garlic accessions belonging to the Vegetable Germplasm Bank of Universidade Federal de Viçosa (BGH/UFV). Our results showed that Logistic, Gompertz, and Von Bertalanffy models are well-suited for studies in this research area, while the Logistic model presented the best goodness-of-fit indicators in both approaches. Next, we applied Ward’s clustering algorithm, with Mahalanobis’ generalized distances, in order to group Logistic curve estimated parameters for each garlic accessions. The optimal number of groups, according to Mojenas’ method, was three for the frequentist method, and four, when considering the Bayesian method. Finally, we were able to conclude that the Bayesian technic of estimation is well-suited for studies related to this one, since it has not presented convergence problems, has reported estimates with lower posterior standard deviations, and has discriminated in the most effective way the groups of garlic plants.
This thesis aimed to identify nonlinear regression models that best describe dry matter accumulation curves in garlic accessions over time (60, 90, 120, and 150 days after planting). When doing so, frequentist and Bayesian technics of estimation were analyzed. It was also intended to cluster similar garlic accessions according to their estimated parameters in each estimation approach, and to validate such clustering by means of tests for the equality of parameters. Dataset comprised 30 garlic accessions belonging to the Vegetable Germplasm Bank of Universidade Federal de Viçosa (BGH/UFV). Our results showed that Logistic, Gompertz, and Von Bertalanffy models are well-suited for studies in this research area, while the Logistic model presented the best goodness-of-fit indicators in both approaches. Next, we applied Ward’s clustering algorithm, with Mahalanobis’ generalized distances, in order to group Logistic curve estimated parameters for each garlic accessions. The optimal number of groups, according to Mojenas’ method, was three for the frequentist method, and four, when considering the Bayesian method. Finally, we were able to conclude that the Bayesian technic of estimation is well-suited for studies related to this one, since it has not presented convergence problems, has reported estimates with lower posterior standard deviations, and has discriminated in the most effective way the groups of garlic plants.
Descrição
Palavras-chave
Análise de regressão, Distribuição (Teoria da probabilidade), Análise por agrupamento, Teoria bayesianade decisão estatística, Alho
Citação
MACEDO, Leandro Roberto de. Abordagens Frequentista e Bayesiana para descrição das curvas de acúmulo de matéria seca de plantas de alho. 2015. 55f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2015.