Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Avaliação de agrupamentos em mistura de variáveis(Universidade Federal de Viçosa, 2013-02-06) Vidigal, Bruno Caetano; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/4686534144477456; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8A análise de agrupamento é amplamente utilizada em muitas áreas de pesquisa a fim de se reconhecer uma estrutura padrão de variabilidade entre os indivíduos ou objetos estudados, classificando-os em grupos homogêneos. No entanto, dos trabalhos publicados, a maioria deles versam apenas sobre variáveis numéricas, excluindo da análise, as informações contidas nas variáveis categóricas. Dessa forma, esse trabalho teve o objetivo de avaliar várias formas de agrupamentos em um banco de dados simulado e também de disponibilizar uma rotina em R do algoritmo kprotótipos e uma rotina para se realizar agrupamentos hierárquicos. As medidas de distâncias avaliadas foram: euclidiana, euclidiana ao quadrado, euclidiana média, mahalanobis, manhattan, medidas combinadas e a de gower. Quanto aos algoritmos de agrupamento hierárquicos utilizados foram: vizinho mais próximo, vizinho mais distante, UPGMA e ward . Os algoritmos não-hierárquicos foram: k-médias e o kprotótipos. Os resultados obtidos foram confrontados entre si e concluiu-se que os algoritmos não-hierárquicos foram superiores aos hierárquicos e que incluir variáveis categóricas na análise é viável.Item Avaliação de métodos para determinação do número ótimo de clusters em estudo de divergência genética entre acessos de pimenta(Universidade Federal de Viçosa, 2009-01-19) Faria, Priscila Neves; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4759955H9; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Finger, Fernando Luiz; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783681Y0Muitas vezes, a interpretação dos resultados em análise de agrupamentos é feita de forma subjetiva, isto é, através da inspeção de dendrogramas. Isto se deve ao fato de haver dificuldade em se encontrar na literatura um critério objetivo de fácil aplicação para identificar o número ideal de grupos formados. Diante deste problema, o presente trabalho teve por objetivos: 1) Avaliar a aplicabilidade de critério objetivo de se obter o ponto de corte (número ótimo de clusters) num dendrograma para a tomada de decisão; 2) trabalhar os conceitos de índices como RMSSTD (root mean square standard deviation) e RS (R-Squared), discutindo a contribuição de cada um destes na obtenção do número ótimo de clusters em acessos de Capsicum chinense; 3) aplicação do método, visando a identificar acessos divergentes de Capsicum chinense para serem utilizados em programas de melhoramento. Os índices RMSSTD e RS são calculados de acordo com as variáveis entre e dentro dos grupos formados, caracterizando uma forma objetiva para determinar o número ótimo. Para se obter o ponto de máxima curvatura da trajetória dos índices RMSSTD e RS em função do aumento do número de grupos (X), utilizou-se o Método da Máxima Curvatura Modificado. Foram analisadas, por meio da análise de agrupamentos, algumas características morfológicas de quarenta e nove acessos da espécie Capsicum chinense Jacq. do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa. A partir das técnicas propostas agrupou-se os acessos, obtendo um número ótimo de grupos. Os resultados classificam os 49 acessos avaliados em apenas sete grupos de acordo com o gráfico do RMSSTD versus o número de grupos e o gráfico do RS versus o número de grupos.Item Comparação de métodos para estimar o tamanho ótimo de parcela em bananeira(Universidade Federal de Viçosa, 2010-02-12) Silva, Willerson Custódio da; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/7100345720446348; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Puiatti, Mário; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783362Z2O objetivo deste trabalho foi avaliar os métodos da Máxima Curvatura, Máxima Curvatura Modificado e Modelo Linear de Resposta Platô na determinação de tamanho ótimo de parcela, uma vez que os métodos tradicionais da Máxima Curvatura e Máxima Curvatura Modificado superestimam e subestimam, respectivamente, o tamanho da unidade básica. Por essa razão, foi proposta neste trabalho a comparação entre esses métodos e o método do Modelo Linear de Resposta Platô, considerando-se dados de genótipos de bananeira. Avaliaram-se os caracteres vegetativos altura da planta, perímetro do pseudocaule, número de folhas vivas no florescimento, número de filhos emitidos até o florescimento e número de folhas vivas na colheita. Nessa avaliação, cada planta foi julgada como uma unidade básica (ub) com área de 6 m2, perfazendo, assim, 360 unidades, cujas adjacentes foram combinadas de modo a formar 23 tamanhos de parcelas preestabelecidas, com formatos retangulares dispostos em fileiras. Os resultados indicaram que os tamanhos de parcela variaram com o método utilizado e a variável avaliada. No método da Máxima Curvatura, o tamanho da unidade básica variou entre 17,5 para Número de Filhos Emitidos no Florescimento (NFF) e 20,5 para Número de Folhas Vivas após a Colheita (NFVC), enquanto o coeficiente de variação variou entre 3,2 para Altura da Planta (AP) e 5,3 para Número de Folhas Vivas após a Colheita (NFVC). No método da Máxima Curvatura Modificado, o tamanho da unidade básica variou entre 0,74 para Altura da Planta (AP) e 6,88 para Número de Filhos Emitidos no Florescimento (NFF), enquanto o coeficiente de variação variou entre 5,2 para Altura da Planta (AP) e 13,84 para Número de Filhos Emitidos no Florescimento (NFF). Pelo método do Modelo Linear de Resposta Platô, o tamanho da unidade básica variou entre 10,50 para Número de Folhas Vivas (NFV) e 13,22 para Número de Filhos Emitidos no Florescimento (NFF), enquanto o coeficiente de determinação variou de 71,77% para Número de Filhos Emitidos no Florescimento (NFF) a 80,33% para Número de Folhas Vivas (NFV). Dessa forma, recomenda-se a utilização simultânea de mais de um método para determinação do tamanho ótimo da parcela, a fim de que o tamanho realmente adotado atenda, na medida do possível, aos diversos fatores considerados em cada método.Item Métodos alternativos para estimar tamanho ótimo de parcelas experimentais: uma aplicação na cultura da bananeira(Universidade Federal de Viçosa, 2011-02-10) Oliveira, Elisângela Aparecida de; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/4276649779321375; Finger, Fernando Luiz; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783681Y0; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405Unidade experimental, ou parcela, é a unidade que recebe a aplicação do tratamento e fornece os dados que deverão refletir o seu efeito. O tamanho ótimo de parcela experimental está diretamente relacionado com a precisão do experimento, uma vez que o tamanho apropriado reduz o erro experimental. Este trabalho teve como objetivos utilizar os métodos Modelo Linear Segmentado com Response Platô (MLRP), Modelo Segmentado Quadrático com Response Platô (MQRP), Modelo Segmentado Exponencial com Response Platô (MERP) e o tradicional Método da Máxima Curvatura Modificada (MMCM), para determinação do tamanho ótimo de parcelas experimentais empregando dados reais na cultura da bananeira; comparar os métodos utilizados através dos seguintes avaliadores de qualidade de ajuste: coeficiente de determinação (R2), critério de informação de Akaike (AIC) e critério de informação baysiano (BIC); e obter intervalos de confiança para o Tamanho Ótimo de Parcela. O material utilizado correspondeu a um experimento em branco que foi realizado no Município de Sebastião ix Laranjeiras, BA, onde foram avaliadas, em dois ciclos de produção (2006-2008), as características: altura da planta, perímetro do pseudocaule, número de folhas vivas, número de filhos emitidos e nota de sigatoka-amarela na época do florescimento. Nessa avaliação, cada planta foi julgada como uma unidade básica com área de 6 m2, perfazendo, assim, 240 unidades básicas, de cujas combinações foram formados os 19 diferentes tamanhos de parcelas. Os resultados indicaram que os valores das estimativas dos tamanhos de parcela obtidos, de forma geral, oscilaram de acordo com as características avaliadas, o ciclo de produção e os modelos utilizados. Tal oscilação correspondeu à variação de 7 a 66 plantas no primeiro ciclo e 7 a 40 no segundo. O método MERP determinou valores para as unidades básicas maiores que os do método MQRP, que por sua vez estimou valores maiores que os do método MLRP. De acordo com a qualidade de ajuste, o melhor modelo para os dados analisados foi o MERP, que estimou tamanho ótimo de parcela médio de 31 unidades básicas. O método MLRP indicou tamanho ótimo de parcela médio de nove unidades básicas e o método MQRP, tamanho ótimo de parcela médio de 22 unidades básicas. Estatisticamente, o melhor modelo seria o MERP, mas por razões de ordens práticas, uma vez que estima valores maiores para o tamanho ótimo de parcela, pode não ser viável para o pesquisador. Verificou-se que os métodos MLRP, MQRP e MERP podem ser utilizados na determinação do tamanho ótimo de parcelas experimentais. Assim, recomenda-se a utilização simultânea de mais de um método para determinação do tamanho ótimo da parcela, a fim de que o tamanho adotado atenda aos diversos fatores considerados em cada método e às necessidades do pesquisador.Item Métodos de agrupamento: avaliação e aplicação ao estudo de divergência genética em acessos de alho(Universidade Federal de Viçosa, 2012-02-13) Silva, Anderson Rodrigo da; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/3916683240962357; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945Este estudo teve por objetivo avaliar, quanto a consistência do agrupamento, os métodos de agrupamentos hierárquicos UPGMA e Ward e os de otimização de Tocher e Tocher modificado, pela aplicação da análise discriminante de Fisher aos grupos obtidos com cada método, em estudo da divergência genética entre acessos de alho, identificando também os acessos mais dissimilares. Os agrupamentos foram realizados com base na distância generalizada de Mahalanobis, que também permitiu quantificar a importância relativa dos caracteres. Os acessos que apresentaram maior dissimilaridade foram os acessos 13 (BGH 4505) e 61 (BGH 5958), principalmente em relação ao peso médio do bulbo e produtividade. Os métodos de Tocher modificado, UPGMA e algoritmo de Ward apresentaram resultados concordantes entre si quanto a formação dos grupos. No entanto, pela análise discriminante de Fisher aplicada aos grupos dos métodos hierárquicos (UPGMA e Ward) observou-se as menores taxas de erro aparente, sendo, portanto, os métodos mais consistentes para o estudo da diversidade genética de acessos de alho.Item Modelos de regressão não linear para descrição do crescimento de plantas de alho(Universidade Federal de Viçosa, 2012-07-16) Reis, Renata Maciel dos; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/7023323201468555; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8O objetivo deste estudo foi escolher um modelo de regressão não linear que melhor descreve o acúmulo de matéria seca de diferentes partes da planta do alho ao longo do tempo (60, 90, 120 e 150 dias após plantio). Foram utilizados 20 acessos de alho pertencentes ao Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). A fim de se trabalhar apenas com grupos de acessos semelhantes, aplicou-se a análise de agrupamento para a formação desses grupos. As matérias secas da folha, do pseudocaule, do bulbo e da raiz foram definidas como as variáveis nessa análise de agrupamento, que foi realizado por meio do algoritmo de Ward, utilizando como medida de dissimilaridade a distância generalizada de Mahalanobis. O número ótimo de grupos foi determinado por meio do Método de Mojena, o qual indicou três grupos de acessos, cujas médias de matéria seca do bulbo, da raiz e total da planta foram utilizadas para o ajuste de sete modelos de regressão não linear, a saber: Mitscherlich, Gompertz, Logístico, Meloun I, Meloun II, Brody e von Bertalanffy. A identificação do modelo que melhor se ajustou as três características de cada grupo foi realizada mediante coeficiente de determinação (R2), o quadrado médio do resíduo (QMR) e o desvio médio absoluto dos resíduos (DMA). Comparando os valores desses avaliadores observou-se que, para as três caraterísticas dos três grupos, o modelo que melhor se ajustou foi o modelo Logístico.Item Seleção de covariáveis para ajuste de regressão logística na análise de abundância de invertebrados edáficos em diferentes agroecossistemas(Universidade Federal de Viçosa, 2011-02-25) Oliveira, Luciane da Silva; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/1285358837858384; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Jucksch, Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723123H4A regressão logística é o método estatístico usual de análise utilizado com a finalidade de verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Este trabalho teve como objetivo realizar um estudo sobre os fatores que influenciam a abundância de invertebrados no solo sob diferentes formas de manejo utilizando a Regressão Logística. Tal objetivo reside no fato destes invertebrados serem considerados excelentes indicadores do tipo de uso e qualidade do solo, atuando em vários processos fundamentais para a manutenção da fertilidade e qualidade dos solos de agroecossistemas e ecossistemas naturais de acordo com Brown et al. (1998) e Hendrix et al. (2006), citado Souza (2010). Para seleção de covariáveis foi utilizada a proposta de Collett (1994) e foram apresentados estimadores dos parâmetros envolvidos em cada modelo e suas interpretações, propriedades estatísticas e critérios para se julgar a adequabilidade dos modelos selecionados. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais (período seco e chuvoso). No modelo final ajustado para o conjunto de dados analisado no período seco verificou-se que as covariáveis Tipo de Sistema, Cálcio em serapilheira, Matéria orgânica do solo, Potássio em serapilheira e a interação entre Cálcio e Potássio em serapilheira foram importantes para explicar a presença de mais de 9 indivíduos, em média, no solo. Já no modelo final ajustado para o conjunto de dados analisado no período chuvoso, as covariáveis significativas para explicar a presença de 101 indivíduos, em média, no solo foram Magnésio em serapilheira, Carbono orgânico total na serapilheira, Matéria orgânica da serapilheira e Temperatura ambiente. Para os dois modelos citados houve bom desempenho discriminatório e excelentes áreas sob a curva ROC, confirmando assim a validade da utilização de técnicas de regressão logística na construção dos modelos para descrever os dados analisados.Item Técnica de agrupamento na seleção de modelos de regressão não lineares para descrição do acúmulo de matéria seca em plantas de alho(Universidade Federal de Viçosa, 2014-02-19) Puiatti, Guilherme Alves; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/3292690471132609; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8Estudos de divergência genética entre indivíduos ou populações de plantas e sua trajetória de crescimento são de grande importância em programas de melhoramento, sendo essenciais para a obtenção de informações relevantes para um manejo adequado das plantas. Das técnicas empregadas para tal, a análise de agrupamento e modelos de regressão são amplamente utilizados. Assim, o objetivo deste estudo foi identificar e agrupar modelos de regressão não linear que melhor se ajustam na descrição do acúmulo de matéria seca total da planta do alho ao longo do tempo (60, 90, 120 e 150 dias após plantio). Foram utilizados 15 acessos de alho pertencentes ao Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). Os modelos de regressão não linear ajustados para cada um dos acessos foram: Brody, Gompertz, Logístico, Mitscherlich e von Bertalanffy. A qualidade de ajuste dos modelos foi determinada pelo coeficiente de determinação ( R 2 ); quadrado médio do resíduo ( QMR ); desvio médio absoluto dos resíduos ( DMA ); critério de informação de Akaike ( AIC ); e critério de informação Bayesiano ( BIC ). Então, para cada acesso, os modelos foram submetidos a análise de agrupamento, com os avaliadores de qualidade de ajuste considerados como variáveis, utilizando o algoritmo UPGMA, a distância generalizada de Mahalanobis como medida de dissimilaridade, e número de grupos determinado pelo método de Mojena. Depois, os modelos ajustados para cada acesso foram novamente agrupados seguindo o mesmo critério, mas utilizando os parâmetros com interpretação biológica como variáveis, e os resultados dos diferentes agrupamentos foram então confrontados. Comparando os resultados dos agrupamentos, observou-se que os modelos Gompertz, Logístico, e von Bertalanffy apresentaram melhores resultados quanto aos avaliadores de qualidade de ajuste, e tiveram resultados próximos quanto a estes e quanto as estimativas dos parâmetros. Estes três modelos se mostraram eficientes para descrição de matéria seca total da planta em acessos de alho, especialmente o modelo Logístico.