Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Análise de sobrevivência do tomateiro a Phytophthora infestans(Universidade Federal de Viçosa, 2008-09-05) Araujo, Maria Nilsa Martins de; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248466E9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cota, Luciano Viana; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4778995H6A requeima causada por Phytophthora infestans caracteriza-se por ser uma doença agressiva e de grande impacto destrutivo, podendo limitar ou até mesmo impedir o cultivo econômico do tomateiro sob condições de alta umidade e baixas temperaturas. Diante dos problemas que a requeima pode provocar às lavouras de tomate, este trabalho teve por objetivos: 1) ajustar modelos para descrever o progresso da doença e formar grupos de acessos de tomateiro com curvas semelhantes; 2) estimar dados referentes ao número de dias até atingir 5% de severidade da doença, por meio de regressão inversa; 3) ajustar curvas de sobrevivência por meio do estimador de Kaplan-Meier para grupos de acessos e compará-las mediante o uso do teste Logrank; 4) ajustar curvas de sobrevivência por meio de modelos probabilísticos e compará-las com a técnica não-paramétrica de Kaplan-Meier. Utilizando dados reais sobre a requeima do tomateiro, foi possível ajustar o modelo exponencial (Y = y0 exp (rX)) para descrever o progresso da doença. As médias das estimativas dos parâmetros foram submetidas à análise de agrupamento pelo método Centróide, o que gerou 10 grupos de acessos, sendo o tempo até a incidência de 5% da doença calculado via regressão inversa. Foram utilizadas técnicas não-paramétricas para estimar a função de sobrevivência por meio do estimador de Kaplan-Meier e para comparar as curvas de sobrevivência pelo teste Logrank. Foi também ajustada a função de sobrevivência, empregando-se os modelos probabilísticos Exponencial, Weibull e Log-normal, os quais foram comparados por meio do Teste da Razão da Verossimilhança (TRV), considerando-se o modelo Gama generalizado por ser caso geral para esses modelos. A metodologia utilizada permitiu ajustar o modelo Exponencial para descrever o progresso da requeima do tomateiro e agrupar os acessos estudados em 10 grupos. O acesso BGH-6 sofreu um progresso de doença menor que os demais, caracterizando-se, assim, sua maior resistência à enfermidade. A regressão inversa possibilitou estimar o tempo até a ocorrência de 5% da severidade da requeima do tomateiro. Pela técnica não-paramétrica de Kaplan-Meier, foi possível estimar as curvas de sobrevivência dos acessos de tomateiro pertencentes aos grupos 1, 2, 4, 6 e 8. Utilizando o teste Logrank, pode-se concluir que a maioria das comparações duas a duas foi significativa (p<0,05), exceto nas comparações dos grupos 2x4, 4x8 e 6x8. O uso dos modelos probabilísticos Exponencial, Weibull e Log-normal possibilitou a estimação das curvas de sobrevivência nos grupos 2, 4, 6 e 8, exceto no grupo 4, em que o modelo Weibull não foi adequado. Comparando os modelos probabilísticos com a técnica não-paramétrica, as curvas dos modelos probabilísticos dos grupos 2 e 4 apresentaram ajustes satisfatórios com relação à curva estimada por Kaplan-Meier.Item Comparação das funções de ligação logit e probit em regressão binária considerando diferentes tamanhos amostrais(Universidade Federal de Viçosa, 2013-02-20) Freitas, Leillimar dos Reis; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/4304104026481353; Almeida, Fernanda Maria de; http://lattes.cnpq.br/4829259372237308Considerou-se um estudo de regressão binária por meio as funções de ligação logit e probit visando verificar a robustez das funções de ligação diante da variação do tamanho da amostra. Estas funções de ligação utilizam, respectivamente, as distribuições acumuladas logística e normal, sendo a principal diferença entre elas os valores de probabilidades nos extremos da variável independente. Dentro desse contexto, foram realizadas simulações com 500 repetições utilizando amostras de 10 diferentes tamanhos, desde 10 a 91, com uma diferença entre as sucessivas amostras de 9 unidades. As medidas de desempenho percentual de convergência, erro quadrático médio da probabilidade geral, erro quadrático médio da probabilidade específica, teste Wald para os coeficientes, foram utilizadas para estabelecer uma recomendação para o uso das duas diferentes funções de ligação quando os dados foram gerados com o uso do logit e probit e analisados por ambas as funções de ligação em cada tamanho de amostra. Concluiu-se que o objetivo desse trabalho foi atingido ao estabelecer uma recomendação para o uso da função de ligação logit para tamanhos inferiores a 20 devido a maior taxa de convergência, ou seja, foi verificado com a utilização da função de ligação logit que há um maior número de amostras em que foi possível estimar os parâmetros da regressão binaria. Para maiores tamanhos de amostras, utilizando as demais medidas de desempenho, tanto o logit como o probit mostraram-se semelhantes, pois não foram encontradas diferenças significativas entre esses dois tipos de funções.Item Métodos de estimação em regressão logística com efeito aleatório: aplicação em germinação de sementes(Universidade Federal de Viçosa, 2012-02-01) Araujo, Gemma Lucia Duboc de; Colosimo, Enrico Antônio; http://lattes.cnpq.br/8074052644801438; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/2051017001548415; Lopes, Jaques Silveira; http://lattes.cnpq.br/1605698945852448; Resende, Marcos Deon Vilela de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4709374E4Em modelos de regressão logística a inclusão do efeito aleatório no intercepto permite capturar os efeitos de fontes de variação provenientes das características particulares de um grupo (heterogeneidade), desinflacionando o erro puro e provocando uma flutuação no intercepto do modelo. Esta inclusão traz complexidade nos métodos de estimação e também muda a interpretação dos parâmetros que, dada originalmente pela razão de chances, passa a ser vista sob o enfoque da razão de chances mediana. A estimação dos parâmetros de um modelo misto pode ser feita por muitos métodos diferentes com desempenho variado, como o método da aproximação de Laplace, da máxima verossimilhança (ML) e da máxima verossimilhança restrita (REML). Assim, o objetivo deste trabalho foi verificar em modelos de regressão logística com efeito aleatório no intercepto as consequências na interpretação dos parâmetros, na qualidade de um experimento e na classificação de tratamentos via razão de chances mediana, e verificar o desempenho dos métodos de estimação acima citados. As análises foram feitas sob simulação e posteriormente num conjunto de dados reais de um experimento com germinação de sementes de pinhão-manso (Jatropha curcas L.). Considerando o modelo de regressão logística com efeito aleatório no intercepto, verificou-se que o método de estimação REML apresentou melhor desempenho e que a variância do efeito aleatório afeta o desempenho de qualquer um dos métodos avaliados sendo estes inversamente proporcionais. Sugerem-se novos estudos para determinar com mais propriedade a influência dos pontos de estabilização e do nível mediano de efetividade na eficiência dos métodos. No experimento de avaliação de germinação de sementes de pinhão-manso envolvendo os substratos rolo de papel, sobre papel, sobre areia e entre areia, a inclusão do efeito aleatório no modelo logístico apontou considerável heterogeneidade na germinação de sementes em unidades diferentes de um mesmo substrato. A razão de chances mediana apontou a superioridade do substrato entre areia em relação a sobre papel na germinação de sementes de pinhão-manso, resultado semelhante ao obtido pelo teste de Tukey.Item Modelo de fragilidade gama e regressão quantílica em análise de sobrevivência de abelhas melíferas expostas à proteína Cry1Ac(Universidade Federal de Viçosa, 2014-02-28) Samudio, Fanni Petrona Ruiz; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Siqueira, Maria Augusta Lima; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777253E4; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/0695547304072125; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/2348397234521519; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2As abelhas são seres indispensáveis para a manutenção da biodiversidade e além disso, são responsáveis por grande porcentagem da produção mundial de alimentos. A Apis mellifera é considerada espécie de grande valor econômico, devido a seus produtos para o consumo humano. Atualmente, com a criação de transgênicos resistentes a insetos, aumentou a possibilidade das abelhas entrarem em contato com as proteínas Cry derivada da bactéria Bacillus thuringiensis, que pode ser toxica às abelhas, tornando o estudo dos riscos de toxicidade importante. Portanto, o estudo dessas proteínas nas abelhas pode ser realizada por meio das técnicas da análise de sobrevivência. Nestas técnicas a variável resposta é o tempo até a ocorrência do evento de interesse, denominado tempo de falha, e se a falha não ocorrer, o tempo é denominado censura, que é uma informação parcial. O principal interesse é estimar parâmetros para descrever a sobrevivência ou riscos, num certo tempo determinado. Usualmente quando existem covariáveis que possam influir no tempo de sobrevivência o ajuste pode ser realizado pelo Modelo Regressão de Cox, também conhecido como de modelo de riscos proporcionais, pela suposição dos riscos proporcionais entre os indivíduos ao longo do tempo. No Capítulo I deste trabalho é realizada uma adaptação da Regressão de Cox conhecida como Modelo de Fragilidade, que além de explicar o risco do indivíduo falhar por influência de covariáveis, também descreve a existência de alguma variável aleatória não observada que agrupa indivíduos em conglomerados naturais ou artificiais. Os tempos de sobrevivência foram modelados para explicar o risco de falhar das operárias imaturas de A. mellifera sob o efeito de covariáveis, sendo a colônia utilizada como variável aleatória e a ingestão da proteína Cry1Ac como variável explicativa fixa. Para avaliar a toxicidade de Cry1Ac sobre A. mellifera, foram testadas três diferentes dietas: artificial pura (D0), artificial diluída em água com Cry1Ac (D2) e artificial diluída em água (D2). Os indivíduos foram coletados de cinco colônias diferentes mantidas em Viçosa, Minas Gerais, Brasil. A variável aleatória colônia (fragilidade) foi significativa, indicando diferenças estatísticas nos tempos de vida das abelhas provenientes de diferentes colônias. Dentro dessa diversidade de fragilidade, a dieta artificial diluída em água apresentou risco maior de falhar, significativamente diferente do efeito da dieta controle (artificial pura). Portanto, a sobrevivência das larvas de abelhas foi diminuída em virtude da adição de água na dieta, pela diluição do alimento. No entanto, a dieta baseada na proteína Cry1Ac não mostrou risco de falha significativo quando comparado com o controle. Uma técnica alternativa ao Modelo de Cox é apresentada no Capítulo II deste trabalho. Quando se verifica que os riscos dos indivíduos, ao longo do tempo dentro da amostra, não são proporcionais, é necessário estratificar ou realizar um outro procedimento na análise. Uma alternativa que pode ser utilizada é a Regressão Quantílica, que estuda a relação entre a variável dependente e as variáveis explicativas nos quantis condicionais, por meio da minimização de erros absolutos ponderados. Esta técnica possui propriedades de equivariância, invariância para transformações monotômicas e robustez na presença de outlier. Assim, pela equivariância podem ser aplicados aos dados com censura. Foi verificado que no mesmo conjunto de dados de biossegurança da proteína Cry1Ac em abelhas denominadas A. mellifera que os riscos de falhar dos indivíduos não são proporcionalidades para as diferentes dietas estudadas. Os tempos de sobrevivência das abelhas foram ajustados pela regressão quantílica, utilizando o estimador de Portnoy para 14 quantis. Nos quantis {0,10; 0,15; 0,30; 0,40} os coeficientes são valores negativos significativamente diferentes de zero. Por tanto, nestes quantis os indivíduos alimentados com a dieta pura (D0) tiveram maior tempo de sobrevivência, que aqueles que têm incorporado à proteína Cry1Ac na dieta (D1), isto aconteceu entre os indivíduos mais novos, já que nesses quantis os tempos de vida das larvas são inferiores ao tempo de vida mediano. Os coeficientes para os quantis {0,35; 0,50;0,60} apresentaram efeito negativo estatisticamente significativos, por tanto a incorporação da água na dieta influiu na sobrevivência das larvas aproximadamente nos tempos medianos de vida.Item Regressão logística politômica ordinal: Avaliação do potencial de Clonostachys rosea no biocontrole de Botrytis cinerea(Universidade Federal de Viçosa, 2012-07-23) Lara, Evandro de Avila e; Maffia, Luiz Antônio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783229P9; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/5652280779186064; Bhering, Leonardo Lopes; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4764363E6; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405O uso da regressão logística como uma ferramenta estatística para modelar a probabilidade de um evento em função de uma ou mais variáveis explicativas, tem crescido entre pesquisadores em várias áreas, inclusive na Fitopatologia. À respeito da regressão logística dicotômica, na qual a variável resposta é do tipo binária ou dummy, é extenso o número de trabalhos na literatura que abordam a modelagem, as pressuposições e a interpretação das análises, bem como alternativas de implementação em pacotes estatísticos. No entanto, quando a variável resposta requer que se utilize três ou mais categorias, o número de publicações é escasso. Isso devido não somente à escassez de publicações relevantes sobre o assunto, mas também à inerente dificuldade de abrangência sobre o tema. No presente trabalho aborda-se a aplicabilidade do modelo de regressão logística politômica ordinal, bem como as diferenças entre os modelos de chances proporcionais, chances proporcionais parciais e chances não proporcionais. Para isso, foram analisados dados de um experimento em que se avaliou o potencial do fungo antagonista Clonostachys rosea no biocontrole da doença denominada mofo cinzento , causada por Botrytis cinerea em morangueiro e tomateiro. Os modelos de chances proporcionais parciais e não proporcionais foram ajustados e comparados, uma vez que o teste score de proporcionalidade acusou rejeição da pressuposição de chances proporcionais. As estimativas dos coeficientes dos modelos bem como das razões de chances foram interpretadas em termos práticos para a Fitopatologia. A regressão logística politômica ordinal se apresentou como uma importante ferramenta estatística para predição de valores, mostrando o potencial do C. rosea em se tornar um produto comercial a ser desenvolvido e usado no controle biológico da doença, pois a aplicação de C. rosea foi tão ou mais eficiente do que a utilização de fungicidas no controle do mofo cinzento.Item Seleção genômica ampla em suínos usando o modelo de sobrevivência de Cox(Universidade Federal de Viçosa, 2013-02-26) Santos, Vinicius Silva dos; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Resende, Marcos Deon Vilela de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4709374E4; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/5809878805245760; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3A seleção genômica ampla (GWS) surgiu em 2001 com o objetivo de aumentar a eficiência e acelerar o ganho de seleção no melhoramento genético baseando-se exclusivamente em marcadores após terem seus efeitos genéticos estimados a partir de dados fenotípicos. No contexto de análise de sobrevivência, o modelo de riscos proporcionais de Cox com efeito aleatório foi comparado ao modelo linear misto, ambos usando a matriz de parentesco baseada em marcadores em substituição à baseada em pedigree, método esse denominado GBLUP. A aplicação foi feita aos dados reais de uma população F2 de suínos em que a variável resposta foi o tempo em dias, do nascimento até o abate do animal e as covariáveis: marcadores SNPs (238), sexo e lote de manejo. Os dados foram previamente corrigidos para seus efeitos fixos e a acurácia do método foi calculada com base na correlação dos postos dos valores genéticos genômicos preditos em ambos os modelos com os valores fenotípicos corrigidos. A análise foi repetida considerando menor número de marcadores SNPs que apresentassem maiores efeitos em módulo. Os resultados demonstraram concordância na predição dos valores genéticos genômicos e na estimação dos efeitos de marcadores para ambos os modelos na situação de dados não censurados e normalidade. No entanto, ao considerar a censura, o modelo de Cox com efeito aleatório normal foi o mais apropriado, uma vez que não houve concordância na predição dos valores genéticos genômicos e na estimação dos efeitos de marcadores com o modelo linear misto com dados imputados. A seleção de marcas permitiu um aumento nas correlações entre os postos dos valores genéticos genômicos preditos pelo modelo linear e pelo modelo de fragilidade de Cox com os valores fenotípicos corrigidos, sendo que para a característica analisada, 120 marcadores foram suficientes para maximizar a capacidade preditiva.Item Técnicas não-paramétricas e paramétricas usadas na análise de sobrevivência de Chrysoperla externa (Neuroptera: Chrysopidae)(Universidade Federal de Viçosa, 2012-03-13) Miranda, Marconi Silva; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Venzon, Madelaine; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4795615T1; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/2270502181985004; Siqueira, Maria Augusta Lima; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777253E4; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6Em análise de sobrevivência, a variável resposta é o tempo de ocorrência de um evento de interesse, denominado tempo de falha. Outra característica da análise de sobrevivência é incorporar ao estudo dados amostrais incompletos, que por algum motivo a ocorrência do evento não foi verificada, dados estes definidos como censurados. O objetivo deste trabalho foi comparar o uso das técnicas paramétricas e não-paramétricas para estimar o tempo de sobrevivência de C. externa (Neuroptera: Chrysopidae), inseto predador que se alimenta de outros insetos e ácaros, sob efeito de três produtos comerciais à base de nim: Neempro (10 g de azadirachtina L-1), Organic neem (3,3 g de Azadirachtina L-1) e Natuneem (1,5 g de azadiractina L-1). Com esse objetivo foram estimadas as funções de sobrevivência para as diferentes concentrações de cada produto, por meio do método não-paramétrico de Kaplan-Meier, e comparadas pelo teste logrank e por meio das técnicas paramétricas, utilizando os modelos exponencial, de Weibull e log-normal. Foi realizado ainda, um estudo com a finalidade de selecionar o modelo mais parcimonioso, utilizando para isto o teste da razão de verossimilhança (TRV) e o critério de informação de Akaike (AIC). As estimativas do modelo paramétrico selecionado foram usadas para determinar as funções de sobrevivência nas concentrações dos três produtos, com o objetivo de comparar com o estimador não-paramétrico de Kaplan-Meier. Definido o melhor modelo foi calculado o tempo mediano de sobrevivência do C. externa nas concentrações testadas dos produtos. Levando em consideração as condições descritas neste experimento, pode-se concluir que as concentrações dos produtos a base de nim possuem influencia na sobrevivência de C. externa. Quanto maior foi a concentração dos produtos utilizados, menor foi o tempo de sobrevivência e entre os produtos avaliados o Neempro foi o que apresentou ser o menos letal ao predador natural.Item Testes estatísticos em regressão logística sob a condição de separabilidade(Universidade Federal de Viçosa, 2010-02-25) Souza, André Oliveira; Colosimo, Enrico Antônio; http://lattes.cnpq.br/8074052644801438; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/5802669165872867; Loschi, Rosângela Helena; http://lattes.cnpq.br/8443300958745785; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6A regressão logística é o método estatístico usual de análise utilizado quando o objetivo é verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Usualmente, os parâmetros deste modelo são estimados pelo método de máxima verossimilhança genuína, e testes sobre estes parâmetros são construídos considerando as distribuições aproximadas dos estimadores. Isto significa que amostras grandes tornam-se necessárias para obter resultados mais confiáveis. Em estudos envolvendo dados binários, é frequente a presença de uma variável resposta cujo sucesso é pouco provável, ou seja, tem-se um evento raro, o que pode gerar uma amostra de dados esparsos. Nestes casos, diz-se que os dados podem estar sob a condição de separabilidade, e esta situação está frequentemente associada à presença de uma covariável categórica, podendo os estimadores de máxima verossimilhança, para pelo menos um parâmetro, não existir. Na situação de separabilidade recomenda-se utilizar o método de máxima verossimilhança penalizada proposto por Firth (1993). O objetivo principal deste trabalho foi verificar por meio de simulação Monte Carlo os poderes dos testes da razão de verossimilhanças (TRV) e de Wald obtido via máxima verossimilhança penalizada na condição de separabilidade. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais. A simulação Monte Carlo com uma variável explicativa no modelo possibilitou obter indicativos que o TRV tem maior poder que o teste de Wald.