Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 30
  • Imagem de Miniatura
    Item
    Genomic prediction models with additive and dominance effects for censored traits
    (Universidade Federal de Viçosa, 2017-03-31) Santos, Vinicius Silva dos; Martins Filho, Sebastião; http://lattes.cnpq.br/5809878805245760
    Recently, dominance effects have been included in the genomic selection of several species, with the GBLUP-D method being the most used. This method consists in replacing, in the REML / BLUP procedure, the pedigree-based relationship matrices by marker-based relationship matrices. This method can be performed using the GVCBLUP software or through BGLR R-package, which is based on Bayesian regression via the Reproduction Kernel Hilbert Space. The objective of this work was to evaluate the possibility and effectiveness of GBLUP-D implementation via the lmekin function implemented in the coxme package of R through the inclusion of additive and dominance genomic matrices. Thus, through simulated data analyzes, the results obtained by the lmekin function were compared with those obtained by the GVCBLUP software and the BGLR package. Subsequently, the analysis was extended considering phenotypes with censored observations in a F 2 population of pigs, where the time (in days) of the birth to the slaughter of the animal was evaluated through the Cox model and the truncated normal model, in that the censoring was considered or not in the analysis. Finally, the inclusion of the polygenic effect in the additive-dominant models was evaluated in three traits with complete and normally distributed observations of a mice population, and in censored data from a F 2 population of pigs. The results showed that the lmekin function is an efficient alternative for the fit of genomic linear models with additive and dominance effects, since it results were identical to those obtained through GVBLUP software. For the censored data, it was observed a high agreement between the Cox model and the truncated normal model in selecting the best individuals and the highest marker effects. Thus, it was possible to show the possibility of predicting genomic genetic values for censored data, considering the Cox survival model with additive and dominance effects. The inclusion of the polygenic effect in the evaluated models allowed a significative increase in the additive heritabilities of the evaluated traits.
  • Imagem de Miniatura
    Item
    Estudos sobre a influência de afirmações populares na Geoestatística Clássica
    (Universidade Federal de Viçosa, 2017-02-15) Rosa, Lidiane Maria Ferraz; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/7463240800478263
    O presente trabalho teve por objetivo estudar assuntos abordados na Geoestatística de modo a preencher lacunas metodológicas que surgem naturalmente em áreas recentes da ciência e/ou que surgem de afirmações populares. Para isso, foi necessário realizar estudos teórico-práticos afim de se obter mais evidências e comprovações. Foram utilizados em todos os estudos conjuntos de dados reais. No primeiro capítulo foi feito um estudo quanto à precisão entre malhas amostrais regulares (malha hexagonal, malha quadrangular e malha triangular). No segundo capítulo foi realizado um estudo sobre a questão do uso do teste de Normalidade em uma análise geoestatística. Nesse estudo foi mostrada toda fundamentação teórica do principal teste de normalidade, teste de Shapiro-Wilk, e estudos práticos para essa comprovação. No terceiro capítulo realizou- se um estudo sobre a assimetria e o comprometimento de uma análise geoestatística para dados com essa característica. Finalmente, no quarto capítulo foram comparados três interpoladores geoestatísticos (krigagem simples, krigagem universal e krigagem regressão) quanto à eficácia na representação de modelos digitais de profundidade (MDP).
  • Imagem de Miniatura
    Item
    Desempenhos de diferentes propostas de planejamentos de gráficos de controle multivariados
    (Universidade Federal de Viçosa, 2017-07-17) Lara, Rodrigo Luiz Pereira; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/6285325810018078
    O desenvolvimento tecnológico iniciado no século passado, juntamente com o aumento da competição do mercado e a exigência dos consumidores no século atual acarretam o interesse em Gráficos de Controle Multivariados (GCMs). Nos trabalhos até então divulgados sobre GCMs, é comum o enfoque na comparação de desempenho entre eles, entretanto, essas comparações revelam-se restritas e direcionadas ao GCM recém proposto no trabalho em questão. O presente trabalho estudou, teoricamente, as estatísticas e aplicou, computacionalmente, os gráficos de controle multivariados T 2 de Hotelling, Multivariate Exponentially Weighted Moving Average (MEWMA), Multivariate Cumulative Sum (MCUSUM), Linear Multivariate Exponentially Weighted Moving Average (Lin- MEWMA) e Exponentially Likelihood Ratio (ELR) para o monitoramento do vetor de médias de todas as características importantes para a caracterização multivariada de processos. Para um processo sob controle estatístico, foram simulados dados de uma variável resposta p-variada e, para processos fora de controle estatístico, foram estabelecidas combinações de descontrole para o vetor de médias. Para tanto, foram realizadas 20.000 simulações por subgrupo racional e ajustes a distribuições de probabilidades multivariadas. O T2 de Hotelling foi o mais ineficaz dos GCMs ao passo que o Lin-MEWMA destacou-se pela sua baixa probabilidade do alarme falso. O ELR e MCUSUM mostraram desempenho melhores em relação aos GCMs anteriores, porém com dificuldade em detecção de pequenas mudanças no vetor de médias. Utilizando-se recomendações pouco citadas na literatura (λ = 0,03 e 0,04) o MEWMA mostrou-se o melhor dos GCMs estudados de modo a não interferir um processo sob controle, mas interromper a produção quando seus produtos estiverem sendo produzido fora do vetor de médias considerado sob controle.
  • Imagem de Miniatura
    Item
    Avaliação do impacto de atributos da carreira docente na UFV via Conjoint Analysis
    (Universidade Federal de Viçosa, 2017-02-16) Teixeira, Gabriely; Osório, Carlos Henrique; http://lattes.cnpq.br/2481418455545901
    Estudos recentes, que envolvem a carreira de professores universitários, têm relacionado satisfação ou insatisfação com a carreira a um conjunto de fatores do exercício profissional. A satisfação profissional reflete diretamente na eficácia do trabalho desempenhado. Alguns atributos são cruciais para a prática da docência com excelência nas universidades, pois afetam a satisfação no exercício do trabalho docente e podem alterar a produtividade do profissional desta área. Portanto, é de interesse conhecer os atributos ou fatores que influenciam na satisfação do docente e que possibilitem a busca por modelos de trabalho adequados. É neste contexto que se insere a presente dissertação, tendo como objetivo principal verificar a aplicabilidade da metodologia denominada Ratings-Based Conjoint Analysis (Análise Conjunta de Fatores Baseada em Notas) para avaliar a satisfação dos professores da UFV quanto a alguns atributos ligados à sua atuação profissional. A Conjoint Analysis permitiu decompor a opinião dos professores respondentes, informada por uma nota de satisfação global com relação às afirmações apresentadas, em partes devidas aos níveis dos atributos, de modo que se estimou as contribuições individualmente para a formação da preferência pelo tratamento ou satisfação global. Foram definidos quatro atributos: ] - Regime de trabalho, 2 - Valorização profissional, 3 - Liberdade de atuação e 4 - Infraestrutura. Os tratamentos foram formados por afirmações envolvendo estes atributos, com dois níveis cada (atributo contribui ou não), e estas foram apresentadas a uma amostra representativa dos professores em exercício da UFV, dimensionada por amostragem por quotas (por centro de com os de uma amostra voluntária, obtidos pela Comissão Própria de Avaliação da Universidade Federal de Viçosa (CPA-UFV), no V Ciclo de Autoavaliação Institucional 2015, a fim de verificar se a amostragem voluntária dos docentes, adotada pela CPA, é valida no sentido de representar a opinião dos docentes da UFV. Os resultados obtidos indicam que a metodologia Conj oint Analysis pode ser aplicada objetivando-se avaliar a opinião e satisfação dos respondentes, por meio de afirmativas apresentadas. Professores da UFV consideram o fator liberdade de atuação como o que mais influencia na satisfação com a carreira, atuar na tríade ensino, pesquisa e extensão e a valorização da carreira perante a sociedade também exercem influencia positiva. Os resultados indicaram também que a amostra voluntária adotada pela CPA é capaz de representar a opinião dos docentes como em uma amostra dimensionada, visto que os resultados obtidos foram semelhantes.
  • Imagem de Miniatura
    Item
    Seleção genômica não paramétrica via distância genética entre subpopulações
    (Universidade Federal de Viçosa, 2017-02-15) Lima, Leísa Pires; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1919088712911346
    A seleção genômica ampla (Genome Wide Selection – GWS) consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma. As principais metodologias propostas e utilizadas na GWS se dividem em metodologias paramétricas, semi-paramétricas ou metodologias de redução de dimensionalidade. Dessa forma, um dos objetivos desse trabalho foi avaliar metodologias não paramétricas, denominadas Delta-p e Regressão Categórica Tripla (TCR), além de compará-las com métodos tradicionalmente aplicados a GWS, tais como G-BLUP (Genomic Best Linear Unbiased Predictor) e BLASSO (Bayesian Least Absolute Shrinkage and Selection Operator). O primeiro capítulo deste trabalho consiste em uma revisão de literatura sobre a GWS apresentando sua definição e importância no melhoramento genético, abordando sobre o desenvolvimento dos métodos propostos e avaliados e também retratando sobre o processo de validação utilizado para a comparação das metodologias. No segundo capítulo, foi proposto e analisado o método Delta-p e um índice de seleção, denominado índice Delta-p/G-BLUP que combina os valores genômicos provenientes do método G-BLUP com os valores genômicos estimados via Delta-p. Sob o contexto Bayesiano, foi incorporado ao LASSO Bayesiano, por meio de uma distribuição a priori altamente informativa, os valores genômicos estimados via G-BLUP, essa abordagem foi denominada método Bayes Híbrido. Para avaliar a eficiência dos métodos estatísticos, no que se refere à estimação dos valores genômicos aditivos e devidos à dominância, foram utilizados dados simulados, sendo estabelecidos oito cenários (dois níveis de herdabilidade × duas arquiteturas genéticas × ausência de dominância e dominância completa) sendo cada cenário simulado dez vezes. Os resultados do segundo capítulo indicaram que o índice Delta-p/G-BLUP e o Bayes Híbrido se mostraram eficientes para predição dos valores genômicos podendo ser usados vantajosamente na GWS. Ademais, no terceiro capítulo, foi avaliada a eficiência do método TCR em comparação com os métodos G-BLUP e BLASSO utilizando quatro cenários (dois níveis de herdabilidade × modelo infinitesimal × ausência de dominância e dominância completa) sendo cada cenário simulado dez vezes. Os resultados indicaram que o método TCR mostrou-se adequado para a estimação dos componentes de variação genômica e da herdabilidade. Em vista disso, uma metodologia baseada em uma modificação do método G-BLUP, denominada TCR/G-BLUP, foi proposta e consiste em estimar a herdabilidade via TCR e fixá-la nas equações de modelos mistos do método G-BLUP. A eficiência dos métodos G- BLUP e TCR/G-BLUP foram comparadas utilizando dados reais, seis caracteristicas avaliadas em mandioca (Manihot esculenta). O experimento foi instalado segundo um delineamento em blocos casualizados com três repetições e 10 plantas por parcela. Os resultados indicaram que o método TCR/G-BLUP foi capaz de aumentar a acurácia e fornecer valores genômicos não viesados se comparados ao método G-BLUP, sendo, portanto recomendado para a aplicação na GWS.
  • Imagem de Miniatura
    Item
    Seleção genômica para características categóricas em eucalipto
    (Universidade Federal de Viçosa, 2017-02-17) Silveira, Lucas Souza da; Martins Filho, Sebastião; http://lattes.cnpq.br/8781027361635034
    Atualmente muitas metodologias têm sido propostas para melhoria da predição de valores genéticos genômicos, no entanto, muitas delas assumem a pressuposição de que as variáveis respostas possuem distribuição gaussiana. Contudo, existem características como resistência a doença, bifurcação em árvores de eucalipto, estágios de florescimento e acamamento em plantas, entre outras, que são classificadas como categóricas, não possuindo distribuição gaussiana para os dados. Diante do exposto, objetivou-se comparar o modelo linear generalizado com o modelo linear de Gauss-Markov, obtendo os valores genéticos genômicos de indivíduos com fenótipos categóricos referentes a resistência à ferrugem do eucalipto, causada pelo patógeno Puccinia psidii Winter. Ambos os modelos foram aplicados quando a característica fenotípica possuía quatro classes de infecção (planta imune ou com reação de hipersensibilidade, pequenas pústulas, pústulas medianas e pústulas grandes) e quando estava categorizada como tipos de reação (resistente ou suscetível). O critério de informação da deviance (DIC - Deviance Information Criterion) foi utilizado para seleção do modelo adequado para descrever a característica fenotípica. O procedimento de validação cruzada via Jacknife foi utilizado para validação das estimativas. A acurácia preditiva e o viés foram utilizados para comparação dos modelos. Quando a característica foi categorizada com quatro classes de infecção, os valores de acurácia foram semelhantes para os dois modelos (diferença menor que 0,03). No entanto, quando a categorização foi realizada com duas classes, estas diferenças foram maiores que 0,03 para apenas um dos estimadores de acurácia. O viés na predição de valores genéticos genômicos foi melhor no modelo linear de Gauss- Markov em ambos os tipos de categorização.
  • Imagem de Miniatura
    Item
    Abordagem estatística de variáveis climáticas de Viçosa - MG
    (Universidade Federal de Viçosa, 2017-02-15) Lacerda, Maurício Silva; Emiliano, Paulo César; http://lattes.cnpq.br/7403859031624608
    Conhecer o comportamento de variáveis climáticas como a temperatura e o índice de chu- vas de uma cidade ou região é de grande importância para que haja melhor planejamento e tomadas de decisões futuras, por este motivo estudos destas variáveis estão sempre em evidência. Desta forma, tem-se como objetivo geral realizar um estudo de algumas carac- terísticas do clima da cidade de Viçosa-MG, por meio de séries temporais, com enfoque nas temperaturas máximas e mínimas e no nível de precipitação pluviométrica, com obje- tivo específico de identificar alterações nestes fatores. Para isso analisou-se um conjunto de dados históricos acerca do clima da cidade com registros desde janeiro de 1968 até julho de 2016, iniciando o tratamento dos dados calculando a média mensal para as tem- peraturas e o total mensal para a precipitação, em seguida foi aplicado o teste de Dickey- Fuller aumentado para análise da tendência, e uma decomposição espectral da série nas frequências de Fourier para detectar sazonalidade. Posteriormente, escolheu-se a classe dos modelos SARIMA e as suas ordens escolhidas por meio dos critérios de informação bayesiano (BIC) e Akaike corrigido (AICc). O modelo escolhido foi verificado através de uma análise residual com os testes de Shapiro-Wilk e Ljung-Box. Para a série histórica da média mensal da temperatura máxima o modelo SARIM A(2, 1, 2) × (0, 1, 1) se apresen- tou com bom ajuste. As séries da média mensal da temperatura mínima e da precipitação pluviométrica total mensal necessitaram de um modelo que ajustassem os resíduos para que os pressupostos da modelagem fossem satisfeitos, com isso a primeira teve sua corre- lação serial modelada pelo SARIM A(1, 1, 2) × (0, 1, 1) e seus resíduos pelo ARCH(2) e a segunda série teve os modelos SARIM A(1, 0, 0) × (0, 1, 1) para a ajustar a correla- ção serial e ARCH(2) para os resíduos. Com o presente estudo conclui-se que a cidade de Viçosa-MG teve uma elevação acima de 1°C na média mensal de suas temperaturas máximas e mínimas, enquanto que o nível de precipitação não sofreu alterações ao longo do tempo estudado.
  • Imagem de Miniatura
    Item
    Identificação de outliers multivariados - Uma aplicação em dados de saúde
    (Universidade Federal de Viçosa, 2017-02-17) Barbosa, Josino José; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/1948800098593563
    A identificação de outliers desempenha um papel importante na análise estatística, pois tais observações podem conter informações importantes em relação aos dados. Se modelos estatísticos clássicos são cegamente aplicados a dados contendo valores atípicos, os resultados podem ser enganosos e decisões equivocadas podem ser tornadas. Além disso, em situações práticas, os próprios outliers são muitas vezes os pontos especiais de interesse e sua identificação pode ser o principal objetivo da investigação. Por isso, a finalidade desse trabalho é propor uma técnica de detecção de outliers multivariados, baseada em análise agrupamento e comparar essa técnica com o método de identificação de outliers via Distância de Mahalanobis. Para geração dos dados utilizou-se simulação através do Método de Monte Carlo e a técnica de mistura de distribuições normais multivariadas. Os resultados apresentados nas simulações mostram que o método proposto foi superior ao método de Mahalanobis tanto para sensibilidade quanto para especificidade, ou seja, ele apresenta maior capacidade de diagnosticar corretamente os indivíduos outliers e os não outliers. Além disso, a metodologia proposta foi ilustrada com uma aplicação em dados reais provenientes da área de saúde.
  • Imagem de Miniatura
    Item
    Estudo do crescimento de bovinos da raça Guzerá utilizando modelos não lineares mistos
    (Universidade Federal de Viçosa, 2016-02-25) Alves, Raphael Fernandes Soares; Carneiro, Antonio Policarpo Souza; http://lattes.cnpq.br/4861831125964646
    Os modelos não lineares mistos são modelos que contêm efeitos fixos e aleatórios. Tais modelos são efetivos para dados longitudinais e podem ser aplicados a dados desbalanceados ou incompletos. Os dados utilizados foram provenientes da Associação Brasileira de Criadores de Zebu (ABCZ), e contém observações de peso corporal e idade de bovinos da raça Guzerá. Os modelos ajustados foram Logístico, Gompertz, Brody e Von Bertalanffy. Os critérios de qualidade de ajuste utilizados para comparar os modelos foram AIC, BIC, R 2 , DMA e EQM. No capítulo 1, o objetivo foi avaliar a qualidade de ajuste dos modelos não lineares mistos no estudo do crescimento de bovinos da raça Guzerá de diferentes regiões do nordeste brasileiro incorporando ao modelo efeitos aleatórios de animal. A inclusão de efeitos aleatórios de animal ao modelo diminui a variância residual e considera a variabilidade entre os animais. Os modelos com dois efeitos aleatórios incorporados aos parâmetros peso assintótico e taxa de maturidade, apresentaram melhores resultados em relação a qualidade do ajuste. Os modelos mais adequados são o Gompertz e o Von Bertalanffy, respectivamente, para machos e fêmeas da raça Guzerá. No capítulo 2, o objetivo foi avaliar a qualidade de ajuste dos modelos Gompertz e Von Bertalanffy, respectivamente para bovinos machos e fêmeas da raça Guzerá, incorporando ao modelo o efeito fixo de cinco regiões de produção do nordeste brasileiro, e comparar as curvas de crescimento entre regiões de produção através dos intervalos de confiança. A interpretação dos intervalos de confiança gerados para cada parâmetro permite identificar que machos da raça Guzerá das regiões de produção Gado- Algodão e Serra Geral da Bahia possuem peso assintótico comum, enquanto a taxa de maturidade é comum para animais das regiões Itapetinga-Valadares e Mata-Agreste. As fêmeas da raça Guzerá das regiões de produção Gado-Algodão e Sertão possuem peso assintótico comum, assim como das regiões Itapetinga-Valadares e Serra Geral da Bahia, enquanto a taxa de maturidade é comum nas regiões Mata-Agreste, Itapetinga-Valadares e Serra Geral da Bahia.
  • Imagem de Miniatura
    Item
    Seleção de variáveis no estudo da diversidade genética via análise de procrustes
    (Universidade Federal de Viçosa, 2016-02-24) Pontes, Daiana Salles; Cruz, Cosme Damião; http://lattes.cnpq.br/6638973949782292
    Para o sucesso de um programa de melhoramento é indispensável que população de trabalho disponha de variabilidade genética de forma que a prática de seleção seja viável. Nesse sentido, a avaliação da divergência genética têm sido de grande importância por fornecerem parâmetros para a identificação de combinações híbridas cujo cruzamento proporcione maior efeito heterótico e maior probabilidade de recuperar genótipos superiores nas gerações segregantes. O estudo sobre diversidade genética elucida relações genéticas, quantifica ou prediz o nível de variabilidade total existente e sua distribuição entre indivíduos, acessos de bancos de germoplasma, linhagens e cultivares ou dentro de populações e espécies. Conhecimento que tem proporcionado, dentre outras coisas, importantes contribuições ao melhoramento genético, ao gerenciamento de bancos de germoplasma e à conservação de recursos genéticos. Assim, o interesse maior, em estudos de caracterização da diversidade genética das espécies vegetais, animais e de microrganismos consiste na identificação de grupos de genótipos similares de forma que a maior diferença entre os grupos formados seja realçada. Para isso, algumas técnicas multivariadas, como análise discriminante, componentes principais, análise de coordenadas e de agrupamento podem ser utilizadas nesse tipo de estudo. Contudo, de modo geral, tais técnicas ainda exigem a utilização de todas as variáveis para a avaliação dos indivíduos/acessos, o que nem sempre é possível devido ao alto custo ou mesmo o grau de dificuldade envolvido na obtenção de determinadas variáveis. É necessária, portanto, a aplicação de algum método de seleção de variáveis ou de um critério de seleção baseado em alguma técnica analítica, como é o caso do critério apresentado por Jolliffe (1972). Baseado na técnica de componentes principais, esse critério é usualmente utilizado na determinação da importância relativa de caracteres no estudo da diversidade de modo que caracteres de menor importância serão desconsiderados do estudo. Há também outra metodologia baseada em Análise de Procrustes ainda pouco utilizada em estudos de diversidade genética, sobretudo para este fim, por meio da qual é possível selecionar variáveis com base no padrão de dissimilaridade ou similaridade entre acessos. Desta forma, este trabalho tem por objetivo propor um critério baseado em Análise de Procrustes como nova possibilidade para a seleção de variáveis no estudo da diversidade genética. Em seguida, comparar o critério apresentado com o critério proposto por Jolliffe (1972) - ambos os critérios estabelecidos por meio do uso de componentes principais. Para elucidar a teoria apresentada, foram consideradas informações de 40 acessos de café Conilon avaliados em Sooretama/ES no ano 2000 segundo 16 caracteres agronômicos. As técnicas apresentadas neste trabalho demonstram ser vantajosas na seleção (ou descarte) de variáveis proporcionando relevante contribuição para os estudos sobre diversidade genética. A técnica apresentada, baseada em análise de Procrustes, torna-se uma alternativa mais eficaz do que o uso do critério de Jolliffe (1972) para fins de estudo da diversidade genética.