Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
6 resultados
Resultados da Pesquisa
Item Avaliação de uma nova modelagem proporcional dos efeitos aditivos e de dominância e reflexos na genética quantitativa e na seleção genômica(Universidade Federal de Viçosa, 2019-07-24) Miranda, Taiana Lopes Rangel; Resende, Marcos Deon Vilela de; http://lattes.cnpq.br/0513010608168896A Seleção Genômica (Genomic Wide Selection – GWS) é uma abordagem muito utilizada nos programas de melhoramento e foi desenvolvida com o intuito de utilizar as informações diretas do DNA no processo de identificação de indivíduos geneticamente superiores, através da predição do valor genético genômico (Genomic Estimated Breeding Value – GEBV). A GWS baseia-se na análise de um grande número de marcadores moleculares SNPs (Single Nucleotide Polymorphisms) extensamente distribuídos no genoma. O modelo genético básico tradicionalmente utilizado na Genética Quantitativa e na GWS (modelo infinitesimal de Fisher, 1918), atribui à variância aditiva uma grande proporção de explicação da variância genética, mesmo sob ação gênica de dominância. Isto se deve ao fato de, no processo de derivação de expressões biométricas, a variância aditiva ser maximizada e a variância de dominância ser o resíduo da variação genética total. Recentemente um modelo genético alternativo foi proposto, no qual a variância de dominância é priorizada usando uma parametrização em que heterozigotos e um dos homozigotos são codificados com valores equivalentes. Nessa proposta o componente genético aditivo ao nível de locos é introduzido no modelo depois da variância de dominância ter sido maximizada. O objetivo desse trabalho foi avaliar essa nova parametrização dos efeitos aditivos e de dominância na seleção genômica e genética quantitativa em geral, e compará-la à parametrização tradicionalmente aplicada utilizando o método G-BLUP (Genomic Best Linear Unbiased Predictor). Adicionalmente essas comparações foram estendidas contemplando diferentes MAFs (Minor Allele Frequency). O procedimento de validação cruzada foi utilizado para avaliar as estimativas dos parâmetros usados nas comparações. Estimativas dos componentes da variação genética e das herdabilidades aditiva, devida à dominância e genotípica total, bem como da capacidade preditiva e do coeficiente da regressão entre o fenótipo e o GEBV foram obtidos, visando a comparação dos modelos. Dois índices combinando as estimativas dos componentes de variância obtidos pelos dois modelos foram propostos e avaliados. Os resultados indicaram que a nova modelagem, bem como a combinação de ambas são alternativas para melhorar as estimativas das variâncias genética aditiva e de dominância e da proporção entre elas.Item Genomic prediction models with additive and dominance effects for censored traits(Universidade Federal de Viçosa, 2017-03-31) Santos, Vinicius Silva dos; Martins Filho, Sebastião; http://lattes.cnpq.br/5809878805245760Recently, dominance effects have been included in the genomic selection of several species, with the GBLUP-D method being the most used. This method consists in replacing, in the REML / BLUP procedure, the pedigree-based relationship matrices by marker-based relationship matrices. This method can be performed using the GVCBLUP software or through BGLR R-package, which is based on Bayesian regression via the Reproduction Kernel Hilbert Space. The objective of this work was to evaluate the possibility and effectiveness of GBLUP-D implementation via the lmekin function implemented in the coxme package of R through the inclusion of additive and dominance genomic matrices. Thus, through simulated data analyzes, the results obtained by the lmekin function were compared with those obtained by the GVCBLUP software and the BGLR package. Subsequently, the analysis was extended considering phenotypes with censored observations in a F 2 population of pigs, where the time (in days) of the birth to the slaughter of the animal was evaluated through the Cox model and the truncated normal model, in that the censoring was considered or not in the analysis. Finally, the inclusion of the polygenic effect in the additive-dominant models was evaluated in three traits with complete and normally distributed observations of a mice population, and in censored data from a F 2 population of pigs. The results showed that the lmekin function is an efficient alternative for the fit of genomic linear models with additive and dominance effects, since it results were identical to those obtained through GVBLUP software. For the censored data, it was observed a high agreement between the Cox model and the truncated normal model in selecting the best individuals and the highest marker effects. Thus, it was possible to show the possibility of predicting genomic genetic values for censored data, considering the Cox survival model with additive and dominance effects. The inclusion of the polygenic effect in the evaluated models allowed a significative increase in the additive heritabilities of the evaluated traits.Item Genômica e modelos não-lineares mistos no ajuste de curvas de lactação de bovinos da raça Girolando(Universidade Federal de Viçosa, 2018-10-05) Teixeira, Filipe Ribeiro Formiga; Nascimento, Moysés; http://lattes.cnpq.br/4574646837472160Pesquisas que visam a construção de curvas de lactação de diferentes raças de gado de leite têm sido realizadas com frequência nos últimos anos. Esses trabalhos usualmente têm como objetivo identificar o comportamento da produtividade leiteira do rebanho, a identificação de indivíduos superiores segundo suas características de lactação ou estudar as associações fenotípicas/genéticas entre diferentes variáveis de lactação. O presente trabalho teve como objetivo propor a utilização da Seleção Genômica Ampla para estimar os valores genéticos genômicos das características de lactação e construir as curvas de lactação genômicas de bovinos da raça Girolando (responsável por 80% da produção do leite brasileiro) baseadas em informações estimadas pelo ajuste de modelos não-lineares mistos. Objetivou-se também a identificar o melhor modelo para o ajuste de curvas de lactação dessa raça, sendo escolhido dentre nove propostos na literatura. Os dados foram fornecidos pela Embrapa Gado de Leite (Juíz de Fora-MG), referentes a 1.822 registros de controle leiteiro correspondente a 226 bovinos Girolando, juntamente com a informação de 37.673 marcadores SNPs associados aos animais em estudo. Comparando nove modelos não-lineares (Brody, Cappio-Borlino, Cobby & Le Du, Dhanoa, Nelder, Papajscik e Bodero, Rook, Sikka e Wood) com a abordagem de modelos mistos, constatou-se que a melhor equação segundo os critérios de AIC e BIC, com valores de 10.013,79 e 10.101,92, respectivamente, foi a de Wood. Através das características de lactação estimadas pelo modelo de Wood foi possível identificar um grupo seleto de 8 animais com maior produtividade (média de 10.584 Kg/lactação). A estimação dos valores genéticos genômicos (Estimated Genomic Breeding Values – EGBV) das características genômicas (produção inicial – a, taxa de ascensão – b, taxa de declínio – c, produção total, pico de lactação, persistência e tempo até o pico) através do BLASSO (Bayesian LASSO) permitiram o conhecimento genético dessas características. As herdabilidades das mesmas variaram de 0,09 para a taxa de declínio até 0,29 para a persistência. As correlações entre seus valores genéticos genômicos apresentaram resultados de -0,90 (entre a taxa de declínio e a persistência) a 0,98 (entre o pico de lactação e a produção total). Os coeficientes de Kappa para concordância entre os indivíduos selecionados de acordo com diferentes variáveis variou de 0 a 0,95. As análises realizadas permitiram o conhecimento do melhor entre os modelos não-lineares para ajuste das curvas de lactação de bovinos da raça Girolando. Com a construção das curvas genômicas foi possível identificar diferenças genéticas entre os indivíduos, estas livres dos efeitos ambientais. A abordagem proposta foi capaz de produzir resultados relevantes e pode ser aplicada para outras raças e situações diferentes.Item Predição genômica via redução de dimensionalidade em modelos aditivo dominante(Universidade Federal de Viçosa, 2018-02-26) Costa, Jaquicele Aparecida da; Azevedo, Camila Ferreira; http://lattes.cnpq.br/6939298449989672Grandes avanços no melhoramento animal e vegetal têm sido propiciados utilizando- se informações da genética molecular. Nessa perspectiva, idealizaram a Seleção Genômica Ampla (Genome Wide Selection – GWS) cuja abordagem envolve a cobertura completa do genoma utilizando milhares de marcadores SNPs (Single Nucleotide Polymorphisms). O objetivo é estimar o mérito genético dos indivíduos e para tal, as pesquisas realizadas na GWS se baseiam na busca e na aplicação de metodologias estatísticas que visam resolver os problemas enfrentados no processo de estimação, como a alta dimensionalidade e a alta colinearidade entre os marcadores. Dentre elas, se destacam os métodos de redução de dimensionalidade: Regressão via Componentes Principais (PCR), Quadrados Mínimos Parciais (PLS) e Regressão via Componentes Independentes (ICR) e o tradicional método de regularização/shrinkage, G-BLUP (Genomic Best Linear Unbiased Predictor). Assim, o primeiro capítulo contempla as ideias centrais e a importância da GWS para o melhoramento genético, a definição de efeitos aditivos e de efeitos devido à dominância, os problemas estatísticos enfrentados na estimação dos efeitos de marcadores nos fenótipos pelo método usual baseado em quadrados mínimos ordinários, bem como as metodologias estatísticas baseadas em redução dimensional para resolver tais problemas e os procedimentos de validação que tem por finalidade comparar as metodologias estatísticas da GWS. Já o segundo capítulo refere-se a proposição e aplicação de sete critérios para a escolha do número ótimo de componentes independentes a serem utilizados na ICR, considerando apenas os efeitos aditivos. Os critérios consistem em determinar que o número de componentes independentes seja igual ao número de componentes que conduz: (i) os valores genômicos estimados via PCR a um maior valor de acurácia; (ii) os valores genômicos estimados via PCR a um menor valor de viés; (iii) a PCR a 80% de explicação da variação total de X; (iv) a PCR a 80% de explicação da variação total de Y; (v) a ICR a 80% de explicação da variação total de X; além dos critérios que consistem no número de componentes independentes igual ao número de variáveis determinadas pelos procedimentos (vi) Forward Selection e (vii) Backward Selection. O conjunto de dados simulados era composto por 2.000 marcadores SNPs e as populações simuladas totalizaram 1.000 indivíduos de 20 famílias de irmãos completos que tiveram os fenótipos e os genótipos avaliados. Além disso, os cenários simulados são baseados em dois níveis de herdabilidade e duas arquiteturas genéticas com ausência de dominância, constituindo assim, em quatro cenários, os quais foram simulados dez vezes cada. Com o intuito de demonstrar a aplicabilidade do estudo no melhoramento genético, foram avaliadas seis características de produtividade de um conjunto de dados reais de arroz asiático Oryza sativa (Número de panículas por planta, altura da planta, comprimento da panícula, número de panículas no perfilho primário, número de sementes por panícula e espiguetas por panícula) correspondente a 370 acessos de arroz, os quais foram genotipados para 44.100 marcadores SNPs. Em ambos os casos (dados simulados e reais) foi utilizada a validação independente e calculada as medidas de eficiência para comparar os critérios. De modo geral, as análises indicaram que o primeiro critério (número de componentes independentes igual ao número de componentes principais cujos os valores genômicos estimados via PCR apresentava maior valor de acurácia) se mostrou mais eficiente para os dois conjuntos de dados e apresentou as medidas de eficiência mais próximas do método exaustivo, com a vantagem de exigir menos tempo e esforço computacional. Para complementar o estudo, o terceiro capítulo consiste na aplicação dos três critérios mais eficientes do capítulo 2, os quais consistem no número de componentes independentes igual ao número de componentes que conduz os valores genômicos estimados via PCR a um maior valor de acurácia; a um menor valor de viés e a PCR a 80% de explicação da variação total de X considerando o modelo aditivo-dominante. Ainda no contexto deste modelo, foi aplicado os três métodos de redução de dimensionalidade (PCR, PLS e ICR) levando em consideração a escolha do número ótimo de componentes que conduz os valores genômicos aditivos, valores genômicos devido à dominância ou os valores genômicos totais (aditivo + dominância) a uma maior acurácia. Todos os métodos de redução de dimensionalidade foram comparados com o G-BLUP em termos de eficiência na estimação dos valores genômicos. As populações simuladas foram constituídas por 1.000 indivíduos de 20 famílias de irmãos completos, sendo genotipados para 2000 marcadores SNPs e as análises correspondentes a quatro cenários (dois níveis de herdabilidade × duas arquiteturas genéticas) sendo assumido dominância completa. Os resultados do capítulo 3 assinalaram que se manteve a superioridade do critério 1 nos modelos aditivo-dominante. Além disso, para a estimação dos efeitos aditivos e devido a dominância concomitantemente por meio dos métodos de redução de dimensionalidade, é recomendável utilizar o número de componentes que conduz o valor genômico devido à dominância a uma maior acurácia. Ademais, ao confrontar as metodologias de redução dimensional (ICR, PCR e PLS) com o G-BLUP, verifica- se que a PCR é superior em termos de acurácia e o método vantajosamente apresenta um dos menores tempos computacionais na execução das análises. Ademais, nenhum dos métodos considerados capturaram adequadamente as herdabilidades simuladas e apresentaram viés.Item Seleção genômica não paramétrica via distância genética entre subpopulações(Universidade Federal de Viçosa, 2017-02-15) Lima, Leísa Pires; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1919088712911346A seleção genômica ampla (Genome Wide Selection – GWS) consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma. As principais metodologias propostas e utilizadas na GWS se dividem em metodologias paramétricas, semi-paramétricas ou metodologias de redução de dimensionalidade. Dessa forma, um dos objetivos desse trabalho foi avaliar metodologias não paramétricas, denominadas Delta-p e Regressão Categórica Tripla (TCR), além de compará-las com métodos tradicionalmente aplicados a GWS, tais como G-BLUP (Genomic Best Linear Unbiased Predictor) e BLASSO (Bayesian Least Absolute Shrinkage and Selection Operator). O primeiro capítulo deste trabalho consiste em uma revisão de literatura sobre a GWS apresentando sua definição e importância no melhoramento genético, abordando sobre o desenvolvimento dos métodos propostos e avaliados e também retratando sobre o processo de validação utilizado para a comparação das metodologias. No segundo capítulo, foi proposto e analisado o método Delta-p e um índice de seleção, denominado índice Delta-p/G-BLUP que combina os valores genômicos provenientes do método G-BLUP com os valores genômicos estimados via Delta-p. Sob o contexto Bayesiano, foi incorporado ao LASSO Bayesiano, por meio de uma distribuição a priori altamente informativa, os valores genômicos estimados via G-BLUP, essa abordagem foi denominada método Bayes Híbrido. Para avaliar a eficiência dos métodos estatísticos, no que se refere à estimação dos valores genômicos aditivos e devidos à dominância, foram utilizados dados simulados, sendo estabelecidos oito cenários (dois níveis de herdabilidade × duas arquiteturas genéticas × ausência de dominância e dominância completa) sendo cada cenário simulado dez vezes. Os resultados do segundo capítulo indicaram que o índice Delta-p/G-BLUP e o Bayes Híbrido se mostraram eficientes para predição dos valores genômicos podendo ser usados vantajosamente na GWS. Ademais, no terceiro capítulo, foi avaliada a eficiência do método TCR em comparação com os métodos G-BLUP e BLASSO utilizando quatro cenários (dois níveis de herdabilidade × modelo infinitesimal × ausência de dominância e dominância completa) sendo cada cenário simulado dez vezes. Os resultados indicaram que o método TCR mostrou-se adequado para a estimação dos componentes de variação genômica e da herdabilidade. Em vista disso, uma metodologia baseada em uma modificação do método G-BLUP, denominada TCR/G-BLUP, foi proposta e consiste em estimar a herdabilidade via TCR e fixá-la nas equações de modelos mistos do método G-BLUP. A eficiência dos métodos G- BLUP e TCR/G-BLUP foram comparadas utilizando dados reais, seis caracteristicas avaliadas em mandioca (Manihot esculenta). O experimento foi instalado segundo um delineamento em blocos casualizados com três repetições e 10 plantas por parcela. Os resultados indicaram que o método TCR/G-BLUP foi capaz de aumentar a acurácia e fornecer valores genômicos não viesados se comparados ao método G-BLUP, sendo, portanto recomendado para a aplicação na GWS.Item Seleção genômica para características categóricas em eucalipto(Universidade Federal de Viçosa, 2017-02-17) Silveira, Lucas Souza da; Martins Filho, Sebastião; http://lattes.cnpq.br/8781027361635034Atualmente muitas metodologias têm sido propostas para melhoria da predição de valores genéticos genômicos, no entanto, muitas delas assumem a pressuposição de que as variáveis respostas possuem distribuição gaussiana. Contudo, existem características como resistência a doença, bifurcação em árvores de eucalipto, estágios de florescimento e acamamento em plantas, entre outras, que são classificadas como categóricas, não possuindo distribuição gaussiana para os dados. Diante do exposto, objetivou-se comparar o modelo linear generalizado com o modelo linear de Gauss-Markov, obtendo os valores genéticos genômicos de indivíduos com fenótipos categóricos referentes a resistência à ferrugem do eucalipto, causada pelo patógeno Puccinia psidii Winter. Ambos os modelos foram aplicados quando a característica fenotípica possuía quatro classes de infecção (planta imune ou com reação de hipersensibilidade, pequenas pústulas, pústulas medianas e pústulas grandes) e quando estava categorizada como tipos de reação (resistente ou suscetível). O critério de informação da deviance (DIC - Deviance Information Criterion) foi utilizado para seleção do modelo adequado para descrever a característica fenotípica. O procedimento de validação cruzada via Jacknife foi utilizado para validação das estimativas. A acurácia preditiva e o viés foram utilizados para comparação dos modelos. Quando a característica foi categorizada com quatro classes de infecção, os valores de acurácia foram semelhantes para os dois modelos (diferença menor que 0,03). No entanto, quando a categorização foi realizada com duas classes, estas diferenças foram maiores que 0,03 para apenas um dos estimadores de acurácia. O viés na predição de valores genéticos genômicos foi melhor no modelo linear de Gauss- Markov em ambos os tipos de categorização.