Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
5 resultados
Resultados da Pesquisa
Item Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora(Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.Item Análise de fatores aplicada a predição genômica considerando seleção de marcadores em Oryza sativa(Universidade Federal de Viçosa, 2021-02-19) Fialho, Izabela Clara; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1414652656084772O arroz asiático Oryza sativa é um dos alimentos mais consumidos em grande parte do mundo. Assim, o crescimento populacional justifica o interesse dos pesquisadores em tornar as variedades deste arroz altamente produtivas. Para alcançar esse objetivo, a Seleção Genômica Ampla (Genome Wide Selection - GWS) é uma ferramenta utilizada pelos programas de melhoramento. A GWS emprega dados fenotípicos e genotípicos por meio de marcadores SNPs (Single Nucleotide Polymorphism) amplamente distribuídos no genoma. Porém, nem todos estes SNPs estão associados as características de relevância para o pesquisador, o que torna necessário o uso de métodos estatísticos para a seleção de marcadores. O BLUP genômico (Genomic best linear unbiased prediction – G-BLUP) é um método amplamente aplicado a predição genômica, e quando este está associado a seleção de marcadores dá origem ao chamado G-BLUP supervisionado. Dessa forma, o presente trabalho objetivou-se avaliar a eficiência na predição genômica ao combinar a análise de fatores e a seleção de marcadores via G-BLUP supervisionado para grupos de características de interesse. O conjunto de dados de arroz utilizado é público e faz parte de dois projetos, o Projeto OryzaSNP e o Projeto OMAP e está disponível no site http://ricediversity.org/data/. O arquivo contém informações de 28 características fenotípicas e 36.901 marcadores SNPs de 413 indivíduos. Os resultados obtidos indicam que a aplicação da análise de fatores combinada à seleção de marcadores SNPs para a predição genômica se mostrou eficiente, visto que apresentaram valores semelhantes para capacidade preditiva em relação aos encontrados considerando as análises individuais das variáveis (em ambas as análises obteve-se variação entre 0,6 a 0,8 de capacidade preditiva) e alta concordância (acima de 50% de concordância para todos os grupos de marcadores) entre os indivíduos selecionados considerando o fator e as variáveis individuais. Palavras-chave: Arroz. Seleção genômica. G-BLUP.Item Avaliação de uma nova modelagem proporcional dos efeitos aditivos e de dominância e reflexos na genética quantitativa e na seleção genômica(Universidade Federal de Viçosa, 2019-07-24) Miranda, Taiana Lopes Rangel; Resende, Marcos Deon Vilela de; http://lattes.cnpq.br/0513010608168896A Seleção Genômica (Genomic Wide Selection – GWS) é uma abordagem muito utilizada nos programas de melhoramento e foi desenvolvida com o intuito de utilizar as informações diretas do DNA no processo de identificação de indivíduos geneticamente superiores, através da predição do valor genético genômico (Genomic Estimated Breeding Value – GEBV). A GWS baseia-se na análise de um grande número de marcadores moleculares SNPs (Single Nucleotide Polymorphisms) extensamente distribuídos no genoma. O modelo genético básico tradicionalmente utilizado na Genética Quantitativa e na GWS (modelo infinitesimal de Fisher, 1918), atribui à variância aditiva uma grande proporção de explicação da variância genética, mesmo sob ação gênica de dominância. Isto se deve ao fato de, no processo de derivação de expressões biométricas, a variância aditiva ser maximizada e a variância de dominância ser o resíduo da variação genética total. Recentemente um modelo genético alternativo foi proposto, no qual a variância de dominância é priorizada usando uma parametrização em que heterozigotos e um dos homozigotos são codificados com valores equivalentes. Nessa proposta o componente genético aditivo ao nível de locos é introduzido no modelo depois da variância de dominância ter sido maximizada. O objetivo desse trabalho foi avaliar essa nova parametrização dos efeitos aditivos e de dominância na seleção genômica e genética quantitativa em geral, e compará-la à parametrização tradicionalmente aplicada utilizando o método G-BLUP (Genomic Best Linear Unbiased Predictor). Adicionalmente essas comparações foram estendidas contemplando diferentes MAFs (Minor Allele Frequency). O procedimento de validação cruzada foi utilizado para avaliar as estimativas dos parâmetros usados nas comparações. Estimativas dos componentes da variação genética e das herdabilidades aditiva, devida à dominância e genotípica total, bem como da capacidade preditiva e do coeficiente da regressão entre o fenótipo e o GEBV foram obtidos, visando a comparação dos modelos. Dois índices combinando as estimativas dos componentes de variância obtidos pelos dois modelos foram propostos e avaliados. Os resultados indicaram que a nova modelagem, bem como a combinação de ambas são alternativas para melhorar as estimativas das variâncias genética aditiva e de dominância e da proporção entre elas.Item Genômica e modelos não-lineares mistos no ajuste de curvas de lactação de bovinos da raça Girolando(Universidade Federal de Viçosa, 2018-10-05) Teixeira, Filipe Ribeiro Formiga; Nascimento, Moysés; http://lattes.cnpq.br/4574646837472160Pesquisas que visam a construção de curvas de lactação de diferentes raças de gado de leite têm sido realizadas com frequência nos últimos anos. Esses trabalhos usualmente têm como objetivo identificar o comportamento da produtividade leiteira do rebanho, a identificação de indivíduos superiores segundo suas características de lactação ou estudar as associações fenotípicas/genéticas entre diferentes variáveis de lactação. O presente trabalho teve como objetivo propor a utilização da Seleção Genômica Ampla para estimar os valores genéticos genômicos das características de lactação e construir as curvas de lactação genômicas de bovinos da raça Girolando (responsável por 80% da produção do leite brasileiro) baseadas em informações estimadas pelo ajuste de modelos não-lineares mistos. Objetivou-se também a identificar o melhor modelo para o ajuste de curvas de lactação dessa raça, sendo escolhido dentre nove propostos na literatura. Os dados foram fornecidos pela Embrapa Gado de Leite (Juíz de Fora-MG), referentes a 1.822 registros de controle leiteiro correspondente a 226 bovinos Girolando, juntamente com a informação de 37.673 marcadores SNPs associados aos animais em estudo. Comparando nove modelos não-lineares (Brody, Cappio-Borlino, Cobby & Le Du, Dhanoa, Nelder, Papajscik e Bodero, Rook, Sikka e Wood) com a abordagem de modelos mistos, constatou-se que a melhor equação segundo os critérios de AIC e BIC, com valores de 10.013,79 e 10.101,92, respectivamente, foi a de Wood. Através das características de lactação estimadas pelo modelo de Wood foi possível identificar um grupo seleto de 8 animais com maior produtividade (média de 10.584 Kg/lactação). A estimação dos valores genéticos genômicos (Estimated Genomic Breeding Values – EGBV) das características genômicas (produção inicial – a, taxa de ascensão – b, taxa de declínio – c, produção total, pico de lactação, persistência e tempo até o pico) através do BLASSO (Bayesian LASSO) permitiram o conhecimento genético dessas características. As herdabilidades das mesmas variaram de 0,09 para a taxa de declínio até 0,29 para a persistência. As correlações entre seus valores genéticos genômicos apresentaram resultados de -0,90 (entre a taxa de declínio e a persistência) a 0,98 (entre o pico de lactação e a produção total). Os coeficientes de Kappa para concordância entre os indivíduos selecionados de acordo com diferentes variáveis variou de 0 a 0,95. As análises realizadas permitiram o conhecimento do melhor entre os modelos não-lineares para ajuste das curvas de lactação de bovinos da raça Girolando. Com a construção das curvas genômicas foi possível identificar diferenças genéticas entre os indivíduos, estas livres dos efeitos ambientais. A abordagem proposta foi capaz de produzir resultados relevantes e pode ser aplicada para outras raças e situações diferentes.Item Predição genômica via redução de dimensionalidade em modelos aditivo dominante(Universidade Federal de Viçosa, 2018-02-26) Costa, Jaquicele Aparecida da; Azevedo, Camila Ferreira; http://lattes.cnpq.br/6939298449989672Grandes avanços no melhoramento animal e vegetal têm sido propiciados utilizando- se informações da genética molecular. Nessa perspectiva, idealizaram a Seleção Genômica Ampla (Genome Wide Selection – GWS) cuja abordagem envolve a cobertura completa do genoma utilizando milhares de marcadores SNPs (Single Nucleotide Polymorphisms). O objetivo é estimar o mérito genético dos indivíduos e para tal, as pesquisas realizadas na GWS se baseiam na busca e na aplicação de metodologias estatísticas que visam resolver os problemas enfrentados no processo de estimação, como a alta dimensionalidade e a alta colinearidade entre os marcadores. Dentre elas, se destacam os métodos de redução de dimensionalidade: Regressão via Componentes Principais (PCR), Quadrados Mínimos Parciais (PLS) e Regressão via Componentes Independentes (ICR) e o tradicional método de regularização/shrinkage, G-BLUP (Genomic Best Linear Unbiased Predictor). Assim, o primeiro capítulo contempla as ideias centrais e a importância da GWS para o melhoramento genético, a definição de efeitos aditivos e de efeitos devido à dominância, os problemas estatísticos enfrentados na estimação dos efeitos de marcadores nos fenótipos pelo método usual baseado em quadrados mínimos ordinários, bem como as metodologias estatísticas baseadas em redução dimensional para resolver tais problemas e os procedimentos de validação que tem por finalidade comparar as metodologias estatísticas da GWS. Já o segundo capítulo refere-se a proposição e aplicação de sete critérios para a escolha do número ótimo de componentes independentes a serem utilizados na ICR, considerando apenas os efeitos aditivos. Os critérios consistem em determinar que o número de componentes independentes seja igual ao número de componentes que conduz: (i) os valores genômicos estimados via PCR a um maior valor de acurácia; (ii) os valores genômicos estimados via PCR a um menor valor de viés; (iii) a PCR a 80% de explicação da variação total de X; (iv) a PCR a 80% de explicação da variação total de Y; (v) a ICR a 80% de explicação da variação total de X; além dos critérios que consistem no número de componentes independentes igual ao número de variáveis determinadas pelos procedimentos (vi) Forward Selection e (vii) Backward Selection. O conjunto de dados simulados era composto por 2.000 marcadores SNPs e as populações simuladas totalizaram 1.000 indivíduos de 20 famílias de irmãos completos que tiveram os fenótipos e os genótipos avaliados. Além disso, os cenários simulados são baseados em dois níveis de herdabilidade e duas arquiteturas genéticas com ausência de dominância, constituindo assim, em quatro cenários, os quais foram simulados dez vezes cada. Com o intuito de demonstrar a aplicabilidade do estudo no melhoramento genético, foram avaliadas seis características de produtividade de um conjunto de dados reais de arroz asiático Oryza sativa (Número de panículas por planta, altura da planta, comprimento da panícula, número de panículas no perfilho primário, número de sementes por panícula e espiguetas por panícula) correspondente a 370 acessos de arroz, os quais foram genotipados para 44.100 marcadores SNPs. Em ambos os casos (dados simulados e reais) foi utilizada a validação independente e calculada as medidas de eficiência para comparar os critérios. De modo geral, as análises indicaram que o primeiro critério (número de componentes independentes igual ao número de componentes principais cujos os valores genômicos estimados via PCR apresentava maior valor de acurácia) se mostrou mais eficiente para os dois conjuntos de dados e apresentou as medidas de eficiência mais próximas do método exaustivo, com a vantagem de exigir menos tempo e esforço computacional. Para complementar o estudo, o terceiro capítulo consiste na aplicação dos três critérios mais eficientes do capítulo 2, os quais consistem no número de componentes independentes igual ao número de componentes que conduz os valores genômicos estimados via PCR a um maior valor de acurácia; a um menor valor de viés e a PCR a 80% de explicação da variação total de X considerando o modelo aditivo-dominante. Ainda no contexto deste modelo, foi aplicado os três métodos de redução de dimensionalidade (PCR, PLS e ICR) levando em consideração a escolha do número ótimo de componentes que conduz os valores genômicos aditivos, valores genômicos devido à dominância ou os valores genômicos totais (aditivo + dominância) a uma maior acurácia. Todos os métodos de redução de dimensionalidade foram comparados com o G-BLUP em termos de eficiência na estimação dos valores genômicos. As populações simuladas foram constituídas por 1.000 indivíduos de 20 famílias de irmãos completos, sendo genotipados para 2000 marcadores SNPs e as análises correspondentes a quatro cenários (dois níveis de herdabilidade × duas arquiteturas genéticas) sendo assumido dominância completa. Os resultados do capítulo 3 assinalaram que se manteve a superioridade do critério 1 nos modelos aditivo-dominante. Além disso, para a estimação dos efeitos aditivos e devido a dominância concomitantemente por meio dos métodos de redução de dimensionalidade, é recomendável utilizar o número de componentes que conduz o valor genômico devido à dominância a uma maior acurácia. Ademais, ao confrontar as metodologias de redução dimensional (ICR, PCR e PLS) com o G-BLUP, verifica- se que a PCR é superior em termos de acurácia e o método vantajosamente apresenta um dos menores tempos computacionais na execução das análises. Ademais, nenhum dos métodos considerados capturaram adequadamente as herdabilidades simuladas e apresentaram viés.