Splines de regressão adaptativa multivariada na predição genômica

Imagem de Miniatura

Data

2020-10-27

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

A Seleção Genômica Ampla (SGA), proposta em 2001, é uma variação da Seleção Assistida por Marcadores (SAM) que prediz o valor genético genômico com base em marcadores distribuídos ao longo de todo o genoma. Desde sua proposição vários métodos estatísticos vêm sendo propostos para SGA, dentre os quais podemos destacar o Melhor Preditor Linear não Viesado Genômico (G-BLUP), uma das abordagens mais amplamente difundida devido a sua simplicidade e por permitir considerar efeitos não aditivos em seu ajuste. Uma metodologia ainda não explorada em SGA é a Splines de Regressão Adaptativa Multivariada (MARS). A MARS modela efeitos individuais e possíveis interações entre variáveis preditoras, podendo ser particularmente útil para SGA considerando efeitos não aditivos. Diante disso o objetivo deste trabalho é avaliar a utilização da MARS em SGA, considerando características quantitativas com efeitos não aditivos. Para isso, fez-se uso de um conjunto de dados simulados de 1000 indivíduos com 4010 marcadores SNPs e 12 cenários considerando efeitos não aditivos, definidos pela combinação de oito, 40, 80 ou 120 locus controladores e herdabilidade 0,3, 0,5 ou 0,8. Confrontou-se os resultados da MARS contra os resultados obtidos com o modelo ajustado G-BLUP considerando efeitos aditivos, aditivos e devido a dominância e aditivos e devido a epistasia aditiva-aditiva no que se refere à capacidade preditiva e ao coeficiente kappa de Cohen para seleção de indivíduos superiores. MARS apresentou resultados de capacidade preditiva superior a todos os modelos G-BLUP ajustado para os cenários de herdabilidade 0,3 e resultados semelhantes nos demais casos. Quanto ao coeficiente kappa de Cohen, MARS foi superior aos métodos G-BLUP em 11 dos 12 cenários avaliados. Portanto, MARS é uma metodologia que apresenta potencial para estudos em SGA. Palavras-chave: Regressão. Aprendizado estatístico. Seleção genômica ampla. Efeitos não aditivos.
Proposed in 2001 the Genomic Wide Selection (GWS) is a variation of the Marker Assisted Selection (MAS) that predicts the genomic breeding values based on markers distributed throughout the wide genome. Since its proposition, several statistical methods have been proposed for GWS, among which we can cite the Genomic Best Linear Unbiased Prediction (G-BLUP), one of the most widespread approaches due to its simplicity and because it allows considering non-additive effects in its adjustment . A methodology not yet explored in GWS is the Multivariate Adaptive Regression Splines (MARS). The MARS modeling individual effects and possible interactions between predictor variables and can be particularly useful for GWS considering non-additive effects. Therefore, the aim of this work is to evaluate the use of MARS in GWS, considering quantitative characteristics with non-additive effects. We used a simulated data set of 1000 individuals with 4010 SNPs markers and 12 scenarios considering non-additive effects, defined by the combination of 08, 40, 80 or 120 QTLs and heritability 0.3, 0.5 or 0.8. The results of MARS were compared with the results obtained with the adjusted model G- BLUP considering additive effects, additive and dominance and additives and additive-additive epistasis regarding the predictive capacity and Cohen's kappa coefficient for selection of superior individuals. The MARS presented results of predictive capacity superior to all the G- BLUP models adjusted for the heritability scenarios 0.3 and similar results in the other cases. For Cohen's kappa coefficient, MARS was superior to the G-BLUP methods in 11 of the 12 scenarios evaluated. Therefore, MARS is a methodology that presents potential for studies on GWS. Keywords: Regression. Statistical learning. Genome Wild Selection. Non-additives effects.

Descrição

Palavras-chave

Melhoramento genético - Métodos estatíticos, Aprendizado do computador - Métodos estatísticos, Análise de regressão

Citação

CELERI, Maurício de Oliveira. Splines de regressão adaptativa multivariada na predição genômica. 2020. 32 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2020.

Avaliação

Revisão

Suplementado Por

Referenciado Por