From SNPs to haplotypes: evaluating single-SNP and haplotype-based approaches for GWAS and genomic prediction in doubled haploid maize
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Federal de Viçosa
Abstract
Single nucleotide polymorphisms (SNPs) are typically considered biallelic for practical purposes, although multiallelic variants can occur. In contrast, haplotypes derived from combinations of SNPs are inherently multiallelic and may capture epistatic interactions among the constituent alleles. In our study, we compared the single-SNP and two haplotype-based approaches for GWAS and genomic prediction models using 487 doubled haploid (DH) maize lines derived from the Iowa Stiff Stalk Synthetic population. The DH lines were evaluated for anthesis-silking interval (ASI), plant (PH, cm) and ear height (EH, cm), flag leaf angle (FLA), number of primary tassel branches (NTB) and tiller rate (TR) across three environments in Iowa, United States. After quality control, we used a total of 13,846 SNP markers to perform genomic analyses. For both single-SNP and haplotype-based approaches, we considered the compressed mixed linear (CMLM) and GBLUP models to run the GWAS and genomic prediction analyses, respectively. Our results showed that genomic regions for FLA were only identified by haplotype approaches, while genomic regions associated with EH were identified by both single-SNP and haplotype-based approaches. Overall, we identified 13 and seven candidate genes within the genomic regions associated with FLA and EH, respectively, whereas no candidate genes were found for NTB and PH. We observed that the use of haplotypes for genomic prediction resulted in slightly higher prediction ability compared to single-SNP based prediction. However, the training set and the trait under consideration played a significant role in the prediction ability. In conclusion, integrating both single-SNP and haplotype-based GWAS approaches enhances the identification of causal variants and allows for selecting the most effective genomic prediction method tailored to each trait’s genetic architecture. Keywords: Zea mays L.; single nucleotide polymorphism; genome-wide association studies; complex traits; genetic architecture.
Polimorfismos de nucleotídeo único (SNPs) são tipicamente considerados bialélicos para fins práticos, embora variantes multialélicas possam ocorrer. Em contraste, haplótipos derivados da combinação de SNPs são inerentemente multialélicos e podem capturar interações epistáticas entre os alelos constituintes. Neste estudo, comparamos abordagens baseadas em SNPs individuais e em haplótipos para análises de GWAS e predição genômica, utilizando 487 linhagens de milho duplo haploides (DH) derivadas da população Iowa Stiff Stalk Synthetic. As linhagens DH foram avaliadas para intervalo entre antese e emissão de estigma (ASI), altura de planta (PH, cm) e espiga (EH, cm), ângulo da folha bandeira (FLA), número de ramos do pendão (NTB) e índice de perfilhamento (TR) em três ambientes no estado de Iowa, Estados Unidos. Após o controle de qualidade, utilizamos um total de 13.846 marcadores SNP nas análises genômicas. Tanto para as abordagens com SNPs individuais quanto com haplótipos, utilizamos os modelos linear misto comprimido (CMLM) e GBLUP para as análises de GWAS e predição genômica, respectivamente. Nossos resultados mostraram que regiões genômicas associadas a FLA foram identificadas apenas pelas abordagens baseadas em haplótipos, enquanto regiões associadas a EH foram detectadas por ambas as abordagens. No total, identificamos 13 e sete genes candidatos nas regiões genômicas associadas a FLA e EH, respectivamente, enquanto nenhum gene candidato foi encontrado para NTB e PH. Observamos que o uso de haplótipos na predição genômica resultou em uma capacidade preditiva ligeiramente superior em comparação à predição baseada em SNPs individuais. No entanto, a população de treinamento e a característica avaliada desempenharam um papel significativo na capacidade de predição. Em conclusão, a integração de abordagens de GWAS baseadas em SNPs individuais e em haplótipos aprimora a identificação de variantes causais e permite a seleção do método de predição genômica mais eficaz, ajustado à arquitetura genética de cada característica. Palavras-chave: Zea mays L.; polimorfismo de nucleotídeo único; estudos de associação genômica ampla; características complexas; arquitetura genética.
Polimorfismos de nucleotídeo único (SNPs) são tipicamente considerados bialélicos para fins práticos, embora variantes multialélicas possam ocorrer. Em contraste, haplótipos derivados da combinação de SNPs são inerentemente multialélicos e podem capturar interações epistáticas entre os alelos constituintes. Neste estudo, comparamos abordagens baseadas em SNPs individuais e em haplótipos para análises de GWAS e predição genômica, utilizando 487 linhagens de milho duplo haploides (DH) derivadas da população Iowa Stiff Stalk Synthetic. As linhagens DH foram avaliadas para intervalo entre antese e emissão de estigma (ASI), altura de planta (PH, cm) e espiga (EH, cm), ângulo da folha bandeira (FLA), número de ramos do pendão (NTB) e índice de perfilhamento (TR) em três ambientes no estado de Iowa, Estados Unidos. Após o controle de qualidade, utilizamos um total de 13.846 marcadores SNP nas análises genômicas. Tanto para as abordagens com SNPs individuais quanto com haplótipos, utilizamos os modelos linear misto comprimido (CMLM) e GBLUP para as análises de GWAS e predição genômica, respectivamente. Nossos resultados mostraram que regiões genômicas associadas a FLA foram identificadas apenas pelas abordagens baseadas em haplótipos, enquanto regiões associadas a EH foram detectadas por ambas as abordagens. No total, identificamos 13 e sete genes candidatos nas regiões genômicas associadas a FLA e EH, respectivamente, enquanto nenhum gene candidato foi encontrado para NTB e PH. Observamos que o uso de haplótipos na predição genômica resultou em uma capacidade preditiva ligeiramente superior em comparação à predição baseada em SNPs individuais. No entanto, a população de treinamento e a característica avaliada desempenharam um papel significativo na capacidade de predição. Em conclusão, a integração de abordagens de GWAS baseadas em SNPs individuais e em haplótipos aprimora a identificação de variantes causais e permite a seleção do método de predição genômica mais eficaz, ajustado à arquitetura genética de cada característica. Palavras-chave: Zea mays L.; polimorfismo de nucleotídeo único; estudos de associação genômica ampla; características complexas; arquitetura genética.
Description
Citation
SANTANA, Alice Silva. From SNPs to haplotypes: evaluating single-SNP and haplotype-based approaches for GWAS and genomic prediction in doubled haploid maize. 2025. 52 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2025.
