Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/31009
Tipo: Dissertação
Título: Associação genômica via regiões cromossômicas sob a abordagem bayesiana
Genome-wide association studies via bayesian analysis of chromosomal regions
Autor(es): Rossinol, Aline Marçal
Abstract: Com os avanços na biotecnologia se tornou possível novas descobertas na área da biologia molecular, o que favorece cada vez mais os estudos de associação genômica ampla (Genome Wide Association Studies - GWAS). A GWAS utiliza marcadores moleculares, principalmente, os SNPs (Single Nucleotide Polymorphism), tendo como objetivo identificar as variantes causais no genoma e investigar as regiões do cromossomo em que estas variantes se encontram. Um dos principais métodos estatísticos em GWAS é o método via regressão em marcas únicas, que visa estudar a associação entre o fenótipo e um único marcador. No entanto, esse método apresenta problemas estatísticos, como, por exemplo, necessidade de grandes amostras e alta taxa de falsos positivos. Atualmente, os métodos utilizando grupos de marcadores vêm ganhando cada vez mais destaque, devido ao fato de que, os marcadores moleculares podem estar em alto desequilíbrio de ligação (Linkage Disequilibrium – LD) entre si e, com isso, influenciar conjuntamente o fenótipo. Um desses métodos é o Mapeamento de Herdabilidade Regional (Regional Heritability Mapping - RHM). Atualmente, os estudos de associação sob abordagem Bayesianas e utilizando grupos de marcadores, ou regiões genômicas, vêm ganhando cada vez mais destaque. Isto ocorre devido ao fato de que nesses métodos é possível estimar simultaneamente os efeitos dos marcadores ao invés de um único marcador, o que reduz a taxa de falsos positivos. A literatura ainda não apresenta nenhuma proposta sobre o método de RHM sob uma abordagem bayesiana e também sobre a estimação simultânea dos efeitos das regiões em um único modelo. Desta forma, no capítulo 1 desta dissertação é realizada uma revisão de literatura sobre as metodologias estatísticas utilizadas. O capítulo 2 visa comparar a eficiência de se estimar o efeito de todas as regiões genômicas simultaneamente através de um modelo bayesiano em relação ao procedimento de se estimar o efeito de cada região por vez através de dados simulados e depois para elucidar a utilização deste modelo nos programas de melhoramento, as estimações usando uma única região e todas as regiões simultaneamente também foram performadas em dados reais de arroz Oryza sativa. Esse estudo utilizou dados simulados através do pacote AlphaSimR e dados de arroz provenientes do Rice Diversity Project. O tamanho das regiões foi determinado como sendo a distância na qual o LD é metade do seu valor máximo e, para verificar se as regiões eram associadas as características fenotípicas, foi utilizada a Probabilidade a Posteriori da Associação da Janela (Window Posterior Probability of Association - WPPA). Para os dados simulados, a eficiência da estimação simultânea dos efeitos das regiões genômicas utilizando a estimação bayesiana, apresentou resultados superiores. Nos dados de arroz, a estimação simultânea detectou uma quantidade superior de regiões já relatadas na literatura em detrimento a estimação única, além de apresentar novas regiões genômicas que podem ser estudadas em analises pós-GWAS. Essa é uma metodologia que apresenta potencial para aplicação, descoberta e investigação de novas regiões genômicas associadas a características fenotípicas. Palavras-chave: Mapeamento de Herdabilidade Regional. Poder de detecção. Probabilidade a posteriori
With advances in biotechnology, it has become possible to make discoveries in molecular biology, which increasingly favor Genome-Wide Association Studies (GWAS). GWAS uses molecular markers, mainly Single Nucleotide Polymorphisms (SNPs), to identify causal variants in the genome and investigate the chromosome regions where these variants are located. One of the main statistical methods in GWAS is the single-marker regression method, which aims to study the association between the phenotype and a single marker. However, this method has statistical problems, such as the need for large samples and a high rate of false positives. Currently, methods using groups of markers are gaining more prominence because molecular markers may be in high linkage disequilibrium (LD) with each other and thereby jointly influence the phenotype. One of these methods is Regional Heritability Mapping (RHM). Currently, Bayesian approaches using groups of markers or genomic regions are gaining more and more attention. This increase is because these methods make it possible to estimate the effects of markers simultaneously instead of just one marker, which reduces the false positive rate. The literature still needs to present a proposal for the RHM method under a Bayesian approach, nor for the simultaneous estimation of the effects of regions in a single model. Thus, in chapter 1 of this dissertation, a literature review is conducted on the statistical methodologies used. Chapter 2 compares the efficiency of estimating the effect of all genomic regions simultaneously using a Bayesian model versus the procedure of estimating the effect of each region one at a time using simulated data. Estimations using a single region and all regions simultaneously were also performed on real rice data from the Rice Diversity Project To elucidate the use of this model in breeding programs. This study used simulated data through the AlphaSimR package and rice data. The size of the regions was determined as the distance at which LD is half of its maximum value, and to verify whether the regions were associated with phenotypic characteristics, the Window Posterior Probability of Association (WPPA) was used. For simulated data, the efficiency of simultaneously estimating the effects of genomic regions using Bayesian estimation showed superior results. In rice data, simultaneous estimation detected a higher number of regions already reported in the literature compared to single estimation, as well as presenting new genomic regions that can be studied in post-GWAS analyses. This methodology has the potential for application, discovery, and investigation of new genomic regions associated with phenotypic traits. Keywords: Regional Heritability Mapping. Detection Power. Posterior Probability
Palavras-chave: Mapeamento cromossômico
Estudo de associação genômica ampla
Teoria bayesiana de decisão estatística
Probabilidades
CNPq: Estatística Aplicada e Biometria
Editor: Universidade Federal de Viçosa
Titulação: Mestre em Estatística Aplicada e Biometria
Citação: ROSSINOL, Aline Marçal. Associação genômica via regiões cromossômicas sob a abordagem bayesiana. 2023. 51 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2023.
Tipo de Acesso: Acesso Aberto
Identificador DOI: https://doi.org/10.47328/ufvbbt.2023.150
URI: https://locus.ufv.br//handle/123456789/31009
Data do documento: 16-Fev-2023
Aparece nas coleções:Estatística Aplicada e Biometria

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdf
  Until 2025-02-17
texto completo619,88 kBAdobe PDFVisualizar/Abrir ACESSO RESTRITO


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.