Associação genômica via regiões cromossômicas sob a abordagem bayesiana
dc.contributor | Nascimento, Ana Carolina Campana | |
dc.contributor | Nascimento, Moysés | |
dc.contributor.advisor | Azevedo, Camila Ferreira | |
dc.contributor.author | Rossinol, Aline Marçal | |
dc.contributor.authorLattes | http://lattes.cnpq.br/5027877150927165 | pt-BR |
dc.date.accessioned | 2023-06-05T11:17:51Z | |
dc.date.available | 2023-06-05T11:17:51Z | |
dc.date.issued | 2023-02-16 | |
dc.degree.date | 2023-02-16 | |
dc.degree.department | Departamento de Estatística | pt-BR |
dc.degree.grantor | Universidade Federal de Viçosa | pt-BR |
dc.degree.level | Mestrado | pt-BR |
dc.degree.local | Viçosa - MG | pt-BR |
dc.degree.program | Mestre em Estatística Aplicada e Biometria | pt-BR |
dc.description.abstract | Com os avanços na biotecnologia se tornou possível novas descobertas na área da biologia molecular, o que favorece cada vez mais os estudos de associação genômica ampla (Genome Wide Association Studies - GWAS). A GWAS utiliza marcadores moleculares, principalmente, os SNPs (Single Nucleotide Polymorphism), tendo como objetivo identificar as variantes causais no genoma e investigar as regiões do cromossomo em que estas variantes se encontram. Um dos principais métodos estatísticos em GWAS é o método via regressão em marcas únicas, que visa estudar a associação entre o fenótipo e um único marcador. No entanto, esse método apresenta problemas estatísticos, como, por exemplo, necessidade de grandes amostras e alta taxa de falsos positivos. Atualmente, os métodos utilizando grupos de marcadores vêm ganhando cada vez mais destaque, devido ao fato de que, os marcadores moleculares podem estar em alto desequilíbrio de ligação (Linkage Disequilibrium – LD) entre si e, com isso, influenciar conjuntamente o fenótipo. Um desses métodos é o Mapeamento de Herdabilidade Regional (Regional Heritability Mapping - RHM). Atualmente, os estudos de associação sob abordagem Bayesianas e utilizando grupos de marcadores, ou regiões genômicas, vêm ganhando cada vez mais destaque. Isto ocorre devido ao fato de que nesses métodos é possível estimar simultaneamente os efeitos dos marcadores ao invés de um único marcador, o que reduz a taxa de falsos positivos. A literatura ainda não apresenta nenhuma proposta sobre o método de RHM sob uma abordagem bayesiana e também sobre a estimação simultânea dos efeitos das regiões em um único modelo. Desta forma, no capítulo 1 desta dissertação é realizada uma revisão de literatura sobre as metodologias estatísticas utilizadas. O capítulo 2 visa comparar a eficiência de se estimar o efeito de todas as regiões genômicas simultaneamente através de um modelo bayesiano em relação ao procedimento de se estimar o efeito de cada região por vez através de dados simulados e depois para elucidar a utilização deste modelo nos programas de melhoramento, as estimações usando uma única região e todas as regiões simultaneamente também foram performadas em dados reais de arroz Oryza sativa. Esse estudo utilizou dados simulados através do pacote AlphaSimR e dados de arroz provenientes do Rice Diversity Project. O tamanho das regiões foi determinado como sendo a distância na qual o LD é metade do seu valor máximo e, para verificar se as regiões eram associadas as características fenotípicas, foi utilizada a Probabilidade a Posteriori da Associação da Janela (Window Posterior Probability of Association - WPPA). Para os dados simulados, a eficiência da estimação simultânea dos efeitos das regiões genômicas utilizando a estimação bayesiana, apresentou resultados superiores. Nos dados de arroz, a estimação simultânea detectou uma quantidade superior de regiões já relatadas na literatura em detrimento a estimação única, além de apresentar novas regiões genômicas que podem ser estudadas em analises pós-GWAS. Essa é uma metodologia que apresenta potencial para aplicação, descoberta e investigação de novas regiões genômicas associadas a características fenotípicas. Palavras-chave: Mapeamento de Herdabilidade Regional. Poder de detecção. Probabilidade a posteriori | pt-BR |
dc.description.abstract | With advances in biotechnology, it has become possible to make discoveries in molecular biology, which increasingly favor Genome-Wide Association Studies (GWAS). GWAS uses molecular markers, mainly Single Nucleotide Polymorphisms (SNPs), to identify causal variants in the genome and investigate the chromosome regions where these variants are located. One of the main statistical methods in GWAS is the single-marker regression method, which aims to study the association between the phenotype and a single marker. However, this method has statistical problems, such as the need for large samples and a high rate of false positives. Currently, methods using groups of markers are gaining more prominence because molecular markers may be in high linkage disequilibrium (LD) with each other and thereby jointly influence the phenotype. One of these methods is Regional Heritability Mapping (RHM). Currently, Bayesian approaches using groups of markers or genomic regions are gaining more and more attention. This increase is because these methods make it possible to estimate the effects of markers simultaneously instead of just one marker, which reduces the false positive rate. The literature still needs to present a proposal for the RHM method under a Bayesian approach, nor for the simultaneous estimation of the effects of regions in a single model. Thus, in chapter 1 of this dissertation, a literature review is conducted on the statistical methodologies used. Chapter 2 compares the efficiency of estimating the effect of all genomic regions simultaneously using a Bayesian model versus the procedure of estimating the effect of each region one at a time using simulated data. Estimations using a single region and all regions simultaneously were also performed on real rice data from the Rice Diversity Project To elucidate the use of this model in breeding programs. This study used simulated data through the AlphaSimR package and rice data. The size of the regions was determined as the distance at which LD is half of its maximum value, and to verify whether the regions were associated with phenotypic characteristics, the Window Posterior Probability of Association (WPPA) was used. For simulated data, the efficiency of simultaneously estimating the effects of genomic regions using Bayesian estimation showed superior results. In rice data, simultaneous estimation detected a higher number of regions already reported in the literature compared to single estimation, as well as presenting new genomic regions that can be studied in post-GWAS analyses. This methodology has the potential for application, discovery, and investigation of new genomic regions associated with phenotypic traits. Keywords: Regional Heritability Mapping. Detection Power. Posterior Probability | en |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | pt-BR |
dc.identifier.citation | ROSSINOL, Aline Marçal. Associação genômica via regiões cromossômicas sob a abordagem bayesiana. 2023. 51 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2023. | pt-BR |
dc.identifier.doi | https://doi.org/10.47328/ufvbbt.2023.150 | pt-BR |
dc.identifier.uri | https://locus.ufv.br//handle/123456789/31009 | |
dc.language.iso | por | pt-BR |
dc.publisher | Universidade Federal de Viçosa | pt-BR |
dc.publisher.program | Estatística Aplicada e Biometria | pt-BR |
dc.rights | Acesso Aberto | pt-BR |
dc.subject | Mapeamento cromossômico | pt-BR |
dc.subject | Estudo de associação genômica ampla | pt-BR |
dc.subject | Teoria bayesiana de decisão estatística | pt-BR |
dc.subject | Probabilidades | pt-BR |
dc.subject.cnpq | Estatística Aplicada e Biometria | pt-BR |
dc.title | Associação genômica via regiões cromossômicas sob a abordagem bayesiana | pt-BR |
dc.title | Genome-wide association studies via bayesian analysis of chromosomal regions | en |
dc.type | Dissertação | pt-BR |
Arquivos
Pacote original
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- texto completo.pdf
- Tamanho:
- 619.88 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- texto completo
Licença do pacote
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: