Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/11659
Tipo: Tese
Título: Caracterização dos genomas nuclear, cloroplastidial e mitocondrial da cana- de-açúcar utilizando dados de sequenciamento de nova geração
Characterization of nuclear, chloroplastidial and mitochondrial genomes of sugarcane using next-generation sequencing data
Autor(es): Vidigal, Pedro Marcus Pereira
Abstract: Nesta tese, os dados do sequenciamento do genoma da variedade de cana-de-açúcar RB867515 e de outros 508 genótipos provenientes de 100 famílias de meios-irmãos são analisados com os seguintes objetivos: (I) montar as sequências dos genomas nuclear, cloroplastidial e mitocondrial da variedade RB867515; (II) predizer e anotar funcionalmente os genes e demais elementos presentes nas sequências obtidas; (III) analisar os polimorfismos de nucleotídeo único presentes nos genomas dos genótipos de cana-de-açúcar; (IV) associar os polimorfismos identificados com as características fenotípicas dos genótipos usando estudos de associação ampla do genoma; (V) criar um banco de dados integrando as sequências, os polimorfismos e as informações funcionais obtidas. As bibliotecas genômicas foram sequenciadas usando as tecnologias de sequenciamento de nova geração da Illumina e as sequências obtidas foram trimadas e selecionadas, produzindo um conjunto de dados contendo 1,39 bilhões de sequências da variedade RB867515 e 2,43 bilhões de sequências dos genótipos. As sequências dos genomas nuclear, cloroplastidial e mitocondrial da variedade RB867515 foram montadas usando algoritmos de montagem De Novo e estratégias baseadas em genomas de referência. Os genes foram identificados usando métodos ab initio e empíricos, e as informações funcionais foram preditas a partir de pesquisas de similaridade. Na genotipagem, as sequências dos genótipos foram mapeadas no genoma da variedade RB867515 e os polimorfismos de nucleotídeo único foram identificados seguindo os métodos recomendados para a descoberta de variantes a partir de dados de sequenciamento de nova geração. No estudo de associação ampla do genoma, a associação dos polimorfismos com as características fenotípicas dos genótipos foi avaliada usando o método enriched compressed mixed linear model (ECMLM). O genoma nuclear da variedade RB867515 foi montado em 484.719 sequências com um tamanho total de 552,97 megabases (Mb), sendo preditos 75.715 genes codificadores de proteínas. Esses genes foram funcionalmente anotados e as suas proteínas foram classificadas em diferentes grupos funcionais. A análise dos polimorfismos identificou 40.663 loci contendo polimorfismos de nucleotídeo único em 7.890 genes e apenas um polimorfismo no gene da enzima isocitrato desidrogenase apresentou associação significativa com a característica fenotípica conteúdo de sacarose na cana em percentagem (PC) no estudo de associação ampla de genoma. O genoma cloroplastidial da RB867515 foi montado em uma única sequência contendo 141,18Kb, sendo identificados 88 genes codificadores de proteínas, 8 genes de rRNA e 39 genes de tRNA. A sequência desse genoma é idêntica ao genoma da variedade de cana-de-açúcar Q155, originária da Austrália. A análise dos polimorfismos mostrou que apenas oito genótipos incluídos na família da variedade RB982639 (g011, g030, g031, g094, g103, g246, g425 e g441) apresentam polimorfismos em suas sequências. Esses polimorfismos estão localizados em regiões intergênicas do genoma e nos genes petB e ndhF. O genoma mitocondrial da variedade RB867515 foi montado em dois segmentos subgenômicos circulares com um tamanho total de 445,52Kb, sendo identificados 34 genes codificadores de proteínas, 6 genes de rRNA e 22 genes de tRNA. A análise dos polimorfismos identificou 6 SNPs e 23 indels localizados em regiões intergênicas do genoma mitocondrial dos genótipos. Todas essas informações geradas nesta tese auxiliarão na aplicação das ciências genômicas nos PMGCA, permitindo a integração entre as sequências dos genes e suas respectivas proteínas, os polimorfismos e as informações funcionais. O banco de dados Sugarcane DB (http://sugarcane.ccb.ufv.br) foi criado para organizar essas informações e torna-las disponíveis aos PMGCA. A missão do Sugarcane DB é ser um repositório público permanente de informações genômicas relacionadas à cana-de-açúcar e se tornar uma ferramenta importante para auxiliar os melhoristas na identificação de novos alvos para o melhoramento genético da cana-de-açúcar.
In this thesis, genome sequencing data of the sugarcane cultivar RB867515 and other 508 sugarcane genotypes from 100 half-sib families are analyzed with the following objectives: (I) assemble the sequences of the nuclear, chloroplastidial and mitochondrial genomes of sugarcane cultivar RB867515; (II) predict and functionally annotate the genes and other elements in the assembled sequences; (III) analyze the single nucleotide polymorphisms (SNPs) in the genomes of sugarcane genotypes; (IV) to associate the identified SNPs to the phenotypes of sugarcane genotypes using genome wide association studies (GWAS); (V) create a database integrating sequences, polymorphisms and functional information. Genomic libraries were sequenced using Illumina's next generation sequencing technologies and sequenced reads were trimmed and selected, yielding a dataset containing 1.39 billion reads of the cultivar RB867515 and 2.43 billion reads of the sugarcane genotypes. Nuclear, chloroplastidial and mitochondrial genome sequences of the cultivar RB867515 were assembled using De Novo assembly algorithms and reference-guided approaches. Genes were identified using ab initio and empirical methods, and functional information were predicted by using sequence similarities searches. In genotyping, the sequenced reads of the sugarcane genotypes were mapped in the genome of cultivar RB867515, and SNPs were predicted following guidelines for variant discovery from next-generation sequencing data. In the genome-wide association study, the association of SNPs with the phenotypes of sugarcane genotypes was evaluated using the enriched compressed mixed linear model (ECMLM). The nuclear genome of the cultivar RB867515 was assembled in 484,719 sequences with 552.97 megabases (Mb), containing 75,715 protein-coding genes. These genes were functionally annotated and the encoded proteins were classified into different functional groups. The polymorphisms analysis identified 40,663 loci containing SNPs in 7,890 genes. In GWAS, only one SNP in the isocitrate dehydrogenase enzyme gene showed significant association with sugarcane sucrose content in percentage (PC). The chloroplast genome of the cultivar RB867515 was assembled in a single sequence containing 141.18Kb, containing 88 protein-coding genes, 8 rRNA genes and 39 tRNA genes. Chloroplast genome sequence of cultivar RB867515 is identical to the sequence of Q155 cultivar from Australia. The polymorphisms analysis showed that only eight genotypes of the RB982639 family (g011, g030, g031, g094, g103, g246, g425 and g441) have SNPs in their chloroplast genome sequences. These polymorphisms (7 SNPs and 4 indels) are located in intergenic regions of chloroplast genome and in petB and ndhF genes. The mitochondrial genome of the cultivar RB867515 was assembled in two circular subgenomic segments with a total size of 445.52Kb, containing 34 protein-coding genes, 6 rRNA genes and 22 tRNA genes. The polymorphisms analysis identified 6 SNPs and 23 indels located in intergenic regions of the mitochondrial genome of sugarcane genotypes. All data generated in this thesis will contribute to the application of the genomic sciences in sugarcane breeding, allowing the integration among gene and protein sequences, polymorphisms and functional information. The Sugarcane DB database (http://sugarcane.ccb.ufv.br) was created to organize these data and make it available to the PMGCA. Sugarcane DB aims to be a permanent public repository of sugarcane genomic information and to become an important tool to assist breeders in identifying new targets for the genetic improvement of sugarcane.
Palavras-chave: Cana-de-açúcar - Melhoramento genético
Cana-de-açúcar - Bioinformática - Genômica
Cana-de-açúcar - Genoma
Cana-de-açúcar - Bioinformática - Banco de dados
CNPq: Melhoramento Vegetal
Editor: Universidade Federal de Viçosa
Titulação: Doutor em Genética e Melhoramento
Citação: VIDIGAL, Pedro Marcus Pereira. Caracterização dos genomas nuclear, cloroplastidial e mitocondrial da cana- de-açúcar utilizando dados de sequenciamento de nova geração. 2016. 96f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2016.
Tipo de Acesso: Acesso Aberto
URI: http://www.locus.ufv.br/handle/123456789/11659
Data do documento: 7-Dez-2016
Aparece nas coleções:Genética e Melhoramento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdftexto completo1,2 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.