Evolution of the plastid genome across land plant lineages, with emphasis on Cactaceae species
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Federal de Viçosa
Abstract
The present doctoral thesis explores plastid genome structure in Cactaceae, with broader implications for plastid evolution and taxonomic representativeness across lineages. Plant evolution is composed of complex and heterogeneous processes driven by distinct forces, and the plastid genome structure often reflects these processes, therefore harboring important markers of plant evolution. The first chapter characterizes the complete plastome of the Brazilian endemic species Hatiora salicornioides, which spans 121.958 bp in a typical quadripartite structure with a reduced gene set. Four pseudogenes are identified (ndhB, ndhC, ndhF, and trnT- GGU), along with six gene losses belonging to the ndh-complex. Chapter two characterizes the plastomes of two Cereus species: C. jamacaru subsp. jamacaru and C. hildmannianus subsp. hildmannianus, displaying highly syntenic plastomes of ca. 141.6 kb. Gene losses (ndh-complex, trnV-GAC, trnV-UAC, and rpl23) and pseudogenization (ndh-complex, and rpl33) are reported for these species. This chapter identifies a potential intron retention in rps18. Additionally, it provides a detailed comparison of both Cereus plastomes to those of closely related taxa and to canonical plastomes of model species, indicating lineage-specific adaptations to xeric environments. It also provides an updated maximum likelihood reconstruction of Cactaceae, placing both Cereus. The plastomes of the three cacti species present high levels of polymorphism and tandem repeats, indicating potential markers for phylogeographic and conservation applications. Additionally, codon usage patterns suggest tRNA import from cytosol or yet, superwobbling mechanism to translate plastid proteins for all of them. The third chapter assesses 10.709 plastid genomes across all land plant lineages to evaluate taxonomic coverage and genomic trends. It reveals strong sampling biases and compares key genome features such as plastid genome size, GC content, number of protein-coding genes and coding-to-non-coding proportion across major groups in order to test whether GenBank data reflects what has been described in the literature. This chapter shows that early diverging groups tend to retain gene-dense plastomes, while derived plastomes show a tendency to display more rearrangements, recombination and lineage-specific modifications at the structural level, which was confirmed by the two first chapters. It underscores the importance of plastid genomes for understanding plant evolution and proposes a 5% minimum representation benchmark to guide future research and conservation efforts. Altogether, this thesis generates novel plastome data for Cactaceae, reveals shared evolutionary trends and contextualizes the current knowledge on plastid genomes within a global framework of plastid genome research. Keywords: plant evolution; structural genomics; Cactaceae; big data; meta-analysis
A presente tese de doutorado investiga a estrutura do genoma plastidial em Cactaceae, com implicações mais amplas para a evolução plastidial e a representatividade taxonômica ao longo das linhagens vegetais. A evolução das plantas é composta por processos complexos e heterogêneos, impulsionados por diferentes pressões evolutivas, e a estrutura do genoma plastidial frequentemente reflete esses processos, abrigando, portanto, importantes indicadores da história evolutiva vegetal. O primeiro capítulo caracteriza o plastoma completo da espécie endêmica brasileira Hatiora salicornioides, o qual possui 121.958 pb em uma estrutura quadripartida típica, porém com um conjunto gênico reduzido. Foram identificados quatro pseudogenes (ndhB, ndhC, ndhF e trnT-GGU), além de seis perdas gênicas relacionadas ao complexo ndh. O segundo capítulo caracteriza os plastomas de duas espécies de Cereus: C. jamacaru subsp. jamacaru e C. hildmannianus subsp. hildmannianus, revelando plastomas altamente sintênicos com cerca de 141,6 kb. Relatam-se perdas gênicas (complexo ndh, trnV-GAC, trnV-UAC e rpl23) e pseudogenização (complexo ndh e rpl33) para essas espécies. Este capítulo também identifica uma possível retenção de íntron no gene rps18. Adicionalmente, oferece uma comparação detalhada dos plastomas das espécies de Cereus com aqueles de táxons relacionados e com plastomas de espécies-modelo, indicando adaptações específicas de linhagens a ambientes xéricos. Apresenta-se também uma reconstrução filogenética por máxima verossimilhança atualizada para Cactaceae, posicionando ambos os táxons de Cereus. Os plastomas das três espécies de cactos apresentam altos níveis de polimorfismo e repetições em tandem, indicando potenciais marcadores para aplicações em filogeografia e conservação. Adicionalmente, os resultados da análise de uso de códons sugerem importação de tRNA ou, ainda, a atuação do mecanismo de superwobbling na tradução das proteínas plastidiais para todas as espécies analisadas. O terceiro capítulo avalia 10.709 genomas plastidiais de todas as linhagens de plantas terrestres, a fim de investigar a cobertura taxonômica e tendências genômicas. Este capítulo revela fortes vieses de amostragem e compara características genômicas chave, como tamanho do plastoma, teor de GC, número de genes codificadores de proteínas e proporção de regiões codificantes em relação às não codificantes entre os principais grupos vegetais, com o objetivo de verificar se os dados disponíveis no GenBank refletem o que tem sido descrito na literatura. Os resultados das análises de estrutura do plastoma mostram que grupos mais basais tendem a manter plastomas mais compactos, enquanto grupos mais derivados apresentam maior tendência a apresentar recombinações e modificações estruturais específicas de linhagem — padrão este confirmado nos dois primeiros capítulos. O capítulo ressalta a importância dos genomas plastidiais para a compreensão da evolução das plantas e propõe um critério mínimo de 5% de representatividade por linhagem para orientar futuras pesquisas e esforços de conservação. Em conjunto, esta tese gera dados inéditos sobre os plastomas de Cactaceae, revela padrões evolutivos compartilhados e contextualiza o conhecimento atual sobre genomas plastidiais dentro de uma perspectiva global da pesquisa em genomas de plastídios. Palavras-chave: evolução de plantas; genômica estrutural; Cactaceae; meta-análise
A presente tese de doutorado investiga a estrutura do genoma plastidial em Cactaceae, com implicações mais amplas para a evolução plastidial e a representatividade taxonômica ao longo das linhagens vegetais. A evolução das plantas é composta por processos complexos e heterogêneos, impulsionados por diferentes pressões evolutivas, e a estrutura do genoma plastidial frequentemente reflete esses processos, abrigando, portanto, importantes indicadores da história evolutiva vegetal. O primeiro capítulo caracteriza o plastoma completo da espécie endêmica brasileira Hatiora salicornioides, o qual possui 121.958 pb em uma estrutura quadripartida típica, porém com um conjunto gênico reduzido. Foram identificados quatro pseudogenes (ndhB, ndhC, ndhF e trnT-GGU), além de seis perdas gênicas relacionadas ao complexo ndh. O segundo capítulo caracteriza os plastomas de duas espécies de Cereus: C. jamacaru subsp. jamacaru e C. hildmannianus subsp. hildmannianus, revelando plastomas altamente sintênicos com cerca de 141,6 kb. Relatam-se perdas gênicas (complexo ndh, trnV-GAC, trnV-UAC e rpl23) e pseudogenização (complexo ndh e rpl33) para essas espécies. Este capítulo também identifica uma possível retenção de íntron no gene rps18. Adicionalmente, oferece uma comparação detalhada dos plastomas das espécies de Cereus com aqueles de táxons relacionados e com plastomas de espécies-modelo, indicando adaptações específicas de linhagens a ambientes xéricos. Apresenta-se também uma reconstrução filogenética por máxima verossimilhança atualizada para Cactaceae, posicionando ambos os táxons de Cereus. Os plastomas das três espécies de cactos apresentam altos níveis de polimorfismo e repetições em tandem, indicando potenciais marcadores para aplicações em filogeografia e conservação. Adicionalmente, os resultados da análise de uso de códons sugerem importação de tRNA ou, ainda, a atuação do mecanismo de superwobbling na tradução das proteínas plastidiais para todas as espécies analisadas. O terceiro capítulo avalia 10.709 genomas plastidiais de todas as linhagens de plantas terrestres, a fim de investigar a cobertura taxonômica e tendências genômicas. Este capítulo revela fortes vieses de amostragem e compara características genômicas chave, como tamanho do plastoma, teor de GC, número de genes codificadores de proteínas e proporção de regiões codificantes em relação às não codificantes entre os principais grupos vegetais, com o objetivo de verificar se os dados disponíveis no GenBank refletem o que tem sido descrito na literatura. Os resultados das análises de estrutura do plastoma mostram que grupos mais basais tendem a manter plastomas mais compactos, enquanto grupos mais derivados apresentam maior tendência a apresentar recombinações e modificações estruturais específicas de linhagem — padrão este confirmado nos dois primeiros capítulos. O capítulo ressalta a importância dos genomas plastidiais para a compreensão da evolução das plantas e propõe um critério mínimo de 5% de representatividade por linhagem para orientar futuras pesquisas e esforços de conservação. Em conjunto, esta tese gera dados inéditos sobre os plastomas de Cactaceae, revela padrões evolutivos compartilhados e contextualiza o conhecimento atual sobre genomas plastidiais dentro de uma perspectiva global da pesquisa em genomas de plastídios. Palavras-chave: evolução de plantas; genômica estrutural; Cactaceae; meta-análise
Description
Keywords
Citation
BADIA, Clara da Cruz Vidart. Evolution of the plastid genome across land plant lineages, with emphasis on Cactaceae species. 2025. 605 f. Tese (Doutorado em Botânica) - Universidade Federal de Viçosa, Viçosa. 2025.
