Classificação e anotação in silico de genomas virais relacionados ao filo Cressdnaviricota

dc.contributor.advisorZerbini, Francisco Murilo
dc.contributor.authorGomes, Ruither Arthur Loch
dc.contributor.authorLatteshttp://lattes.cnpq.br/6476684270507219pt-BR
dc.date.accessioned2024-01-31T13:17:21Z
dc.date.available2024-01-31T13:17:21Z
dc.date.issued2023-05-02
dc.degree.date2023-05-02
dc.degree.departmentDepartamento de Bioquímica e Biologia Molecularpt-BR
dc.degree.grantorUniversidade Federal de Viçosapt-BR
dc.degree.levelDoutoradopt-BR
dc.degree.localViçosa - MGpt-BR
dc.degree.programDoutor em Bioquímica Aplicadapt-BR
dc.description.abstractOs vírus afetam ciclos biogeoquímicos e infectam organismos em todos os ambientes da terra. Avanços em diferentes tecnologias, como o sequenciamento de alto rendimento e a biologica computacional, trouxeram luz sobre a real diversidade e abundância dos vírus. Uma das consequências mais importantes foi a descoberta de um imenso número de sequências virais, porém sem similaridade com vírus previamente caracterizados. Enquanto a classificação taxonômica dos vírus havia sido feita por décadas com base em características fenotípicas, essa nova realidade gerou a necessidade da utilização direta das sequências, mesmo na ausência de qualquer informação biológica, para a classificação taxonômica. Com esse novo panorama de farta disponibilidade de dados de sequência, avanços no poder computacional e de aprendizado de máquina surgiram como ferramentas essenciais para classificação e anotação das sequências derivadas desse "dilúvio de dados". Diversas ferramentas computacionais vêm sendo propostas e desenvolvidas usando diferentes abordagens para trabalhar com esses dados, e o aprendizado de máquina vem se destacando por sua alta acurácia de predição. Na taxonomia, diferentes abordagens vem sendo aplicadas para grupos específicos de vírus, e só recentemente foi desenvolvido um algoritmo, VirusTaxo, para classificação taxonômica de todos os tipos de vírus com acurácia considerável. Entre as diversas famílias de vírus, algumas se enquadram dentro de um grupo de vírus com genomas de DNA de fita simples circulares e pequenos, que codificam uma proteína relacionada à replicação que é relativamente conservada entre seus membros. Esses vírus, classificados no filo Cressdnaviricota, são exemplares interessantes para se avaliar métodos in silico de classificação e análise de funções gênicas. Assim, na primeira parte desse trabalho, foi avaliada a capacidade das redes neurais convolucionais para classificar taxonomicamente os cressdnavírus. Foi possível obter uma acurácia nos dados de teste superior ao VirusTaxo, a ferramenta com maior capacidade de predição taxonômica atualmente. Na segunda parte, foram utilizadas ferramentas computacionais para identificar possíveis pequenas ORFs funcionais em alfassatélites associados a begomovírus que possam estar relacionadas a variações de sintomas observadas entre alfassatélites do Novo Mundo e do Velho Mundo e foi possível identificar duas pequenas ORF com domínios funcionais preditos. Palavras-chave: Vírus, Cressdnaviricota, bioinformática, machine learningpt-BR
dc.description.abstractViruses affect biogeochemical cycles and infect organisms in all environments on earth. Advances in different technologies, such as high-throughput sequencing and computational biology, have shed light on the real diversity and abundance of viruses. One of the most important consequences was the discovery of an immense number of viral sequences with no similarity with previously characterized viruses. While the taxonomic classification of viruses had been carried out for decades based on phenotypic characteristics, this new reality created the need for the direct use of sequences, even in the absence of any biological information, for taxonomic classification. With this new scenario of plentiful availability of sequence data, advances in computational power and machine learning have emerged as essential tools for classifying and annotating sequences derived from this "data deluge". Several computational tools have been proposed and developed using different approaches to work with these data, and machine learning has been highlighted for its high prediction accuracy. In taxonomy, different approaches have been applied to specific groups of viruses, and only recently an algorithm, VirusTaxo, has been developed to taxonomically classify all types of viruses with considerable accuracy. Among the many families of viruses, some fall within a group of viruses with small, circular, single-stranded DNA genomes that encode a replication-related protein that is relatively conserved among its members. These viruses, classified in the phylum Cressdnaviricota, are interesting examples for evaluating in silico methods of classification and analysis of gene function. Thus, in the first part of this work, the ability of convolutional neural networks to taxonomically classify cressdnaviricots was evaluated. It was possible to obtain an accuracy in the test data superior to VirusTaxo, the tool currently with greater taxonomic prediction capacity. In the second part, computational tools were used to identify possible small functional ORFs in begomovirus-associated alphasatellites that may be related to symptom variations observed between New World and Old World alphasatellites and it was possible to identify two small ORFs with predicted functional domains. Keywords: Virus, Cressdnaviricota, bioinformatics, machine learningen
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt-BR
dc.identifier.citationGOMES, Ruither Arthur Loch. Classificação e anotação in silico de genomas virais relacionados ao filo Cressdnaviricota. 2023.79 f. Tese (Doutorado em Bioquímica Aplicada) - Universidade Federal de Viçosa, Viçosa. 2023.pt-BR
dc.identifier.doihttps://doi.org/10.47328/ufvbbt.2024.002pt-BR
dc.identifier.urihttps://locus.ufv.br//handle/123456789/32083
dc.language.isoporpt-BR
dc.publisherUniversidade Federal de Viçosapt-BR
dc.publisher.programBioquímica Aplicadapt-BR
dc.rightsAcesso Abertopt-BR
dc.subjectVírus - Genéticapt-BR
dc.subjectMapeamento macrossômicopt-BR
dc.subjectApredinzado do computadorpt-BR
dc.subjectRedes neurais (computação)pt-BR
dc.subject.cnpqBiologia Molecularpt-BR
dc.titleClassificação e anotação in silico de genomas virais relacionados ao filo Cressdnaviricotapt-BR
dc.titleClassification and in silico annotation of viral genomes related to the phylum Cressdnaviricotaen
dc.typeTesept-BR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
texto completo.pdf
Size:
1.47 MB
Format:
Adobe Portable Document Format
Description:
texto completo

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: