ppiGremlin - uma estratégia para prospecção de padrões em interfaces proteína-proteína baseada em mineração de grafos

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Federal de Viçosa

Abstract

Interações proteína-proteína (PPI's) estão presentes em praticamente todos os processos biológicos nos organismos vivos, desde a transcrição gênica até os mais altos níveis da sua organização molecular e estrutural. Compreender os mecanismos moleculares envolvidos nessas interações apresenta um contribuição significativa para o desenvolvimento de fármacos, projeto de peptídeos e identificação de alvos moleculares. Neste sentido, este trabalho propõe ppiGReMLIN, uma estratégia baseada em mineração de grafos, para inferir padrões de interação na interface de ligação entre proteínas. Buscamos, através de uma representação simplificada das interfaces, encontrar padrões que reflitam estruturas conservadas em PPI's reais. Para isso, as interfaces de interação são modeladas como grafos bipartidos, cujos vértices e arestas representam, respectivamente, átomos e interações não- covalentes entre eles. Interações são computadas através de análise de contatos, segundo um critério de distância, de acordo com as propriedades físico-químicas dos átomos. Em sequência, o conjunto de grafos produzidos é fragmentado em grupos de acordo com as suas similaridades, utilizando um algoritmo de agrupamento, sobre os quais, em seguida é aplicada mineração de subgrafos frequentes, visando extrair padrões relevantes em cada grupo. As estratégia foi verificada mediante dados estruturais de complexos proteína-proteína extraidos do Protein Data Bank. Duas bases de dados com relevância biológica foram utilizadas na avaliação da estratégia: BCL-2/BH3 e Serino-Proteases. ppiGReMLIN foi capaz de identificar padrões de interação frequentes em ambas as bases de dados, respaldados por estudos experimentais de acordo com a literatura. Palavras-chave: interações proteína-proteína, mineração de dados, padrões de iteração
Protein-protein interactions are prevalent in practically all biological processes in living organisms, from gene transcription to the highest levels of molecular and structural organization. A better understanding of the molecular mechanisms involved in such interactions may offer significant improvement in drug development, peptide design, identification of molecular targets and many others areas. For this purpose, this work proposes ppiGReMLIN, a subgraph mining based strategy to infer interaction patterns in protein-protein interfaces. By means of a simplified representation of interfaces, we aim to uncover relevant patterns that illustrate conserved structural arrangements in real PPI's. Our strategy models protein-protein interfaces as bipartite graphs, whose vertices represent protein atoms, and edges represent interactions among them. Nodes and edges are labeled according to its physicochemical properties and a distance criteria. Then, a clustering analysis is performed on the set of graphs to characterize them according to their similarities, and a subgraph mining task is ensued in order to extract relevant patterns over each group. The strategy was verified against structural data of protein-protein complexes harnessed from the Protein Data Bank. Two relevant datasets were used in the evaluation: BCL-2/BH3 e Serino Protease. ppiGReMLIN was able to disclose relevant interaction patterns in both datasets, confirmed by experimental studies according to literature. Keywords: protein-protein interactions, data mining, interaction patterns

Description

Citation

QUEIROZ, Felippe Cathoud de. ppiGremlin - uma estratégia para prospecção de padrões em interfaces proteína-proteína baseada em mineração de grafos. 2019. 61 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2019.

Endorsement

Review

Supplemented By

Referenced By