Ranking cancer drivers via betweenness-based outlier detection and random walks
Özet
Recent cancer genomic studies have generated detailed molecular data on a large number
of cancer patients. A key remaining problem in cancer genomics is the identification
of driver genes.
We propose BetweenNet, a computational approach that integrates genomic data with a
protein-protein interaction network to identify cancer driver genes. BetweenNet utilizes
a measure based on betweenness centrality on patient specific networks to identify the
so-called outlier genes that correspond to dysregulated genes for each patient. Setting up
the relationship between the mutated genes and the outliers through a bipartite graph, it
employs a random-walk process on the graph, which provides the final prioritization of the
mutated genes. We compare BetweenNet against state-of-the art cancer gene prioritization
methods on lung, breast, and pan-cancer datasets.
Our evaluations show that BetweenNet is better at recovering known cancer genes based
on multiple reference databases. Additionally, we show that the Gene Ontology terms and
the reference pathways enriched in BetweenNet ranked genes and those that are enriched
in known cancer genes overlap significantly when compared to the overlaps achieved by
the rankings of the alternative methods. Son yıllardaki kanser genom çalışmaları yüksek sayıda kanser genomu için detaylı moleküler veri üretmiştir. Ortaya çıkan önemli bir problem bu verileri kullanarak kanser sürücü genleri tespit etmektir. Bu tezde, genomik veriyi protein-protein etkileşim ağlarıyla birleştirerek kanser sürücü genleri tespit eden BetweenNet isimli işlemsel bir yöntem önerilmektedir. BetweenNet, hastaya özgü oluşturulmuş ağları arasındalık merkeziliği tabanlı bir metrik ile inceleyerek etkinliği değişmiş aykırı genleri bulmaktadır. Mutasyona uğramış genlerle etkinliği değişmiş genlerin arasındaki ilişkileri iki parçalı bir çizgede tanımlayıp, bu çizgede rastgele yürüyüş algoritması uygulayarak mutasyona uğramış genleri sürücülük potansiyeline göre sıralamaktadır. BetweenNet yöntemi varolan benzer yöntemlerle akciğer, meme ve pan-kanser verileri kullanılarak karşılaştırılmıştır. Değerlendirmelerimiz BetweenNet'in bilinen kanser genlerini bulmada daha başarılı olduğunu göstermektedir. Ayrıca, bilinen kanser genleriyle BetweenNet tarafından sıralanan genlerin Gene Ontology terimleri ve referans ağlar bakımından birbiriyle önemli derecede örtüştüğü tespit edilmiştir.