14 Mayıs 2013 Salı

Korelasyon Verilerinin Görüntülenmesi İçin Farklı Bir Grafik Türü

İngilizce yazdığım blogumdaki son yazıyı hazırlarken, bunun bir de biyoinformatik verilerle olan versiyonunu oluşturmalıyım diye düşündüm. Farklı gruplar, örnekler veya genler arasındaki bağlantıları ortaya koymanın en hızlı yolu bir korelasyon analizi gerçekleştirmek ancak neredeyse hiç bir zaman iş bununla bitmez. Bu analiz sonucu elde edilen verilerin görüntülenmesi en az analiz kadar önemlidir; aksi takdirde insan algısına çok da hitap etmeyen sayısal verilerle kalakalırsınız. Konumuz gen ifade ağları [gene expression networks] olduğunda genelde bir ağ grafiği mutlaka çizilmeli ve algımıza uygun bir tarzda renklendirilip şekillendirilmelidir, buna ilişkin data detaylı bilgi için Cytoscape - 1 ve Cytoscape - 2 yazılarıma göz atabilirsiniz. Bugün, biraz daha detaylı bir görüntüleme için kullanılabilecek ve görmeye çok da alışık olmadığımız bir grafik türünden bahsedeceğim.

Bir analiz yaparken bazen bazı adımları sırf yapmak zorunda olduğunuz için yaparsınız; bazen bu adım sonucu büyük bir şekilde etkilese dahi aralarda yer aldığı için neredeyse hiç hissedilmez. Normalizasyon buna çok güzel bir örnektir. Ancak konu, göz önünde olan bir analiz adımı olduğunda işin rengi çoğu zaman değişir ve tam da bu kısımda en etkin aracı seçmek zorundasınızdır; çoğu zaman da bu araç şekillerdir. İşin felsefesinden de bahsettikten sonra biraz şekil çizelim :)




Cıvıl cıvıl bir şekil :) Önce kısa bir açıklama: yukarıdaki şekil, farklı deney gruplarında anlatımı anlamlı olarak değişen [significant] 16 genin 12 farklı mikrodizi deneyindeki ifade düzeyleri temel alınarak hazırlandı. Korelasyon analizi uygulanarak r değeri 0,8'den fazla olan ilişkiler seçildi ve yukarıdaki şekilde görüntülendi. 

Hızlıca yorumlara geçelim: en fazla genle etkileşimde olan gen G13; 5 gen ise sadece birer genle etkileşim halinde. Aynı zamanda, bu genler arasında sıkı bir bağlantı var ve etkiye verdikleri tepki de kuvvetli bir şekilde beraber hareket ediyor. Bu durumu santral dogma'nın geçerliliğini büyük oranda yitirmesiyle zaten yıllar önce öğrenmeye başlamıştık. Bu noktada önemli olan şey ise, genlerin aralarında nasıl bir ilişki olduğunu çözmeye çalışmak.

Tam da bu noktada araya girmeden edemeyeceğim. Gen sayısı az olduğunda, algımız bir sıra takip etmeyi sever, ve bu kavramı tutarlılık veya süreklilik [consistency] kelimleleriyle ifade edebiliriz. Tam da bu nedenle, bir ağ grafiği algımızı bozmaya daha yatkındır ve küçük ağlarda biraz daha dikkat gerektirebilir. Ancak yukarıdaki gibi bir grafikte ilişkileri takip ederken sıralama değişmediği için veya gen sayısı artsa dahi yine de bir sıralama beklendiği şekilde kurulabileceği için tüm dikkat ilişkilere verilebilir. Devam edelim.

Peki, bu kısmen karmaşa dolu şekli nasıl daha rafine hale getirebiliriz ve her seferinde bir gene odaklanarak daha rahat bir şekilde çözebiliriz? Bunu gerçek zamanlı olarak yapabileceğimiz web teknolojileri mevcut ancak bu blog teknik olarak buna izin vermiyor; bu nedenle her bir gen için etkileşimli olarak ortaya çıkarılabilecek grafiklerin bir kısmını aşağıda bulabilirsiniz:




Yukarıda, seçilmiş dört gene ilişkin verileri görüyorsunuz. Burada dikkatinizi çekmek istediğim bir motif var: diğerlerine göre daha fazla genle ilişkili genler, çoğu zaman yine aynı türdeki genlerle ilişkili. Az sayıda genle ilişkili genler ise yine çoğu zaman az sayıda genle ilişkili genlerle ilişkili. Yani, sanki birçok genden oluşan gen kompleksleri (veya bunların kodladığı protein kompleksleri) ile, bunlar arasındaki iletişimi sağlayan ve daha az genle iletişimi olan genler var. Acaba, bu tarz grafikleri dikkatle incelersek, -eğer gerçekten de varsa- bu potansiyel 'iletişimci' genleri tespit edebilir miyiz? Bu yorumu size bırakıyorum ve biraz daha karmaşık bir şekli örnek vererek yazımı sonlandırıyorum. Aşağıdaki grafikte, 24 saatlik bir veri türünün analizi sonucu oluşturulan bir etkileşim grafiğinin tümünü ve saat  21'e odaklanmış halini göreceksiniz. 



Sözün Özü:
Analiz sonuçlarının görüntülenmesi en çok öne çıkan adım olduğu için hem sonuçların yorumlanmasını, hem de kolayca algılanmasını sağlayan grafik türlerini keşfetmek ve kullanmak çok kıymetlidir.



Proje:
En üstteki şekli, varolan bağlantıları temel alarak bir gen ağına dönüştürmeye çalışalım. Nasıl bir görüntüyle karşılaşıyoruz? Sizce bu iki farklı şekil türünün birbirine olan üstünlükleri nelerdir?

Meraklısına:
Keşfedilmeyi bekleyen ancak etkileşim teknolojileri yeterince gelişmediği için bir kenarda unutulmuş birçok grafik türü var. Ekran üzerindeki etkileşimi yazılımlar ile bir yere kadar sağlayabiliyoruz ancak kağıt üzerinde bir etkileşimi henüz beceremedik. Belki de duvara monte edilmiş tabletler bizim bu ihtiyacımızı karşılayabilir.