14 Nisan 2013 Pazar

Biyoinformatik Nedir?

Normal şartlar altında, bir kitabın önsözü ironik bir şekilde, kitap bittikten sonra yazılır. Yine normal şartlar altında, aynı durum tanım cümleleri için de geçerlidir. Bir kavramı tanımlayabilmek için, o kavramın anlaşılabilmesi için gerekli olan kavramların olgunlaşması gerekir. Bu nedenle, biyoinformatik çalışmaları olarak nitelendirebileceğimiz çalışmalar 1980'li yıllarda ortaya çıkmaya başlamışsa da, gerçek manada bir disiplin olarak tanımlanıp sözlüklere girmesi için en az bir on sene geçmesi gerekmiştir; konunun yaygın bir tanınabilirlik edinebilmesi için de bunun üzerine en az bir on sene daha koymak gerekir.

Biyoinformatik kavramı, Oxford İngilizce Sözlüğü'nde (bizim TDK sözlüğümüz gibi düşünelim) yaklaşık olarak şu şekilde tanımlanmaktadır: 
Karmaşık biyolojik verilerin [complex biological data] derlenmesi [collecting] ve analiz edilmesi [analysis] bilimi.


Bu arada değinmeden geçemeyeceğim, her ne kadar bizim TDK'mız gibi düşünelim dediysem de, o kadar baştan savma ve güncellikten uzak bir kaynak olarak düşünmeyelim; önceki yazılarımdan birinde TDK'da bilgi, malumat ve veri kavramlarının birbirinden nasıl ayrılamadığına ilişkin çarpıcı bir örnekten bahsetmiştim. Bilgi çağında olduğumuz iddia ediliyor ancak ne hikmetse bilginin Türkçe sınıflandırılmasında dahi aciz kalınıyor. Bu sıkıntıya işaret ettiğinizde ise ya haddinizi bilmediğinizi iddia ediyorlar, ya birikiminizi sorguluyorlar (asıl bu kimin haddine düşmüş), ya da yıllar önce ortaya konulan ve güncelliğini yitirmiş olan emeğe saygı duyulmadığını savunuyorlar; zaten yapılan yanlışı kavramlar üzerinden savunabilecek de değiller. Bir devletin kurumlarının büyük bir kısmı C sınıfı elemanlardan oluşursa, bu insanların gerçek dünyayla muhattap olduklarında başkalarını suçlamaktan başka çareleri de kalmaz, e tabi ne yapsınlar, yetersiz olduklarını itiraf edip her ay yatarak aldıkları maaşlarından vaz mı geçsinler? Bu kadar sinirlenmemin güncel  bir sebebi Çizgi TAGEM'in karşı karşıya kaldığı dava, ufak bir Google aramasıyla  konunun detaylarına ulaşabilirsiniz.

Yukarıdaki biyoinformatik tanımının anlaşılabilmesi için tekrar tanımlanması gereken üç kavram daha var: 1) karmaşık biyolojik veriler, 2) verilerin derlenmesi ve 3) verilerin analizi.


Karmaşık Biyolojik Veriler
Bu verilerden kastımız, yüksek çıktılı [high-throughput] teknolojiler kullanılarak elde edilen veriler. Yani, örneğin, paralel olarak gerçekleştirilen Sanger dizileme verileri, Yeni Nesil Sekanslama verileri, her türlü (genomik, proteomik, metabolomik) mikrodizi verileri, kütle spektrometrisi verileri, qPCR verileri, vb. Bu verilerin ortak özelliği, aynı anda en az iki haneli (çoğu zaman da 5 haneli) rakamlarla ifade edilebilecek gen, protein ve benzeri moleküllerin farklı biyolojik durumlarda [condition] sayısal olarak fotoğraflanmasıdır. Aynı anda değerlendirdiğiniz molekül sayısı arttıkça, bu moleküller arasındaki etkileşimlerin karmaşıklığından ötürü büyük resim bulanıklaşır ve büyük resmin anlaşılabilmesi için özel bir yaklaşım gerekir.

Verilerin Derlenmesi
Bu kavram aslında kendi içinde 3 bölüme ayrılıyor: verinin saklanması [storage], etkin bir şekilde organize edilmesi [data organization], ve bu organize bilgiye erişim [retrieval]. Örneğin, bir gene ait DNA diziliminin verinin özelliklerine uygun bir şekilde bir veritabanında saklanması, bu verinin diğer veri türleriyle (mRNA dizilimi, protein dizilimi, ifade verileri vb.) ilişkili olarak bir genom veritabanındaki gibi organize edilmesi, ve bu veriye erişmek için gerekli arayüzlerin (web sitesi vb.) oluşturulması.

Verilerin Analizi
Aynı anda birden fazla parametreyi fazlasıyla değişken olan canlılarda incelemeye başladığımızda istatistik olmadan yapamayız; bunun sebebini Deniz Ağırdan'ın yazılarında daha detaylı olarak bulabilirsiniz. Özetle, elinizde karmaşık veriler olduğunda ilkokuldaki Hayat Bilgisi dersinde öğrendiğimiz hangisi daha çoktur veya hangisi daha uzundur tarzındaki yaklaşımla çıkarımlarda bulunmak artık yeterli değildir (belki inandırıcı gelmeyebilir ama bu tarz yaklaşımlarla mikrodizi analizi yapmaya çalışan  o kadar çok araştırmacıya şahit oldum ki) ve daha ileri düzeyde yöntemlere başvurmalısınız. 

Yukarıdaki 3 kavramı tanımladığımızda biyoinformatiği hakkıyla tanımlamış oluyoruz. Tekrar okuyalım:
Biyoinformatik, karmaşık biyolojik verilerin derlenmesi ve analiz edilmesi bilimidir.


Sözün özü:
Günümüzdeki neredeyse her tür biyolojik veriye uygulanan ileri düzey analizleri biyoinformatik analizler olarak sınıflandırabiliriz.



Proje:
Biyoinformatik tanımına ilişkin İngilizce ve Türkçe kavramları Google'da araştırmak için yarım saatinizi ayırın ve aslında her bir tanımın hem doğru, hem de yetersiz olduğunu keşfedin.

Meraklısına:
Biyoinformatik kavramının nasıl doğduğunu daha iyi anlayabilmek için, aynı zamanda İnsan Genom Projesi'nin arkaplanını da anlatan Gen Savaşları adlı kitabı okuyabilirsiniz.