19 Ocak 2014 Pazar

Yeni Nesil Dizilimleme [Next Generation Sequencing] Teknolojisine Bakış - 1 (Sanger Dizilimleme)

Biyoinformatik analizlerimize konu olan veriler, büyük oranda yüksek çıktılı [high-troughput] teknolojilerden elde ediliyor. Her yeni teknolojide olduğu gibi, biyolojik çıktı üreten teknolojilerin de kendine has özellikleri ve yetersiz kaldıkları noktalar var. Bir biyoinformatik analiz içinse ilgili teknolojiyi çok iyi bilmek büyük bir önem kazanıyor; böylece elde edilen verinin kuvvetli yanlarına odaklanabilir ve yetersiz/yanıltıcı yanlarından ise uzak durabilir veya bu yanları telafi edecek yaklaşımlar geliştirebilirsiniz. Ulaşımdan bir örnek vereyim.

Kalabalık bir şehirde, şehrin bir tarafından diğerine gitmeniz gerektiğini düşünün. Birkaç alternatif ulaşım aracı düşünebiliriz ve bunların her birinin kendine has artı ve eksileri vardır. Ulaşım için kendi aracınızı kullanırsanız, o andaki ulaşım ihtiyacınızı büyük ihtimalle daha hızlı ve daha ucuza karşılarsınız ancak kendi aracınızı kullanmadığınız zamanlar da o araca sahip olmanın maliyetini üstlenmek zorunda kalırsınız, bunun yanısıra vergi ve bakım gibi masrafları da siz üstlenirsiniz. Otobüs, kullanım maliyeti çok daha düşük bir ulaşım aracıdır çünkü o otobüsteki herkesle biraraya gelip para toplar ve otobüsün giderlerini ve sürücü maliyetini hep birlikte paylaşırsınız. Otobüsü kullandığınız sürece giderlere ortak olursunuz, kullanmadığınız zaman ise ortaklıktan ayrılabilirsiniz; ancak eninde sonunda giderleri büyük ve kalabalık bir kitleyle paylaşmak zorunda kalırsınız. Dolmuş da otobüse çok benzer bir ekonomik modelle işler, yani giderleri ve aldığınız hizmeti bedelini diğer yolcularla paylaşırsınız; üstelik herhangi bir durak sınırlaması da yoktur bu araçta. Buna rağmen, durak sınırlamasının kalkmasının olumlu yanlarını yaygınlığın azalmasıyla karşılamak zorunda kalırsınız: dolmuş hatları otobüs hatları kadar yaygın değildir. Ayrıca bu iki ulaşım yönteminde de bekleme zorunluluğunuz vardır. Metro çok daha hızlıdır ancak yaygın değildir ve ana hatlarda faaliyet gösterir. Takside ise sürücü ve otomobil giderlerini başkalarıyla paylaşmazsınız ve durak sınırlamanız da yoktur, kullandığınız kadar ödediğiniz bu ulaşım modelinde ise birçok avantaja rağmen toplu ulaşım yöntemlerine kıyasla çok daha fazla ödeme yaparsınız.
Özetle, her seçim bir vaz geçiştir ve bu durum genom ve proteom teknolojilerinde de pek farklı değildir. Burada en önemli ilk şey, yaptığınız çalışmaya uygun bir teknoloji seçmektir. Sizin için çok önemli olmayan detaylarda yetersiz, ancak önem verdiğiniz detaylarda ise kıymetli sonuçlar veren bir teknolojiyi seçebilmek maça 1-0 önde başlamak gibidir, hatta belki 3-0. Bu nedenle, Yeni Nesil Dizilimleme [Yeni Nesil Sekanslama | Next Generation Sequencing] yöntemini tam olarak anlayabilmek için bu yöntemi ortaya çıkaran ihtiyaçlara ve bu yöntemi besleyen teknolojilere de hakim olmak gerekir; DNA dizilimlemeye [DNA sekanslama | DNA sequencing] ilişkin en önemli yöntem olan Sanger dizilimlemeden bahsedeceğim bu yazıda.

DNA'nın varlığı 1869 yılında Miescher tarafından farkediliyor ve DNA'nın kalıtımsal özelliği 1920'lerden 1950'lere kadar bir çok çalışmaya konu oluyor, nihayet 1952 yılında gerçekleştirilen bir deneyle de bilimsel olarak kanıtlanıyor. 1953'te Watson ve Crick (aslında Rosalind Franklin'i de eklemek lazım) DNA'nın çifte sarmal yapısını gösteriyor (DNA araştırmalarının tarihçesi için ilgili Wikipedi makalesine göz atabilirsiniz). O zamandan bu yana moleküler biyoloji ve genetik için en kritik malzeme DNA'nın kendisi ve bu nedenle DNA zincirindeki bazların sıralamasını saptayabilmek bizim için büyük bir öneme sahip. Bu doğrultuda yapılan ve en geniş etkiye sahip çalışma, Frederick Sanger'in 1977 yılında geliştirdiği yöntem ve biz buna Sanger dizilimleme [Sanger sekanslama | Sanger sequencing] diyoruz. Zincir sonlandırma [chain termination] yöntemindeki temel yaklaşımı şu şekilde özetleyebiliriz: klasik PCR deneyini yaparken ortama koyduğunuz bazların (dNTP) bir kısmını, bir ucuna yeni bir baz ekleme özelliğini kaybetmiş ve floresan özellikli başka bir baz türüyle (ddNTP) değiştiriyor ve böylece farklı uzunluklarda sonlanmış ve sonlandığı bazlara göre de floresan ışıma yapan DNA'lara sahip oluyorsunuz. Biraz hayalgücünüzü zorlayayım: her bir bazın (A, T, G ve C) tıpkı mıknatıs gibi iki kutbu vardır (bu kutupları 5' ve 3' olarak adlandırıyoruz) ve halihazırda varolan bir bazın bir kutbuna, başka bir bazın diğer bir kutbu bağlanabilir. Yani, varolan DNA zincirinin 3' ucuna, yeni bağlanacak bazın 5' ucu eklenir. Eğer siz bir bazın 3' ucunu bozarsanız, bu baz varolan bir DNA zincirine bağlanabilir ancak bu DNA zinciri artık daha fazla uzatılamaz, çünkü yeni bazın bağlanabileceği uygun bir nokta ortadan kalkmış olur. Böylece, çeşitli uzunluklarda sonlanmış DNA zincirlerini jel elektroforezinde koşturarak bu DNA zincirlerini sıralayabilir ve bu sıraya göre de hangi zincirin hangi bazla sonlanmış olduğunu anlayabilirsiniz. Yandaki şekilde bunun bir örneğini görebilirsiniz.

Bu teknik detayların bize işaret ettiği birkaç nokta var. Bunlardan ilki, elde edilen DNA diziliminin ilk 15 ila 40 bazının düşük kalitede olması; ikincisi, 700 ila 900 bazdan itibaren dizilimleme kalitesinin kabul edilebilir seviyelerden aşağıya düşmesi. Üçüncüsü, yaklaşık 800 baz okumak için gerekli zamanın uzunluğu; dördüncüsü de, baz başına kullanılan sarf malzemesinin göreceli olarak pahalı olması. Özellikle zaman ve maliyet hesabını sadece 800 bazlık bir DNA dizilimi için değil de, yaklaşık 3 milyar baza sahip insan genomunu dizilimlemek için düşündüğümüzde işin rengi değişiyor. Yine de günümüzde bu yöntem özellikle küçük genom bölgelerinin dizilimlenmesindeki en mantıklı alternatif.

Gelelim bu yöntemin Yeni Nesil Dizilimleme ile olan ilişkisine. Araştırmacılar önceleri Sanger yöntemini geliştirmeye çalıştılar: daha az sarf malzemesiyle daha hızlı dizilimleme yapmak temel hedefti. Klasik Sanger yöntemi jel elektroforezi aşaması gerektirirken, otomatik cihazlar kılcal [kapiler | capillary] elektroforez yöntemiyle okumayı hızlandırdı, ayrıca aynı zamanda birden fazla kılcal elektroforez kullanılarak birim zamanda dizilimlenen baz sayısı arttırıldı. Geçiş dönemi olarak adlandırabileceğimiz bu dönem aslında Yeni Nesil Dizilimlemenin ilk versiyonlarının ortaya çıkmasına zemin sağladı. Roche 454'ün geliştirdiği mikro kuyucuklu teknoloji, 500 kat daha hızlı ve 50 kat daha ucuz bir dizilimleme sunarak Yeni Nesil Dizilimleme çağını açtı. Yine de bu denli hız ve maliyet iyileşmesi dahi araştırmacıların isteklerini karşılamakta yetersiz kaldı ve alternatif yaklaşımlar geliştirilmeye başladı. Bu yaklaşımlardan yazı dizisinin 3. yazısında bahsetmeyi planlıyorum, fakat öncesinde, kendisinden pek bahsedilmeyen ancak bugünkü yaklaşımların oluşmasında temel rol oynayan başka bir yöntemden, SAGE yönteminden bahsedeceğim bir sonraki yazımda. 


Sözün Özü:
DNA'nın kalıtımsal özelliğinin keşfinden sonra gözler DNA'nın hızlı, ucuz ve güvenilir bir şekilde dizilimlenmesine [sekanslama | sequencing] odaklandı. Uzun bir süre Sanger yöntemi yaygın olarak kullanıldı ve Yeni Nesil Dizilimleme [Yeni Nesil Sekanslama | Next Generation Sequencing] çağına büyük bir ilham kaynağı oldu.



Proje:
Sanger dizilimlemeye ilişkin Wikipedia makalesinin son kısmında, mevcut dizilimleme teknolojilerine ait dizilimleme kapasitelerinin biraz eskimiş bir özetini göreceksiniz. Bu tabloya göre, bir insan genomunu (3 milyar baz) kılcal [kapiler | capillary] elektroforez yöntemiyle kaç günde dizilimleyebilirsiniz?

Meraklısına:
Yazımın başında verdiğim ulaşım örneğini birebir deneyimlemek isterseniz, Cities in Motion 2 isimli toplu taşıma planlama oyununu denemenizi öneririm. Eğlenceli bir strateji ve ulaşım planlama oyunu.