10 Nisan 2017 Pazartesi

Yeni Nesil Sekanslama Temel Veri Analizi - 4

Yoğun geçen birkaç haftadan sonra tekrar merhaba. Son yazımızda elimizdeki veriden adaptörleri çıkarmış ve her bir okumadan kaçar tane olduğunu hesaplamıştık. Bu yazıda birkaç ufak temizliğin ardından elimizdeki okumaları nihayet kullanılabilir bir FASTA formatına dönüştüreceğiz, böylece bir sonraki yazımızda bu verileri C. elegans genomuna hizalayıp üzerinden biyolojik çıkarımlar yapabileceğimiz bir veriye sahip olabileceğiz.

Geçen yazıda bir şeyin dikkatinizi çektiğini tahmin ediyorum: ACTG istisnasız her okumanın başında yer alıyor. Yeni Nesil Sekanslama'nın en tatsız taraflarından biri, teknolojinin göreceli olarak yeniliğinden ötürü zaman içerisinde standartların birçok kez değişmesi. Bu nedenle birkaç yıl geriye gittiğinizde bile farklı uygulamalarla karşılaşabiliyorsunuz. Üzerinde çalıştığımız bu dosya, aslında ana projeye ait olan ve çok daha büyük bir dosya grubunun sadece bir parçası: Burada bahsettiğim uygulamaları kolaylıkla ve kısa sürede gerçekleştirebilmek adına ufak bir dosyayla çalışmayı tercih ettim. Bu çalışmada birden fazla örnek aynı anda sekanslandığı için her bir örnek bir barkod ile işaretlenmiş, yani her bir okumanın başına bu barkod deneysel olarak eklenerek sekanslama öyle gerçekleştirilmiş. Bu dosyada kullanılan barkod da karşımıza ACTG olarak çıkıyor. Daha güncel veya farklı konfigürasyonlarda genelde barkod FASTQ dosyasında @ ile başlayan tanımlama satırlarda yer alabiliyor, birden fazla örnek içeren çalışmalarda bu tarz farklılıklara dikkat etmek önem arzediyor.

6 Mart 2017 Pazartesi

Yeni Nesil Sekanslama Temel Veri Analizi - 3

Geçen yazıda elimizdeki ham verilerdeki adaptörleri temizleyip gerçek okumaları elde etmeyi başarmıştık, fakat ortalığı da biraz dağıtmıştık. Sadece ara aşamalarda kullandığımız ve son aşamada artık ihtiyaç duymadığımız dosyaları ya silebiliriz, ya da bu süreçli ardarda bağlayarak her bir aşamadan elde ettiğimiz çıktıyı doğrudan sonraki aşamaya gönderebiliriz. UNIX dünyasında bu yaklaşıma Pipeline adı veriliyor, Türkçe'ye boru programlama veya boru haberleşme şeklinde çevrilmiş. Bilgisayarda kayıtlı dosyaları birer depo olarak düşünelim, depolardan sıvı çekip bu sıvıları işleyen veya diğer bir deyişle dosyalardan veri çekip bu veriler üzerinden işlem yapan programları da birer işleme tesisi olarak hayal edelim. Bu benzetme üzerinden gidelim: şimdiye kadar yaptığımız şey FASTQ depolarından bilgiyi satır satır alıp işleyen programlar kullanıp, işlenmiş verileri tekrar depolara, veya dosyalara kaydetmekti. Artık aradaki depolardan kurtulup işleme tesisleri doğrudan birbirine bağlayabiliriz: Böylece hem aradaki dosyalardan kurtulur, hem de yaptığımız işlemleri daha derli toplu olarak kaydedebiliriz.

28 Şubat 2017 Salı

ABD İzlenimlerim - 3

ABD'ye ilişkin izlenimlerimi birinci ve ikinci yazılarımda paylaşmaya başlamıştım, bu yazıda ise diğer bir tespitimi paylaşmak istiyorum. Yine yeri geldikçe gözlemlerimi bu başlık altında ilerleyen zamanlarda sizlere aktarmayı planlıyorum.

Bu arada, okuduğunu anlamakta zorlananlar için şunu da belirtmek istiyorum: ABD veya Türkiye'ye ilişkin genellemeler yaptığımda 100 kişinin tamamı bu genellemeye girmiyor. Ancak mesela ABD'de her yüz kişiden 70'i işini en iyi şekilde yapmaya çalışıyorsa, Türkiye'de bunun 10'un altında olduğunu tahmin ediyorum, bu nedenle iki durumu kıyasladığımda bir toplumun diğerinden bu konuda daha iyi olduğunu gözlemlemiş oluyorum.

Gelelim bahsetmek istediğim üçüncü gözlemime: burada insanlar gerçekten de uzmanlığa önem veriyor. Herkes her konunun uzmanı olmaya çalışmıyor, uzman olmadığı konuda bir şey bilmediğinde de gocunmuyor. Toplantılarda insanlar bilgilerini yarıştırıyorlar ve bilgisiz oldukları alanları ünvanlarıyla kapatmaya çalışmıyorlar. Aynı zamanda ünvanlarını karşı tarafın üzerinde bir baskı ve yönetim unsuru olarak da kullanmıyorlar. Bilgili oldukları durumlarda da bunu saklama ihtiyacı hissetmek bir kenara dursun, çatır çatır haklarını arıyorlar. İstisna durumlar ve istisna insanları bu genellemenin dışında tutuyorum.

23 Şubat 2017 Perşembe

Yeni Nesil Sekanslama Temel Veri Analizi - 2

Ufak bir uyarıyla başlayalım: YNS analizi karmaşık aşamalar içerir ancak çoğu zaman herhangi bir aşamanın tam olarak nasıl kullanılacağını bilmenizi gerektirmez. Bu nedenle bu ve sonraki yazıları okurken anlamadığınız bir kısım olursa tekrar okuyun, eğer yine de karışık geliyorsa sadece ilgili komutları çalıştırıp devam edin. Tüm süreci genel olarak anladığınızı düşündüğünüzde ilgili kısma tekrar göz atıp en azından ne amaçla kullanıldığını genel hatlarıyla anlamaya çalışın.

Yeni Nesil Sekanslama deneylerindeki en önemli aşamalardan birisi, kütüphane hazırlama aşamasıdır. Yaygın olarak kullanılan Illumina teknolojisinde sekanslanması amaçlanan DNA bölgesi -kullanılacak sarf malzemesinin özelliklerine göre- kısa DNA parçalarına bölünür ve iki ucuna adaptörler takılır. Adaptörler, sekanslanacak DNA parçasının sekanslama yüzeyindeki oligonükleotitlere hibridize olması için kullanılan ve dizilimi özel olarak belirlenen oligonükleotitlerdir. Kütüphane hazırlama aşaması tamamlandığında her bir DNA parçası aşağıdaki gibi bir yapıya kavuşur:


18 Şubat 2017 Cumartesi

Yeni Nesil Sekanslama Temel Veri Analizi - 1

Birçok Yeni Nesil Sekanslama (YNS) veri çeşidi mevcut ve her biri için farklı bir yaklaşım gerekiyor. Bu yazı dizisinde veriye ilişkin temel özellikleri anlamak üzere yapılabilecek çeşitli yöntemlerden bahsedeceğim. Her bir yazıda, farklı durumlara ve hatta çoğu zaman da biyolojik olmayan verilere de uygulanabilecek araçları tanıtıp örnekler vereceğim.

Biyoinformatik analizleri ve genel anlamda da veri analizini öğrenmek isteyenler UNIX işletim sistemlerini eninde sonunda öğrenmek zorunda kalıyor, eğer Windows kullanıcısı iseniz en kısa sürede bu işletim sistemlerine alışmanızı öneririm. Linux veya Mac OS X işletim sistemlerinden birini edinerek ya da bu işletim sistemlerine sahip -örneğin üniversitenizdeki- bilgisayarlarda yazılarımdaki analizleri gerçekleştirebilirsiniz. Uygulama için şu adresteki örnek FASTQ dosyasını kullanabilirsiniz: http://ahmetrasit.com/fastq/SRR1513652.fastq.gz

15 Şubat 2017 Çarşamba

ABD İzlenimlerim - 2

İlk yazımda ABD'de gözüme çarpan ilk anahtar kelimenin süreklilik olduğundan bahsetmiştim. Bahsetmeye değer bir sonraki kavram ise kişisel başarının her şeyin üzerinde olması.

İlk bakışta kulağa biraz farklı geliyor, öyle ya, ülkemizde kişisel başarıya gelene kadar çok daha önemli şeyler var. Hatta bir insanın kişisel olarak başarılı olması pratikte pek hoş karşılanan bir durum da değil. Örneğin hepimiz zengin olmak istiyoruz ama varlıklı bir insandan bahsederken bile o kişiyi hoş olmayan kelimelerle anıyoruz: "vay ***, gördün mü bindiği arabayı" gibi. Yıldızla sansürlediğim kısma konulabilecek ifadeler açısından çok zengin bir dilimiz var ve en basit imla kurallarında dahi dili kullanmaya özen göstermezken, bu tür durumlarda sınırları zorluyoruz. 

11 Şubat 2017 Cumartesi

ABD İzlenimlerim - 1

Bir süre önce 2006 Nobel Ödülü sahibi Craig Mello'nun grubunda kıdemlı biyoinformatik uzmanı olarak göreve başladım. Buraya ait izlenimlerimi mümkün olduğunca objektif bir şekilde sizlerle hayranlık ve nefret uçlarında gezinmeden paylaşmak istiyorum. Öküzün altında buzağı aramanın fazlasıyla yaygın olduğu ve başarısızlığın yeni başarı olarak tanımlandığı bir ortamdan böylesine prestijli bir yere geçmek bana çok iyi geldi, ve yazmaya bu vesileyle tekrar başlamak istedim. 

Çalıştığım merkez ABD'nin kuzey doğusunda yer alan Massachusetts eyaletinde, Worcester şehrinde yer alıyor. Ekonomik büyüklüğün bir ölçüsü olan gayrısafi yurtiçi hasıla açısından baktığımızda bulunduğum eyalet 6.8 milyon nüfusla 474 milyar dolarlık bir GSYH'ye sahipken; Türkiye'nin rakamlarına baktığımızda 80 milyonluk nüfusla 734 milyar dolarlık bir GSYH değeriyle karşılaşıyoruz. Bulunduğum bölge yaşam bilimlerinin silikon vadisi olarak adlandırılıyor, zaten eyaletin en büyük ekonomik unsurlarından birini biyoteknoloji oluşturuyor. Dünyanın en iyi üniversitelerinden MIT ve Harvard'ı da içeren ve Sarmaşık Ligi olarak adlandırılan 8 üniversitenin ortasında yer alıyor.

21 Ekim 2016 Cuma

Biyoinformatiğe Başka Bir Başlangıç - 1

Biyoinformatik öğrenmeye başladığım blogda yazmak artık işin iyice ciddileştiğini kabul etmemi sağladı :) Bu yüzden her şeyden önce, desteğini hiçbir zaman esirgemeyen Hocam Ahmet Raşit Öztürk’e teşekkür ederim.

11 Ekim 2016 Salı

Hedeflenmiş Yeni Nesil Sekanslama Yöntemleri

Yeni nesil sekanslama sistemleri araştırmacılara genomik, transkriptomik ve epigenomik alanlarında neredeyse aklına gelen bütün soruları sorabilecek yöntemler sunar. Yapılacak olan araştırmaya göre kütüphane hazırlama aşaması da oldukça değişmektedir. Genomik çalışmalarının en sık kullanılan yöntemlerinden biri de hedeflenmiş sekanslama (targeted sequencing)' dir. Bu yazımda ben de size bu yöntemden bahsedeceğim.

7 Ekim 2016 Cuma

Yeni Nesil Sekanslama Nedir? - 3 (Veri Analizinde İzlenen Adımlar)

Deney tasarımınızı yaptınız, örneklerinizden kütüphane hazırladınız ve cihaza yüklediniz. Şimdi sırada veriyi elde etme ve analiz var. Hazır kitlerle de çalışsanız, kendi protokolünüzü de geliştirseniz ortaya çıkan ham verinin [raw data] işlenerek analize hazır hale gelmesinde mutlaka izlenmesi gereken bazı adımlar var.

3 Ekim 2016 Pazartesi

Yeni Nesil Sekanslama Nedir? - 2 (Teknolojinin Arka Planı ve Kütüphane Hazırlama)

Yeni Nesil Sekanslama (YNS) teknolojisi diye adlandırdığımız şey aslında kendi içerisinde birçok farklı teknolojik yaklaşımı içeriyor, bunların neler olduklarından daha önce bahsetmiştim. Bu yazıda temel olarak YNS'nin çalışma prensiplerinden ve kütüphane hazırlama yöntemlerinden bahsedeceğim.

Sekanslama öncesi ilk yapmamız gereken şey organizmaların DNA'sını izole etmek. Maalesef henüz bu aşamayı ortadan kaldıran bir teknoloji yok. Ancak YNS için yapmamız gereken hazırlık bununla bitmiyor: genelde bu teknolojinin anlaşılması ve uygulaması en güç kısmı da burası. İzole edilen DNA'nın YNS cihazında kullanılabilmesi için geçmesi gereken bir dizi işleme kütüphane hazırlama [library preparation] deniyor.

29 Eylül 2016 Perşembe

Yeni Nesil Sekanslama Nedir? - 1 (Teknolojinin Potansiyeli)

Yeni Nesil Sekanslama'nın daha teknik detaylarından ve bu teknolojiyi ortaya çıkarakn süreçten bahsettiğim önceki yazılarıma şu bağlantılardan ulaşabilirsiniz:
YNS - Sanger
YNS - SAGE
YNS - Mevcut teknolojiler

Uzun bir aradan sonra hepinize merhaba. Yeni Nesil Sekanslama (YNS) [Next Generation Sequencing, NGS] günümüzdeki en güncel yüksek çıktılı [high-throughput] teknoloji. YNS teknolojisinin özü aslında birbirinden bağımsız yüz binlerce hatta milyonlarca sekanslamanın aynı anda aynı cihazda sınırlı bir süre içerisinde gerçekleştirilmesi. Bu teknolojide de gelişmeler öyle hızlı ki, şimdiden birkaç farklı versiyonu dünyada kullanılmaya başladı. Önce bu teknolojiyle neler yapılabildiğinden, ardından bu teknolojinin detaylarından, ve son olarak da bu teknoloji ile elde edilen verilerin nasıl analiz edilebileceğinden bahsetmeye çalışacağım.

Genomlar hakkında çok az şey biliyoruz. Genleri tarif yaklaşımımız bile aslında ne denli kısıtlı bilgiye sahip olduğumuzun bir göstergesi. Bunu sayısal olarak görmek isteyenler de https://genecards.weizmann.ac.il/v3/GIFtS.shtml adresindeki grafiği inceleyebilirler. Bu denli az şey bilmemizin bence en büyük nedeni, neyi aradığımızı bilmememiz.