21 - 23 Mayıs 2014 tarihleri arasında gerçekleştirilen 3. International Workshop on Translational Bioinformatics and Health Informatics etkinliği (http://wtbm.iyte.edu.tr/) kapsamında bir konuşma yapmak üzere İzmir'deydim. Doç. Dr. Jens Almer'in organize ettiği ve katılımcıların kayda değer bir kısmının Almanya'dan dahil oldukları etkinlik süresince sunumlar kadar kahve aralarında yapılan sohbetler de ilgi çekiciydi.
Yaptığım sunum veri görüntüleme üzerineydi. Birçok araştırmacı ileri düzey analizleri yapabilmesine rağmen bunları başkalarına aktarırken büyük zorluk çekiyor. Bu nedenle fonksiyonel, şık ve akıllıca görselleştirmeler büyük önem kazanıyor. Öyle ki, Ocak ayında Nature Methods dergisinde boxplot gibi basit bir grafik ve bunun için oluşturulan bir web aracı üzerine bir makale yayınlandı. Karmaşık, dinamik ve etkileşimli görselleştirme yöntemleri üzerine yaptığım sunumun ardından Almanya'da bir üniversitede kısa süreli bir ders verme teklifi dahi aldım.
Yaptığım sunum veri görüntüleme üzerineydi. Birçok araştırmacı ileri düzey analizleri yapabilmesine rağmen bunları başkalarına aktarırken büyük zorluk çekiyor. Bu nedenle fonksiyonel, şık ve akıllıca görselleştirmeler büyük önem kazanıyor. Öyle ki, Ocak ayında Nature Methods dergisinde boxplot gibi basit bir grafik ve bunun için oluşturulan bir web aracı üzerine bir makale yayınlandı. Karmaşık, dinamik ve etkileşimli görselleştirme yöntemleri üzerine yaptığım sunumun ardından Almanya'da bir üniversitede kısa süreli bir ders verme teklifi dahi aldım.
Kahve aralarında yapılan sohbetlerin birinde, biyoinformatiğin İngiltere'de stratejik alan olarak belirlenmiş olduğunu öğrendim. Gerçi İngiltere'nin 100.000 Genom Projesi ile büyük bir atağa kalktığını bilmeyen yok ve bu verilerin analizi için büyük bir insan ve bilgisayar altyapısına ihtiyaçları var. Deneysel altyapıyı sağlamak çok daha kolay, bu nedenle artık veri üretmek değil, bu veriyi analiz etmek çok daha büyük oranda önem kazanıyor. Veri üretebilen çok araştırmacı var, ancak analiz yapabilecek uzman sayısı ihtiyacın çok çok altında. Ayrıca, artık mikrodiziden de pek bahsedilmiyor, genom üzerine çalışan neredeyse herkesin odağı Yeni Nesil Dizilimleme (Next Generation Sequencing) teknolojisi. Bunun yanısıra Kütle Spektrometrisi (Mass Spectrometry) de birçok araştırmacının ilgi odağıydı, özellikle iKnife teknolojisinden bahsedilen sunum herkesin aklını başından aldı. Burada da yine önemli olan elde edilen verilerin analizi, yoksa bir şekilde veri üretebiliyorsunuz. Son olarak bahsetmek istediğim bir diğer konu ise etkinliğe katılan araştırmacıların bir şekilde makina öğrenmesi [machine learning] yöntemlerini kullanıyor olması. Katılımcıların büyük bir bölümünün mühendislik kökenli olması bunun temel nedeni. Makine öğrenmesi yöntemlerinin uygulama alanı çok geniş ve bence biyolojik bilimler kökenli araştırmacıların da makine öğrenmesi konusunda bilgi ve becerilerini arttırması büyük önem taşıyor. Aksi takdirde yapılan analizler basit istatistiksel yöntemlerin uygulanmasından öte gitmiyor.
Sözün Özü:
Veri görüntüleme, genom analizi ve makine öğrenmesi [machine learning] alanları bilgi ve beceri geliştirmek adına yatırım yapılması mantıklı alanlar olarak düşünülebilir.
Proje:
Son bir haftalık hava durumu bilgisini Excel'de farklı grafiklerle görüntüleme çalışın. Hangisi daha kolay algılanabilir, hangisi daha kafa karıştırıcı?
Meraklısına:
Sözün Özü:
Veri görüntüleme, genom analizi ve makine öğrenmesi [machine learning] alanları bilgi ve beceri geliştirmek adına yatırım yapılması mantıklı alanlar olarak düşünülebilir.
Proje:
Son bir haftalık hava durumu bilgisini Excel'de farklı grafiklerle görüntüleme çalışın. Hangisi daha kolay algılanabilir, hangisi daha kafa karıştırıcı?
Meraklısına:
Makine öğrenmesi alanında kendinizi geliştirmek istiyorsanız O'Reilly yayınlarına bir göz atmalısınız. Bildiğim kadarıyla bu tarzda güzel bir şekilde yazılmış Türkçe kitaplar bulunmuyor maalesef :(