F. Şeyma Gökdemir
Biyoinformatiğin Zaman Makinası
Yıl 1970… Hesper ve Hogeweg bir gün Hollanda’nın göz kamaştırıcı yel değirmenlerini gören bir laboratuvarda canlıların yaşam süreçlerinde nasıl bir bilişimsel süreç vardır diye tartışırken “biyoinformatik” diye bir terim ortaya attılar. Bu terim bilim dünyasında bir metafor oluşturdu. Zamanının bilim adamları, Biyofizik ve Biyokimya’ya ek olarak Biyoinformatiğin de bir araştırma alanı olacağına inandılar. Teorik olarak yığılma gösteren bilgi işlenmeli ve farklı bilimlerden destek alarak, gelişmeliydi. Birkaç kafadar, canlıya ait, genomik ve proteomik verilerinin matematiksel gelişim modelleriyle düzenlenmesi gerektiğini savundu. Stuart Kaufman da oradaydı. Ağ biyolojisi olarak tanımlanan büyük ölçekli transkripsiyon düzenleme kavramını ortaya koyarak Boolean Ağları olarak adlandırılan bir çalışma sundu. Bu süreç Huang, Ingber ve birkaç bilim insanının deneysel moleküler biyolojinin temelindeki matematiksel modellemeyi tanıtmaları ve 2773 genin gen ifade verilerinin belirlenmesiyle geleceğe dair sağlam bir bilim alanı oluşturulmasına destek oldular.
O sıralarda, John Maynard Smith Utrecht'te bir konferans verdi ve evrimsel biyoloji açısından Turing'in gelişimsel biyolojiye göre meydan okumasına benzer bir meydan okuma ortaya koydu. Evrimsel modeller esas olarak mutant istilası ve değişen alel frekansları ile ilgilenirken, evrimin karmaşık organizmalara nasıl yol açtığı sorusu ele alınmadı. Maynard Smith'in ifade ettiği gibi: “İyi evrim biyologları olarak yılda bir kez hayvanat bahçesine gitmeli ve filleri ziyaret etmeliyiz. Onları selamlamalı ve 'Sevgili Filler, sizin rastgele mutasyona uğradığınıza inanıyorum' demeliyiz”. dedi. Burada dikkat çekilen anektod; "Yapıcı evrimsel biyoloji" sorununu çözümlemek ve öngörülen şekliyle biyoinformatiğin uzun vadeli hedeflerini belirlemek gerekliliğiydi.

O zamanlar moleküler biyoloji, büyük ölçüde "veri odaklı" bir bilim değildi, çünkü devasa sekans projeleri henüz ortaya çıkmaya başlamamıştı. Aslında, veri odaklı bilim hem moleküler biyolojide hem de teorik biyolojide küçümsenmişti. Bununla birlikte, biyoloji, ekoloji ve taksonominin daha geleneksel kısımlarında veriye dayalı araştırmalar yapılıyordu. Hindistan, Çekoslovakya ve Hollanda'daki su bitkileri ile ilgili bir veri toplama anketinin sonuçlarına göre Ekolojideki örüntü analizi "sayısal taksonomi" olarak tanıtılmıştı. Modelleme ve örüntü analizi ayrı çabalar olarak görülse de biyoinformatik araştırma için bunların her ikisine de ihtiyaç duyulduğunu ve birleştirilmesi gerektiğini aşikardı.

Aslında, biyoinformatikte şu anda kullanılan temel model analizi yöntemlerinin birçoğuna 1960'larda öncülük edildi. Dayhoff'un protein dizileri ve yapılarının yıllık basılmış atlasları aracılığıyla protein dizilerini kullanılabilir hale getirme çalışması dikkate değer bir istisnaydı. 1970'lerde ve 1980'lerde, sadece desen analizi yöntemleri geliştirilmedi, aynı zamanda yeni modelleme formalizmleri de aktif olarak araştırıldı. Doğrusal olmayan sistemler, bilgisayar modellemesi nedeniyle analiz edilebilir hale gelmeye başladı ve yeni gelişmeler, örneğin faz düz analizi, çatallanma diyagramları ve deterministik kaos biyolojik uygulamalarla ilişkilendirildi. 1982'de ilk Avrupa Moleküler Biyoloji Laboratuvarı sekans kasetinin teslim edilmesindeki heyecan bambaşkaydı. Dayhoff atlaslarından gelen verilerin yazılması, birçok hizalanmış sekans sağlamasına rağmen, külfetli bir işti. Ama bu biriken veri "karmaşasıyla" ne yapmak gerekirdi? Sırf eğlence olsun diye, türleri nükleotid ve dinükleotid içeriğine göre gruplamak gerekirdi. Şaşırtıcı bir biçimde, doğruya yakın bir sınıflandırma ortaya çıktı! Bu durumda çoklu hizalama yöntemlerini geliştiren bir metaforun daha kapılarını açtı. Sekans verilerinin üssel olarak artmasıyla desteklenen biyoinformatik terimi, 1980'lerin sonlarında Dünya genelinde ana akım haline geldi ve sekans verilerinin veri yönetimi ve veri analizi, protein yapısı belirleme, homoloji tabanlı fonksiyon tahmini için hesaplama yöntemlerinin geliştirilmesi ve kullanılması biyoinformatiğin odak noktası oldu.
İnsan genomununda dahil olduğu, tamamen dizilenmiş genom setleri genişledikçe “omik” verileri biyoinformatiğe karşılaştırmalı bir araştırma boyutu ekledi. Organizmalar artık sadece bir "gen veya protein torbası" değil, aynı zamanda bir "transkriptom torbası", "bir interaktom torbası" ve "bir metabolom torbası" idi. Bu çeşitli verileri entegre etmek, kelimenin tam anlamıyla biyoenformatik için harika bir fırsat oluşturdu!
Einstein'ın “modeller olabildiğince basit olmalı ama daha fazla olmamalıdır” sözünden yola çıkarak, sistem biyolojisinin incelediği karmaşık canlı sistemlerin aslında hücreden, ekosistem modellemesine kadar her süreçte kullanılabileceği ve bugün gelinen noktanın aslında biyoinformatiğin sonu değil, aksine sonun (ya da Sonsuzun) başlangıcı olduğuna dair bir metafor daha oluşturmuştur. Einstain’ın her ne kadar modelleme yorumu temelde biyoinformatik teknolojilerin gelişimiyle ters düşse de izafiyet teorisine göre IV. Boyutu da içine alabilen evrende her şeyin mümkün olabileceğini bize söylemektedir.
Dr. F. Şeyma GÖKDEMİR