DeepMind’ın Yapay Zekası AlphaFold ile Biyoloji Biliminin 50 Yıllık Problemi Çözüldü

Google tarafından 2014 yılında satın alınan DeepMind Technologies ilk kurulduğundan bu yana ses getirdiği çalışmalarına bir yenisini ekledi. AlphaGo ve AlphaZero’dan sonra AlphaFold ile yapay zekanın veri işleme gücüne dayanan yeni bir çözümle karşımıza çıktı.





AlphaFold programı, Critical Assessment of Structure Prediction'ın kısaltması olan CASP adlı iki yılda bir yapılan protein yapısı tahmin yarışmasında 30 Kasım 2020 sonuçlarına göre yaklaşık 100 diğer takımdan daha iyi performans gösterdi. Özetle söylemek gerekirse AlphaFold proteinlerin üç boyutlu yapısını, sadece proteinin hangi aminoasitlerden oluştuğunu bilgisini alarak tahmin ediyor ve doğruluk oran %90 gibi yüksek bir seviyeye yaklaşmış durumda. Böylece keşfedilen her yeni proteinin üç boyutlu yapısı hızlı bir şekilde bulunarak ne gibi işlevlere sahip olduğu araştırılabiliyor. Her yıl neredeyse 30 milyondan fazla yeni proteinin keşfedildiği bir dünyada bizi çok hızlandıracak olan bir gelişme bu.




Proteinler ne işe yarar?


Protein dediğimiz zaman vücudumuzda gerçekleşen neredeyse her kimyasal olayın temelindeki maddelerden bahsetmiş oluruz. Tüm yaşam için gerekli olan büyük, karmaşık moleküllerdir. Vücudumuzun gerçekleştirdiği neredeyse her işlev - kasları kasmak, ışığı algılamak veya yiyecekleri enerjiye dönüştürmek - proteinlere ve bunların nasıl hareket edip değiştiğine bağlıdır.


Proteinler 20 çeşit amino asidin farklı sayılarda uç uca eklenerek bir zincir gibi birleşmesiyle oluşur. İşte bu sırada her amino asidin kendi kimyasal yapısından kaynaklanan ara bağlantılar oluşur ve bu da zincirin kendi etrafında bükülmelere yol açar. Bükülmeler sonucu oluşan üç boyutlu yapı biyoloji için çok önemlidir çünkü proteinin organizmada hangi görevleri üstleneceğini belirler. Bir proteinin şekli, işlevi ile yakından bağlantılıdır ve bu yapıyı tahmin etme yeteneği, ne yaptığı ve nasıl çalıştığı konusunda daha iyi bir anlayışın kilidini açar. Örneğin, bağışıklık sistemlerimiz tarafından kullanılan antikor proteinleri "Y şeklindedir" ve her antijen için benzersiz kancalar oluşturur. Virüslere ve bakterilere tutunarak, bu antikor proteinleri hastalığı saptayabilir ve etiketleyebilir - bu da mikroorganizmaların ortadan kaldırılmasına neden olur.





'Yaklaşık 50 yıldır proteinlerin nasıl katlanacağı sorusuna takılıp kaldık. DeepMind'ın bunun için bir çözüm ürettiğini görmek, bu sorun üzerinde çok uzun süre kişisel olarak çalışmış ve pek çok kere durup yeniden başlamış biri olarak oraya varabileceğimizi merak etmek çok

özel bir an'


PROFESSOR JOHN MOULT

MARYLAN ÜNİVERSİTESİ, CASP ORTAK KURUCU VE BAŞKANI

Protein katlama sorunu


Proteinlerin hangi şekillerde katlandığını anlamak, "protein katlanma sorunu" olarak bilinir ve son 50 yıldır biyolojide büyük bir zorluk olarak durmaktadır. Bilim insanları her yeni protein keşfinde aradaki bağlantılardan yola çıkarak bu işlemi yapmaya çalışır ve üç boyutlu şekli tam olarak ortaya çıkarmak için uğraşır. Ardından işlevlerini tahmin eder ve olası ilaçları geliştirmeye başlar. Ancak görünen o ki teknolojideki gelişmelerin ardından yapay zeka derin öğrenmesi ile buna harcanan zaman ve para oldukça azalacak.


Bizim için hayati öneme sahip proteinlerin üretimi hücrelerimizin çekirdeğinde bulunan DNA kodlarımızın okunması sayesinde olur. Transkripsiyon ve translasyon işlemlerinden sonra protein özelleşerek işlev göreceği yere gider. İşte DNA'da meydana gelebilecek herhangi bir hasar proteinlerin yapısını değiştirir veya hiç üretilememesine neden olursa genetik hastalıklar ortaya çıkar. Ancak proteinlerin şeklini bilebilmek için DNA kodlarını bilmek yeterli değildir. Yukarıda da bahsettiğim gibi proteini oluşturan amino asitlerin kimyasal yapısından kaynaklanan etkileşimleri tahmin ederek üç boyutlu yapı ortaya çıkarılmalıdır. Ancak proteinlerin büyüdükçe bunu yapmak zorlaşır çünkü hesaba katılması gereken daha çok etkileşim vardır. Bu işlem vücudumuzun içinde milisaniyeler içinde meydana gelirken bizim bunu sadece sekansın sıralamasına bakarak anlamamız ve olası tüm konfigürasyonları ortaya çıkarmamız Cyrus Levinthal'in hesaplamalarına göre bilinen evrenin yaşından daha uzun sürer (Levinthal’s paradox.)




Christian Anfinsen, 1972 Nobel Kimya Ödülü için yaptığı kabul konuşmasında proteinin şeklini belirlemek için amino asit sekansının bilinmesi gerektiğini hipotez olarak sunduktan sonra bilim dünyası da çalışmalara başladı. Son elli yılda, araştırmacılar, kriyo-elektron mikroskobu, nükleer manyetik rezonans ve X-ışını kristalografisi gibi deneysel teknikleri kullanarak laboratuvarlarda proteinlerin şekillerini belirleyebildiler, ancak her yöntem çok sayıda deneme yanılmaya dayanıyordu ve protein yapısı başına onlarca veya yüz binlerce dolara mal oluyordu. Bu nedenle biyologlar, zor proteinler için bu uzun ve zahmetli sürece alternatif olarak yapay zeka ve derin öğrenme yöntemlerine yönelmeye başladı. Bir proteinin şeklini, maliyetli deneylerle belirlemek yerine, yalnızca genetik kodundan hesaplamalı olarak tahmin etme yeteneği, araştırmayı hızlandırmaya yardımcı olabilirdi.


DeepMind'ın yapay zeka yaklaşımı bu sorunu çözmek için devreye girdi ve CASP yarışmasına ikinci kez katıldığında bunu başardığını herkese göstermiş oldu. Geliştirdikleri derin öğrenme mekanizması, protein veri bankasındaki yaklaşık 170.000 bilinen protein kullanılarak eğitiliyor. Ardından derin sinir ağı bu bilinen proteinlerden çıkarımlar yaparak kendisine verilen sekansları tanımlamaya çalışıyor. Ayrıca tanımladığı proteinlerin kendi içinde de hangi kısımların ne kadar doğruluk içerdiğini tahmin edebiliyor.



AlphaFold'un sahip olduğu potansiyeli görmemek imkansız. Ben de sağlık alanındaki gelişmeleri yakından takip eden biri olarak ülkemizin de bunun gibi çalışmalara dahil olması gerektiğini düşünüyorum. Gördüğümüz gelişme sadece bir bilim alanına dayalı gerçekleşmiyor. Birden çok bilim dalının - biyoloji, matematik, istatistik, yazılım vb. - ortaklaşa yürüttüğü ve her birindeki en son gelişmelerden yararlanılarak bu başarı yakalanıyor. Dolayısıyla burada da bilimde ortaklığın her alanda gerekliliğini ve önemini görmüş oluyoruz.


Derin öğrenme ile geldiğimiz bu nokta elbette son durak değil. Her gün artan sayıda gelişmeyle bizi çepeçevre saran teknoloji gittikçe daha iyi hale gelecek ve diğer bilimleri de kendi etrafında geliştirmeye devam edecek. Olası sonuçlar protein katlanmasının yüzde yüz doğrulukla tahmin edilebilmesi ve ilaçların kişiye özel daha hızlı üretimi. Ayrıca hayatın evrendeki yolculuğunu belirlemede de bize yeni bakış açıları katacağı kesin.


KAYNAKÇA

https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery


https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology


https://www.nature.com/articles/d41586-020-03348-4


https://en.wikipedia.org/wiki/Levinthal%27s_paradox


GÖRSELLER


https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery


https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology







100 views0 comments

Recent Posts

See All

İŞ YERİNİZDEKİ TEHLİKE: BİYOLOJİK AJANLAR

Biyolojik ajanlar insanları, hayvanları ve bitkileri öldüren veya hastalanmalarına sebep olan organizmalar ya da bu organizmaların ürettiği zehirli maddeler (toksinler) dir. Bu ajanların çoğu zararsız