Google DeepMind, genom araştırmalarında ezber bozan yeni yapay zeka modelini duyurdu: AlphaGenome. Genetik dizilerin düzenleyici işlevlerini analiz edebilen bu model, yalnızca protein kodlayan genleri değil, yıllardır “çöp DNA” olarak anılan kodlamayan bölgeleri de yüksek doğrulukla okuyabiliyor. Üstelik AlphaGenome’un araştırma amaçlı API erişimi ve GitHub üzerinden yayınlanan dokümantasyonu sayesinde bu teknoloji artık sadece dev laboratuvarlara değil, tüm bilim dünyasına açık.
Kodlamayan DNA’yı anlamak artık mümkün
İnsan DNA’sının %90’ından fazlası doğrudan protein üretiminde rol oynamadığı için bu bölgeler uzun süre “işlevsiz” kabul edildi. Ancak bilim dünyası artık bu parçaların genlerin ne zaman ve nasıl çalışacağını düzenleyen anahtar mekanizmaları barındırdığını biliyor. Bu bölgelerin analizi, genetik hastalıkların nedenlerini anlamak ve kişiselleştirilmiş tıp uygulamaları geliştirmek açısından kritik önemde. AlphaGenome, işte bu “karanlık madde”yi gün yüzüne çıkarıyor.
AlphaGenome, 1 milyon baz çiftine kadar olan DNA dizilerini analiz edebiliyor. Sadece 450 milyon parametreye sahip hafif U-Net tarzı mimarisiyle yüksek çözünürlüklü genom tahminleri üretiyor. Model; RNA-seq, CAGE, alternatif eksonlama, DNase duyarlılığı, histon modifikasyonları ve 3D kromatin haritaları gibi birçok çıktıyı aynı anda sunabiliyor.
Bu çok yönlülük, gen ekspresyonunun yanı sıra DNA’nın yapısal düzenini ve epigenetik etkilerini de analiz etmeyi mümkün kılıyor. Eğitim sürecinde ENCODE, GTEx, FANTOM5 gibi büyük genom veri setleri kullanıldı. Model, Google’ın özel TPU’larıyla yalnızca 4 saatte eğitildi ve bu süreçte önceki model Enformer’ın yarısı kadar işlem gücü harcadı.
Rekor başarı: 50 testin 46’sında zirvede
AlphaGenome, 24 dizilim tahmin testinden 22’sinde ve varyant etkisi tahmin testlerinin 26’sından 24’ünde mevcut en iyi modelleri geride bıraktı. Bu model sayesinde bilim insanları, genetik mutasyonların hastalık riski üzerindeki etkilerini saniyeler içinde analiz edebiliyor.
Özellikle kodlamayan bölgelerdeki varyantların etkilerini öngörmek, nadir hastalıkların tanısı ve tedavi geliştirme süreci için büyük potansiyel taşıyor.
DeepMind, AlphaGenome’u ticari olmayan araştırmalar için bir API aracılığıyla erişime açtı. Araştırmacılar, bu aracı kullanarak insan ya da farklı canlı türlerine ait genomları analiz edebiliyor, çıktıları yorumlayabiliyor ve geri bildirim sağlayabiliyor. Şu an için kaynak kod tam anlamıyla açık değil, ancak ilerleyen dönemde tam açık kaynak paylaşımı planlanıyor.
Genom bilimi yapay zekayla yeniden şekilleniyor
AlphaGenome, yalnızca genetik dizilimleri analiz etmekle kalmıyor; aynı zamanda biyolojik işleyişin “dili”ni çözüyor. Tıpkı doğal dil işleme modellerinin metin üretmesi gibi, AlphaGenome da DNA’nın gramerini analiz ediyor.
Bu yaklaşım, protein üretiminden gen düzenlemesine, hatta yaşlanma karşıtı tedavilere kadar pek çok alanda devrim yaratabilir. NVIDIA’nın GenSLMs modeliyle pandemi takibi ve mutasyon öngörüsü ya da Ankh gibi protein sentezi modelleri, yapay zekanın yaşam bilimlerindeki etkisini daha da derinleştiriyor.