Ara
Türk Lirası
Türkçe
Geri Dön

Yaşamın İşçilerini Kodlardan Okumak: Biyoinformatikte Protein Analizleri, Veri Tabanları ve 3B Yapısal Çözümlemeler

Yaşamın İşçilerini Kodlardan Okumak: Biyoinformatikte Protein Analizleri, Veri Tabanları ve 3B Yapısal Çözümlemeler

Modern moleküler biyolojinin en temel yasası olan Central Dogma (Merkezi Dogma), genetik bilginin DNA'dan RNA'ya ve oradan da proteine doğru tek yönlü akışını tanımlar.

Getty Images

Son 20 yılda Yeni Nesil Dizileme (NGS) teknolojilerinin ucuzlamasıyla, DNA ve RNA seviyesindeki veriler (Genomik ve Transkriptomik) muazzam bir hızla büyüdü. Ancak bir organizmanın fenotipini, hastalıklarını ve metabolizmasını belirleyen nihai aktörler proteinlerdir (Proteomik). DNA sadece bir kullanım kılavuzudur; hücre içindeki kimyasal reaksiyonları katalize eden (enzimler), sinyalleri ileten (hormonlar, reseptörler) ve yapısal iskeleti oluşturan unsurlar proteinlerin ta kendisidir.

Bu makalede, bir amino asit dizilimini bilgisayar ekranında (in silico) anlamlandırmak için kullanılan yapısal biyoinformatik araçlarını, evrimsel korunum stratejilerini ve devasa protein veri tabanlarının (UniProt, PDB, InterPro) analitik entegrasyonunu akademik bir derinlikle inceliyoruz.

1. Yapı = Fonksiyon: Biyokimyanın Altın Kuralı

Biyoinformatik analizlere geçmeden önce proteinlerin doğasını anlamak gerekir. Bir proteinin biyolojik işlevi, onun üç boyutlu (3B) uzayda nasıl katlandığına (folding) doğrudan bağlıdır. Bu katlanma rastgele değildir; termodinamik yasalar ve amino asitlerin yan zincirlerinin (R grupları) kimyasal özellikleri (hidrofobik, hidrofilik, asidik, bazik) tarafından belirlenir.

Shutterstock

  • Primer Yapı: Amino asitlerin diziliş sırası (FASTA formatındaki tek boyutlu harfler).

  • Sekonder Yapı: Hidrojen bağlarıyla oluşan lokal katlanmalar (Alfa-sarmal, Beta-kırma).

  • Tersiyer Yapı: Tüm zincirin 3 boyutlu, fonksiyonel uzaysal formu (Disülfit köprüleri, hidrofobik etkileşimler).

  • Kuarterner Yapı: Birden fazla protein alt biriminin (subunit) bir araya gelmesi (Örn: Hemoglobin).

Biyoinformatiğin en büyük "Kutsal Kasesi", sadece primer diziye (1B) bakarak, proteinin tersiyer yapısını (3B) ve dolayısıyla fonksiyonunu tahmin edebilmektir (Protein Folding Problem). Günümüzde AlphaFold gibi yapay zeka algoritmaları bu alanda çığır açsa da, temel veri tabanı analizleri halen araştırmaların omurgasıdır.

2. BLASTp ile Homoloji Taraması: Evrimin İzleri

Elinizde DNA'dan çevrilmiş (translate edilmiş) bilinmeyen bir amino asit dizilimi (query) var. İlk adım, bu proteinin dünyadaki bilinen diğer proteinlere ne kadar benzediğini bulmaktır. Burada devreye BLASTp (Protein BLAST) girer.

BLASTp, amino asit dizilimlerini milyonlarca proteinin bulunduğu veri tabanlarında (NCBI nr database) tarar. Ancak nükleotid BLAST'ından (BLASTn) çok daha karmaşıktır. Çünkü DNA'da sadece 4 harf varken, proteinlerde 20 farklı amino asit vardır. Üstelik bir amino asit mutasyona uğrayıp diğerine dönüştüğünde, eğer ikisinin kimyasal özelliği aynıysa (Örn: Lösin ve İzolösin), proteinin fonksiyonu bozulmaz (Konservatif Mutasyon). BLASTp, bu eşleşmeleri yaparken BLOSUM veya PAM gibi skoring matrisleri kullanarak evrimsel akrabalığı istatistiksel olarak (E-value) hesaplar.

3. UniProt: Proteinlerin Evrensel Ansiklopedisi

Eğer NCBI GenBank DNA'nın kütüphanesiyse, UniProt (Universal Protein Resource) proteinlerin kütüphanesidir. UniProt, iki ana bölümden oluşur:

  • Swiss-Prot: İnsan eliyle (uzman küratörler tarafından) incelenmiş, onaylanmış ve literatür bilgileriyle zenginleştirilmiş, altın standart veri tabanıdır. Hata payı neredeyse sıfırdır.

  • TrEMBL: Algoritmalar tarafından otomatik olarak DNA'dan çevrilmiş, henüz insan gözüyle doğrulanmamış devasa veri havuzudur.

Bir proteinin UniProt sayfasına girdiğinizde; onun hangi metabolik yolağa (pathway) ait olduğunu, hücresel lokasyonunu (çekirdekte mi, membranda mı?), post-translasyonel modifikasyonlarını (fosforilasyon, glikozilasyon bölgeleri) ve ilgili tüm bilimsel makaleleri tek bir ekranda görebilirsiniz.

4. Fonksiyonun Şifresi: Domainler ve Motifler (InterPro & CDD)

Evrim sürecinde, proteinlerin bazı bölgeleri mutasyonlara karşı inanılmaz derecede dirençlidir (Korunumlu - Conserved). Bu bölgeler, proteinin "iş yapan" kısımlarıdır (Örn: ATP'nin bağlandığı cep veya DNA'ya tutunan bölge). Bu fonksiyonel ve bağımsız katlanan yapı taşlarına "Domain" denir.

Bilinmeyen bir proteinin fonksiyonunu tahmin etmenin en güvenilir yolu, içerdiği domainleri bulmaktır.

  • CDD (Conserved Domain Database): NCBI'nin sunduğu bu araç, diziliminizi bilinen domain modelleriyle (PSSM) karşılaştırarak proteinin ait olduğu aileyi belirler.

  • InterPro: Pfam, PRINTS, PROSITE gibi dünyanın en büyük domain ve motif veri tabanlarını tek bir çatıda birleştiren devasa bir konsorsiyumdur. Diziliminizi InterProScan'e verdiğinizde, size proteinin biyokimyasal parmak izini çıkarır.

5. 3B Uzayda Gezinmek: RCSB Protein Data Bank (PDB)

Eğer bir proteini hedef alan bir ilaç tasarlamak istiyorsanız (Molecular Docking), onun 3B yapısını atomik çözünürlükte bilmek zorundasınız. RCSB PDB (Protein Data Bank), X-ışını kristalografisi, NMR spektroskopisi ve Kriyojenik Elektron Mikroskobu (Cryo-EM) ile yapısı çözülmüş 200.000'den fazla makromolekülün bulunduğu evrensel bir arşivdir.

PDB veri tabanından indirilen .pdb uzantılı dosyalar, aslında her bir atomun X, Y, Z uzaysal koordinatlarını içeren metin dosyalarıdır. Bu dosyalar PyMOL, Chimera veya VMD gibi görselleştirme programlarında açılarak proteinin yüzey topolojisi, ilaç bağlanma cepleri (binding pockets) ve elektrostatik potansiyelleri incelenir.

Sonuç ve Uygulamalı Entegrasyon

Biyoinformatikte gerçek güç, bu araçları tek tek bilmekte değil, hepsini mantıksal bir iş akışında (pipeline) birleştirebilmektedir. Bilinmeyen bir dizi (FASTA) -> BLASTp (Homoloji) -> InterPro (Domain Analizi) -> UniProt (Literatür) -> PDB (3B Modelleme) şeklindeki bir senaryo, modern Ar-Ge'nin standart prosedürüdür.

Lab Akademi Web Semineri Aboneliği kapsamındaki bu eğitimle, yaşamın yapı taşlarını dijital olarak analiz etme becerisi kazanacak ve "Kuru Laboratuvarın" (Dry Lab) sınırsız potansiyelini keşfedeceksiniz.

👉 Protein Dünyasının Şifrelerini Çözmek İçin Kayıt Olun.

Yorumlar
Yorumunuzu bırakın Kapat