Method Article
Bu protokolün amacı, açık kaynaklı yazılım kullanarak küçük moleküllü yapı kütüphanelerini verimli bir şekilde oluşturmak ve küratörlüğünü yapmaktır.
Moleküler yapıların kapsamlı bir şekilde üretilmesi, ilaç tasarımı, moleküler veritabanı yapımı, alternatif biyokimyaların araştırılması ve daha fazlası gibi çok sayıda kimyasal ve biyokimyasal uygulamaya sahiptir. Matematiksel olarak konuşursak, bunlar kimyasal kısıtlamaları olan grafik üreteçleridir. Sahada, şu anda en verimli jeneratör (MOLGEN), kullanımını sınırlayan ticari bir üründür. Buna alternatif olarak, başka bir moleküler yapı üreticisi olan MAYGEN, MOLGEN ile karşılaştırılabilir verimliliğe ve kullanıcıların yeni özellikler ekleyerek performansını artırma kapasitesine sahip yeni bir açık kaynaklı araçtır. Bu gelişmeden yararlanabilecek araştırma alanlarından biri de astrobiyoloji; Yapı üreteçleri, araştırmacıların deneysel verileri alternatif biyokimya için hesaplama olanaklarıyla desteklemelerini sağlar. Bu protokol, astrobiyolojide yapı üretimi için bir kullanım durumunu, yani alfa-amino asit kütüphanelerinin oluşturulması ve küratörlüğünü detaylandırır. Açık kaynaklı yapı jeneratörleri ve kimyasal bilişim araçları kullanılarak, burada açıklanan uygulamalar, herhangi bir araştırma sorusu için kimyasal yapı kütüphanelerinin düşük maliyetli oluşturulması ve küratörlüğü için astrobiyolojinin ötesinde uygulanabilir.
Moleküler yapı üretimi, kapsamlı grafik üretiminin genel probleminin pratik bir uygulaması olarak hizmet eder; Birkaç düğüm (atom) ve bağlantılarındaki kısıtlamalar (örneğin, değerler, bağ çoklukları, istenen / istenmeyen alt yapılar) göz önüne alındığında, kaç tane bağlı grafik (molekül) mümkündür? Yapı jeneratörleri, ilaç keşfi ve farmasötik geliştirmede, in siliko tarama için geniş yeni yapı kütüphaneleri oluşturabilecekleri kapsamlı bir uygulama görmüştür1.
İlk yapı üreteci CONGEN, organik kimyadaki ilk yapay zeka projesi DENDRAL2 (DENDRitic ALgorithm'in kısaltması) için geliştirilmiştir. Literatürde DENDRAL'ın çeşitli yazılım halefleri bildirilmiştir; ancak, hepsi bakımlı veya verimli değildi. Şu anda, MOLGEN3 son teknoloji moleküler yapı üretecidir. Ne yazık ki, çoğu potansiyel kullanıcı için kapalı kaynaklıdır ve bir lisans ücreti gerektirir. Bu nedenle, belirli uygulamalara kolayca uyum sağlayabilen verimli bir açık kaynaklı yapı üretecine ihtiyaç duyulmuştur. Verimli bir yapı üreteci için bir zorluk, kombinatoryal patlamayı yönetmektir; moleküler formülün boyutu arttıkça, kimyasal arama alanının boyutu katlanarak artar. Yakın tarihli bir gözden geçirme, moleküler yapı nesli4'ün tarihini ve zorluklarını daha da araştırıyor.
2021'den önce, Paralel Molekül Üreteci (PMG)5 en hızlı açık kaynaklı yapı üreteci idi, ancak yine de büyüklük sırasına göre MOLGEN'den daha yavaştı. MAYGEN 6, PMG'den yaklaşık 47 kat daha hızlı ve MOLGEN'den yaklaşık 3 kat daha yavaştır, bu daMAYGEN'i mevcut en hızlı ve en verimli açık kaynaklı yapı üreticisi haline getirir. Daha ayrıntılı karşılaştırmalar ve kıyaslama testleri, MAYGEN6'yı tanıtan makalede bulunabilir. Programın önemli bir özelliği, Schreier-Sims7 algoritmasına dayanan düzenli bir grafik oluşturma yöntemi olan kanonik yapılar için sözlüksel sıralama tabanlı testidir. Yazılım diğer projelere kolayca entegre edilebilir ve kullanıcıların ihtiyaçları için geliştirilebilir.
MOLGEN ve PMG gibi, MAYGEN de kullanıcı tanımlı bir moleküler formül alır ve bu formül için mümkün olan tüm yapıları üretir. Örneğin, bir kullanıcı MAYGEN'i C5H12 formülüyle çalıştırırsa, MAYGEN beş karbon atomu ve on iki hidrojen atomu içeren tüm olası yapıları üretecektir. Açık kaynaklı muadili PMG'nin aksine, MAYGEN, her elementin sayısı için ayrı sayılar yerine aralıklar kullanan "bulanık" moleküler formülleri de barındırabilir. Örneğin, bir kullanıcı MAYGEN'i C5-7H12-15 formülüyle çalıştırırsa, MAYGEN beş ila yedi karbon atomu ve on iki ila on beş hidrojen atomu içeren tüm olası yapıları üretecek ve çok çeşitli atomik bileşimlere sahip basit yapıların üretilmesine izin verecektir.
Astrobiyoloji, moleküler yapı jeneratörlerinden yararlanabilecek böyle bir alandır. Astrobiyolojide popüler bir konu, Dünya'daki tüm mevcut yaşam tarafından paylaşılan amino asit alfabesinin evrimidir. Son Evrensel Ortak Ata'nın (LUCA) tanımlayıcı özelliklerinden biri, protein yapımı için genetik olarak kodlanmış yirmi amino asit kullanılmasıdır 8,9. 10,11,12 gibi birden fazla alanda yapılan çalışmaların meta-analizlerine dayanarak, bu amino asitlerin yaklaşık 10'u (Gly, Ala, Val, Asp, Glu, Ser, Thr, Leu, Ile, Pro) abiyotik koşullar altında kolayca oluşur ve muhtemelen Luca öncesi organizmaların amino asit alfabesini oluşturur. Zamanla, bu "erken" alfabe, farklı yapısal ve işlevsel ihtiyaçlara cevap olarak genişletildi. Örneğin, Moosmann13'ün yakın tarihli bir incelemesi, genetik olarak kodlanmış amino asitlerin (yani Met, Tyr ve Trp) daha yeni üyelerinin eklenmesinin, reaktif oksijen türlerinin hücre içi çoğalmasını önleyerek oksijen bakımından zengin ortamlarda hayatta kalmaya izin verdiğini iddia ediyor.
Sürekli büyüyen bir analitik kimya teknikleri paketi, abiyotik koşullar altında oluşabilecek amino asit yapılarına dair fikir verir. Simkus ve diğerleri tarafından yapılan yakın tarihli bir inceleme14, meteorlardaki çok sayıda organik bileşiğin yanı sıra erken Dünya ortamlarının in vitro simülasyonlarından elde edilen organik bileşikleri tespit etmek için kullanılan yöntemleri detaylandırıyor15,16,17. Kimyasal yapıların sistematik olarak üretilmesi, araştırmacıların enstrümantasyon yoluyla tespit edilen organik bileşiklerin ötesini keşfetmelerine ve analitik kimya tarafından tanımlanan yapısal "adalar" etrafındaki yapısal alanı doldurmalarına olanak tanır. "Erken" amino asitler söz konusu olduğunda, bu sistematik yapı üretimi, araştırmayı abiyotik sentez koşulları altında deneysel olarak tespit edilen yapılarla sınırlamadan, erken yaşam için mevcut olan olası protein kimyalarını gösterir. Açık kaynaklı kimyasal bilişim araç setleri ve MAYGEN gibi verimli yapı üreteçleri ile yeni kimyasal yapı kütüphaneleri oluşturmak ve keşfetmek artık her zamankinden daha kolay ve yaşamın alternatif kimyalarına yönelik daha ayrıntılı araştırmalara rehberlik edebilir.
NOT: Protokolün özeti için Şekil 1'e ve kullanılan yazılımla ilgili ayrıntılar için Malzeme Tablosu'na bakın.
Şekil 1: Protokolün özet akış şeması. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
1. Yazılım ve dosya indirmeleri
NOT: Tüm programlar bireysel kullanım için ücretsizdir ve kişisel bilgisayarda çalıştırılabilir.
2. MAYGEN kullanarak yapı oluşturma
3. İstenmeyen alt yapılara sahip bileşikleri filtreleyin
4. (İsteğe bağlı) Ek yapı değişiklikleri
NOT: Bunlar bu örnekte gerçekleştirilmiştir, ancak diğer kütüphanelerin küratörlüğünü yapmak için gerekli olmayabilir.
5. Tanımlayıcı oluşturma
Kütüphane | Formül | Ek kısıtlamalar | "Erken" kodlanmış amino asitler | Oluşturma süresi (ms) | Yapı | ||||
İlk | Son | ||||||||
1 | Arjantin | C 2 H5NO2 | Gly altyapısını içerir | Arjantin | 192 | 84 | 1 | ||
2 | VAİL | Bilgisayar0-3 H 3-9 | Val, Ala, Ile, Leu | 172 | 70 | 22 | |||
3 | DEST | PC0-3O1-2 H 3-5 | Asp, Glu, Ser, Thr | 481 | 1928 | 254 | |||
4 | Lehinde | C 2-5 NO2H7-11 | N-meGly veya N-meAla altyapısını dahil et | Lehinde | 4035 | 79777 | 16 | ||
5 | VAIL_S | PSC0-2H3-7 | 122 | 65 | 31 | ||||
6 | DEST_S | PSC0-2 O 1-2H3 | 349 | 1075 | 79 | ||||
7 | Pro_S | C 2-4 SNO2H7-9 | N-meGly veya N-meAla altyapısını dahil et | 3999 | 75734 | 10 |
Tablo 1: Bu örnekte kullanılan bileşik kitaplıklar. 1-4 formüllerinden (Gly, VAIL, DEST ve Pro) oluşturulan kütüphaneler, "erken" kodlanmış amino asitler21'in daha önce yayınlanmış bulanık formüllerine dayanırken, 5-7 formüllerinden (VAIL_S, DEST_S ve Pro_S) oluşturulan kütüphaneler, karbon atomlarından birinin yerini alan iki değerli bir kükürt hayal eden formül 2-4'ün varyantlarına dayanmaktadır. Yapı sayımları, her formül ("İlk") için MAYGEN tarafından üretilen molekül sayısını ve istenmeyen alt yapılara sahip olanları filtreledikten sonra kalan molekül sayısını ("Son") yansıtır. Kısaltmalar: VAIL = valin, alanin, izolösin, lösin; DEST = aspartik asit, glutamik asit, serin, treonin; X_S = Divalent kükürt, X kütüphanesindeki karbonlardan birinin yerini alır; N-meX = N-metilX.
Yukarıdaki genel yöntemler, Meringer ve ark.21 Badlist yapıları aynı kaynaktan alındı ve alt yapısal kalıpları kolayca temsil etmek için SMARTS dizelerine dönüştürüldü. Bu örnekte iki kötü liste alt yapısı kullanılmamıştır: yapı 018 (CH 3-CH-N), kendileri kararsız olmayan prolinin yakın izomerleriyle eşleşmiştir; yapı 106 (R-C-C-OH, burada R = beta-karbona bağlanan alanin alt yapısı), kodlanmış bir amino asit olan glutamik asitle eşleşti. Bu kimyasal formüllere ek olarak, bir karbon atomunun ve iki hidrojen atomunun yerini alan iki değerli kükürt içeren varyantlar oluşturuldu. Performans nedenleriyle, bu formüllerin birçoğu, bir alanin alt yapısının beta-karbonunun yerine üç değerlikli bir fosfor atomu (örneğin, bir "psödoatom") kullanır. Tablo 1, bu örnekte oluşturulan kitaplıkları, bunları oluşturmak için kullanılan formülleri ve içerdiği bileşiklerin sayısını listeler. Kütüphane adları, türetildikleri kodlanmış amino asitlere dayanmaktadır: 3 harfli kısaltma (Gly = glisin, Pro = prolin) veya tek harfli kısaltma (VAIL = Valin, Alanin, İzoleucine, Lösin; DEST = Aspartik asit, Glutamik asit, Serin, Treonin). "_S" soneki, orijinal kütüphanenin formülündeki bir karbonun yerine bir kükürtün ikame edildiğini gösterir (örneğin, VAIL_S, Voil ile aynı bulanık formülle inşa edilmiştir, ancak karbonlardan birinin yerini alan iki değerli bir kükürt ile).
MAYGEN ile yapı oluşturulduktan sonra, ortaya çıkan kütüphaneler, kötü listede bulunan en az bir alt yapı içeren bileşiklerden filtrelendi. Bu filtrelemeyi takiben, herhangi bir fosfor atomu bir alanin alt yapısı ile değiştirildi. Daha sonra, tüm yapıların "kapaklı" versiyonları oluşturuldu, N-terminusuna bir asetil grubu eklendi ve C-terminusuna bir N-metil amid grubu eklendi. Bu, alfa-amino asit omurgasındaki serbest amin ve karboksilik asit gruplarının hidrofobikliği üzerindeki etkiyi ortadan kaldırmak için yapıldı. PaDEL-Descriptor, tüm kapaklı yapılar için XLogP'yi hesaplamak için ve tüm kapaksız yapılar için van der Waals hacmini (VABC) hesaplamak için kullanıldı.
Şekil 2 , VABC ve XLogP tanımlayıcıları tarafından tanımlandığı gibi, filtrelenmiş kitaplıkların kimyasal uzayını göstermektedir. Burada, olası logP değerlerinin aralığı, açıkça hidrofilik yan zincirlere (örneğin, VAIL, Pro) sahip olmayan kütüphanelerde bile, moleküler hacimle birlikte artar. Hidrokarbon yan zincirli kodlanmış amino asitler, kendi kütüphanelerinden karşılaştırılabilir bir hacme sahip diğer amino asitlerin çoğundan daha hidrofobikti. Bu aynı zamanda Met ve Cys için de benzer ciltlere sahip VAIL_S kütüphanesinin diğer üyelerine kıyasla geçerli görünüyor. Hidroksil yan zincirleri (Ser ve Thr) ile kodlanmış amino asitler, DEST kütüphanesinin en küçük üyeleri arasındaydı ve Asp, Thr'den sadece biraz daha büyüktü.
Şekil 3 ve Şekil 4, iki değerli bir kükürt alfa-amino asit yan zincirindeki bir karbonun yerini aldığında hacim ve logP üzerindeki etkileri göstermektedir. Kükürt ikamesi, tüm kütüphanelerde moleküler hacimde hafif bir artışa neden olmuştur (Şekil 3). Kükürt ikamesinin logP üzerindeki etkisi, hacim kadar homojen değildir (Şekil 4). VAIL_S kütüphanesinin ortalama logP'si VAIL kütüphanesininkinden biraz daha düşüktür, ancak bu etki diğer kütüphane çiftlerinin hiçbirinde (DEST ve DEST_S, Pro ve Pro_S) görülmez.
Şekil 5 , ortak bir alt yapı için duran bir psödoatomun yapı üretimi üzerindeki etkilerini ölçmektedir; burada, üç değerlikli bir P, yapı üretimi sırasında bir alanin köstebeği ile değiştirildi. Yapı üretiminde bir psödoatom kullanmak, ~ 3 büyüklük sırası (Şekil 5A) tarafından üretilen yapıların sayısını ve bu yapıları üretmek için gereken toplam süreyi 1-2 büyüklük sırasına göre büyük ölçüde azaltmıştır (Şekil 5B).
Şekil 2: Tüm filtrelenmiş amino asit kütüphanelerinin kimyasal uzayı. Siyah belirteçler, kükürtsüz kütüphanelerden amino asitleri temsil eder; sarı belirteçler, kükürtle zenginleştirilmiş kütüphanelerden gelen amino asitleri temsil eder. Çevreler: VAIL ve VAIL_S; kareler: DEST ve DEST_S; üçgenler: Pro ve Pro_S; yıldızlar: kodlanmış amino asitler. İki kükürt içeren kodlanmış amino asidin (Met ve Cys) "erken" amino asitler olarak kabul edilmediğini, ancak VAIL_S kütüphanesinde bulunduğunu unutmayın. Kısaltmalar: XLogP = bölüm katsayısı; VAIL = valin, alanin, izolösin, lösin; DEST = aspartik asit, glutamik asit, serin, treonin; X_S = Divalent sülfür, X kütüphanesindeki karbonlardan birinin yerini alır .
Resim 3: Kükürtlü ve kükürtsüz kütüphanelerin ortalama van der Waals ciltleri (Å3'te). Siyah çubuklar kükürtsüz kütüphanelerin ortalama hacimlerini (VAIL, DEST, Pro) temsil ederken, sarı çubuklar bu kütüphanelerin kükürt yerine geçen versiyonlarının ortalama hacimlerini temsil eder (VAIL_S, DEST_S, Pro_S). Hata çubukları standart sapmayı gösterir. Kısaltmalar: VAIL = valin, alanin, izolösin, lösin; DEST = aspartik asit, glutamik asit, serin, treonin; X_S = Divalent kükürt, X kütüphanesindeki karbonlardan birinin yerini alır.
Şekil 4: Kükürtlü ve kükürtsüz kütüphanelerin ortalama XLogP değerleri. Siyah çubuklar kükürtsüz kütüphaneleri (VAIL, DEST, Pro) temsil ederken, sarı çubuklar bu kütüphanelerin kükürt yerine geçen versiyonlarını temsil eder (VAIL_S, DEST_S, Pro_S). Hata çubukları standart sapmayı gösterir. Kısaltmalar: XLogP = bölüm katsayısı; VAIL = valin, alanin, izolösin, lösin; DEST = aspartik asit, glutamik asit, serin, treonin; X_S = Divalent sülfür, X kütüphanesindeki karbonlardan birinin yerini alır .
Şekil 5: Üç değerlikli bir psödoatomun MAYGEN yapı oluşumu üzerindeki etkileri. Tüm testler, 2,8 GHz'de Intel i7-7700HQ işlemciye, 16 GB RAM'e, bir dosyaya kaydetme yapısına ve çoklu iş parçacığı kullanmaya yönelik -m seçeneğine sahip bir bilgisayarda yapılmıştır. Bir psödoatom kullanılarak yapılan testlerde, Tablo 1'de açıklandığı gibi bulanık formüller kullanılmıştır. Psödoatomsuz testler için, kullanılan bulanık formüller aşağıdaki değişikliklerle Tablo 1'de açıklananlarla aynıydı: P, N ile değiştirildi; karbon sayıları 3 arttı; hidrojen sayıları 7 arttı; oksijen sayısı 2 arttı. Siyah çubuklar sahte atomla oluşturulan kütüphaneleri gösterir; gri çubuklar, sahte atom olmadan oluşturulan kitaplıkları gösterir. (A) VAIL ve DEST kütüphanelerini oluşturmak için kullanılan bulanık formüller kullanılarak oluşturulan yapıların sayısı, bir alanin alt yapısının yerine geçen üç değerlikli fosfor ile ve değerliksiz olarak. (B) VAIL ve DEST kütüphanelerini, bir alanin alt yapısının yerine geçen üç değerlikli fosforlu ve değerliksiz olarak inşa etmek için gereken zaman (ms cinsinden). Kısaltmalar: VAIL = valin, alanin, izolösin, lösin; DEST = aspartik asit, glutamik asit, serin, treonin. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Ek Dosya 1: Alt yapı filtreleme not defteri. Bu Dosyayı indirmek için lütfen tıklayınız.
Ek Dosya 2: Örnek kötü liste. Bu Dosyayı indirmek için lütfen tıklayınız.
Ek Dosya 3: Örnek iyi liste. Bu Dosyayı indirmek için lütfen tıklayınız.
Ek Dosya 4: Pseudoatom değiştirme not defteri. Bu Dosyayı indirmek için lütfen tıklayınız.
Ek Dosya 5: Amino asit kapak defteri. Bu Dosyayı indirmek için lütfen tıklayınız.
"Erken" amino asitlerin bir özelliği kükürt eksikliğidir. Daha önce bahsedilen meta-analizler genellikle kükürt içeren kodlanmış amino asitlerin (Cys ve Met) genetik koda nispeten geç eklemeler olduğunu, meteorlarda kükürt içeren amino asitlerin eksikliği ve kıvılcım tüpü deneylerinde desteklenen sonuçlar olduğunu düşünmektedir. Bununla birlikte, organosülfür bileşikleri kuyruklu yıldızlarda ve meteoritlerde kolayca tespit edilir22 veH2S gazı kullanılarak kıvılcım tüpü deneylerinin yeniden analizi, amino asitleri ve kükürt16 içeren diğer organik bileşikleri buldu. Alternatif bir amino asit alfabesi düşünüldüğünde, kükürt bakımından zenginleştirilmiş bir alfabe keşfedilmeye değer.
Yukarıdaki protokolde, yapı oluşturma ve altyapı filtreleme kritik adımlar olarak kabul edilir; Bitmiş yapı kütüphanesinin bileşimine bağlı olarak, bir araştırmacının yalnızca bu iki adımı gerçekleştirmesi gerekebilir. Ek eylemler için talimatlar ve yazılımlar (psödoatom değişimi ve alt yapıların eklenmesi (bu durumda, amino asit kapağı)) daha ilgili tanımlayıcı hesaplama için dahil edilmiştir (kapaklama, XLogP hesaplamalarının omurga amin veya karboksil gruplarından değil, yan zincirden etkilenmesini sağlar) ve aşağıda daha ayrıntılı olarak tartışılan bir sahte atom kullanılarak daha hızlı yapı oluşturulması. Ek olarak, tanımlayıcı hesaplama, üretilen yapıların çeşitliliğini görselleştirmenin ve bitmiş kütüphanelerdeki kükürt zenginleştirmenin etkilerini karşılaştırmanın kolay bir yolu olarak burada yapılır.
PaDEL-Descriptor binlerce moleküler özelliği hesaplayabilse de, moleküler hacim (hesaplanan van der Waals hacmi olarak) ve bölüm katsayısı (XLogP olarak) burada iki farklı nedenden dolayı kullanılmıştır. İlk olarak, bu iki tanımlayıcı, çoğu kimyager ve biyolog için tanıdık olan moleküler özellikleri (sırasıyla boyut ve hidrofobiklik) ölçer. İkincisi, amino asitler söz konusu olduğunda, bu iki özellik önemlidir. Onlarca yıldır, amino asit boyutunun ve hidrofobikliğin, protein katlanması23'ün termodinamiğini etkilediği biliniyordu. Bu iki özellik, protein evrimini anlamanın ayrılmaz bir parçası olan amino asit ikame frekanslarını açıklamaya yardımcı olur24.
Yukarıdaki örnek, incelenen iki tanımlayıcıda (moleküler hacim ve hidrofobiklik), bir karbon ve iki hidrojen için iki değerli bir kükürt ikame edilmesinin önemli değişiklikler sağlamadığını göstermektedir. Kükürt ikamesinden kaynaklanan ortalama moleküler hacimdeki hafif, önemsiz artış (Şekil 3), kükürtün sp 3 (~ 75 pm) veya sp 2 (~73 pm) karbon25'e kıyasla daha büyük kovalent yarıçapına (~ 103 pm) bağlanabilir. Benzer şekilde, kükürt ikamesinin ortalama XLogP üzerinde minimum etkisi vardır (Şekil 4). En büyük etki, muhtemelen VAIL kütüphanesinin özellikle hidrofobik (yan zincirler sadece hidrokarbonlardır) ve sülfhidril gruplarının yerini alacakları metil gruplarından çok daha asidik olması nedeniyle VAIL ve VAIL_S kütüphaneleri arasındaydı. Kükürt ikamesinin minimum etkisi, kükürt ikamesi olan kütüphanelerin, kükürt ikamesi olmayan benzer kütüphanelerle aynı kimyasal alanı işgal ettiği Şekil 2'de belirgindir.
Bir psödoatom kullanırken yapı sayısındaki (Şekil 5A) ve bu yapıları üretmek için gereken süredeki azalma (Şekil 5B) şaşırtıcı değildir. Bir psödoatom kullanmak, kimyasal bir grafiğe dahil edilmesi gereken ağır atomların sayısını azaltır, grafik düğümlerinin sayısını azaltır ve üretim süresinde ve yapı sayısında üstel düşüşler sağlar. Burada, bir psödoatom olarak üç değerlikli fosforun seçimi, temel biyokimyadan (fosfat gruplarının posttranslasyonel ilavesi olmadan, genetik olarak kodlanmış amino asitler fosfor içermez) ve onun yerini alacak atomun değerliğinden (üç değerlikli bir fosfor, başka bir atoma veya atom grubuna tek başına bağlanmış dört değerlikli bir karbon ile kolayca değiştirilebilir) kaynaklanır. Psödoatom ikamesi için sağlanan kod, üç değerlikli bir fosforun bir alanin alt yapısıyla değiştirilmesi için spesifik olsa da, kullanıcılar kodu farklı psödoatomlarla veya yedek alt yapılarla çalışacak şekilde özelleştirebilir, potansiyel olarak ilk yapı üretimi sırasında birden fazla psödoatom kullanabilir ve ardından her bir sahte atomu daha büyük bir moleküler alt yapı ile değiştirebilir.
MAYGEN tarafından kullanılanlara benzer yapı oluşturma yöntemleri (ve sinir ağları gibi diğer yöntemler), in silico taraması için bileşik kütüphaneler oluşturmak için ilaç keşfinde zaten kullanılmaktadır; yakın tarihli bir inceleme4, bu yöntemleri daha ayrıntılı olarak tartışmaktadır. Bu yöntemler öncelikle ilaç benzeri moleküllerin oluşturulması için tasarlandığından, oluşturulan yapıları sınırlamak için biyolojik veya farmasötik özellikleri kullanmak (ters QSPR / QSAR) veya önceden belirlenmiş sayıda alt yapı yapı taşından yapılar oluşturmak gibi moleküller üretme yeteneklerinde bazı sınırlamalar vardır. Astrobiyoloji, herhangi bir son ürün veya özellikleri üzerinde abiyotik olarak ve daha az oluşabilen çok sayıda organik bileşiğe daha fazla odaklandığından, MAYGEN'in kapsamlı yapı üretimi, astrobiyolojik soruları ele almak için yapı kütüphaneleri oluşturmak için idealdir. Burada açıklanan altyapı filtreleme yaklaşımı (harici bir program aracılığıyla yapı oluşturulduktan sonra gerçekleştirilir), rakip program MOLGEN'den farklıdır, çünkü MOLGEN'in alt yapı filtrelemesi yapı oluşturma sırasında gerçekleşir. MAYGEN açık kaynaklı olduğundan, MOLGEN'in lisans maliyeti nedeniyle sadece MOLGEN'den daha erişilebilir olmakla kalmaz, aynı zamanda bireyler yapı oluşturma sırasında altyapı filtreleme gibi yeni özellikler uygulayabilirler.
Yazıldığı gibi, burada açıklanan protokol, nispeten küçük alfa-amino asitlerin kütüphanelerini oluşturmaya ve küratörlüğe odaklanmıştır. Farklı kütüphaneler oluşturmak için, kullanıcılar MAYGEN'e farklı moleküler formüller verebilir, izin verilen maksimum halka boyutunu ve bağ değerini değiştirerek alt yapı filtrelemesini değiştirebilir veya alt yapı desenleri eklemek veya kaldırmak için iyi liste ve kötüliste dosyalarını düzenleyebilir. Atomların ve alt yapıların nasıl eklendiğini veya değiştirildiğini değiştirmeyi içeren protokol modifikasyonları (psödoatom ikamesi ve moleküler kapaklama) mümkündür, ancak modifiye yapılardaki yanlış değerliklerle ilgili RDKit hatalarını önlemek için değerlik kısıtlamalarına daha fazla dikkat edilmesini gerektirecektir.
Yukarıda detaylandırılan protokol küçük alfa-amino asitler için tasarlanmıştır. Bununla birlikte, genel format (psödoatomlar kullanılarak kapsamlı yapı üretimi, ardından alt yapı filtreleme ve moleküler modifikasyonlar) küçük amino asitlerin ötesindeki bileşikler için oldukça esnektir. Astrobiyolojide bile, nükleik asitlerin anayasal izomerlerini araştırmak için MOLGEN kullanan benzer bir prosedür kullanılmıştır26. Yukarıda açıklanan araçlara ek olarak, MAYGEN, yeni kimyasal yapıların oluşturulmasını ve analiz edilmesini çok çeşitli araştırma alanları için uygun fiyatlı ve erişilebilir hale getirmek için diğer açık kaynaklı kimyasal bilişim araçlarıyla eşleştirilebilir.
Yazarların açıklayacağı bir çıkar çatışması yoktur.
MAY, Carl-Zeiss-Vakfı tarafından sağlanan finansmanı kabul eder. Tüm rakamlar Microsoft Excel kullanılarak oluşturulmuştur.
Name | Company | Catalog Number | Comments |
conda v. 4.10.3 | https://www.anaconda.com/products/individual | ||
Java 17 | https://java.com/en/download/help/download_options.html | ||
MAYGEN v. 1.8 | https://github.com/MehmetAzizYirik/MAYGEN/releases | ||
PaDEL-Descriptor v. 2.21 | http://www.yapcwsoft.com/dd/padeldescriptor/ | ||
python v. 3.7.11 | included in Anaconda environment | ||
RDKit v. 2020.09.1.0 | https://www.rdkit.org/docs/Install.html, or installed via conda: https://anaconda.org/rdkit/rdkit | ||
*These specific versions were used for this manuscript; user can obtain more recent versions if available. |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır