Method Article
Biz genom dizilerinin analizi için genel bir hesaplama web sitesi mevcut. DNA dizisi modelleri, çeşitli tesadüfi olmayan bir nükleotid kompozisyonlar ile algılar. Bu kaynak da, farklı karmaşıklık düzeylerine sahip randomize dizileri üretir.
Sigara kodlama intergenic alanları intronlar ve ekzonlarının çevrilmemiş kesimleri de dahil olmak üzere karmaşık ökaryotlar, genomik bölgelerde kendi nükleotid kompozisyon derinden tesadüfi olmayan ve karmaşık bir dizi paternleri mozaik oluşur. Dizileri (örneğin, (G + T) açısından zengin, pürin açısından zengin, vb üsleri belirli bir taban veya kombinasyonu ile zenginleştirilmiştir uzunluğu 3-10 nükleotidler - Bu desen olarak adlandırılan Orta sınıf İnhomojenlik (MRG) bölgelerinde .) MR bölgeler genellikle gen ekspresyonu, rekombinasyon ve diğer genetik süreçler (2010 Fedorova & Fedorov) yönetmelikte yer alışılmadık (non-B formu) DNA yapılarıyla ilişkilidir. Sırasına homojen ek azaltmak için bu genom dizilerinin işlevsellik ve önemi (Prakash ve ark 2009) destekler eğilimindedir mutasyonlar karşı MRI bölgeler içinde güçlü bir fiksasyon önyargı varlığı.
Burada özgürce kullanılabilir internet kaynak göstermek - Genomik MR program paketi (. Bechtel ve ark 2008), içinde çeşitli MRG desenleri bulmak ve karakterize etmek amacıyla genom dizilerinin hesaplama analizi için tasarlanmış . Bu paket, aynı zamanda doğal giriş DNA dizilimleri için çeşitli özellikleri ve yazışma düzeyi ile randomize dizileri üretimi sağlar. Bu kaynak ana hedefi hala pek araştırılmalı ve kapsamlı arama ve tanıma bekliyor kodlamayan DNA büyük bölgelerin incelenmesi kolaylaştırmaktır.
Perl kullanarak kağıt kullanılan tüm programlar yazılmıştır, ve tüm web sayfaları PHP kullanılarak oluşturulan edilmiştir.
1. Başlangıç Noktası:
Http://mco321125.meduohio.edu/ ~ jbechtel / gmri / online Genomik MR paketinin ana sayfa açın. Web kaynakları da, "Yardım (How-to/README)" bağlantısını Genomik MR ve benzeri algoritmalar tüm malzemeleri "ilgili kaynaklara bağlantılar" bölümünde listelenen ise bağlantı, programları ile ilgili talimatlar / açıklamalar sağlar.
2. Hazırlık ve Giriş Sırası (ler) yükleniyor.
GMRI analiz oturumu başlatmak için FASTA biçimlendirilmiş dizisi (ler) ile bir dosya oluşturun. Bu dizinin kısa bir açıklama ile aynı hat üzerinde bir tanımlayıcı temsil eden ">" karakteri ile başlayan tek bir satır ile bu formatı her nükleotid dizisi öncesinde olmalıdır. GMRI analizi için DNA dizisi, R, Y, N, X, vb Hwever, non-A, T, C gibi karakterlere izin vermektedir, G karakterleri program tarafından işlenecek ve atlanır. Tekrarlayan elemanlarla ("K" lar yerine) "maskeli" hangi dizileri girdi olarak kullanılabilir. Dizisi karakterler büyük küçük harf duyarsız olduğunu unutmayın.
NOT: Bundan sonra giriş dizileri "dosya" olarak adlandırılır.
3. Giriş Diziler (isteğe bağlı) Oligonükleotid Frekans Dağılımı alın.
"SRI Analyzer" sekmesine (üst satır) giriş dizilerinin tüm oligonükleotit frekansları bir dağıtım almak için tıklayın. İngilizce'deki SRI, kısa mesafeli homojen duruyor. Bu noktada, kullanıcı frekansları hesaplanmış olacak oligonükleotidler en yüksek uzunluğu (9 nükleotidler 2, varsayılan 6 NTS) belirtebilirsiniz. Bu seçim, "Maksimum oligomer boyutu" liste kutusunun içinde istediğiniz seçeneği tıklayarak yapılır . Sonra hesaplama başlatmak için "Dosya Analyze" butonuna basın. Kaba bir temsil giriş sırası kompozisyon hemen bu web sayfasının ortasında kısa bir tablo olarak görünür ve "userfile.comp.tbl" olarak indirilebilir. Bu tablo, sadece giriş dizileri içinde en çok ve en bol oligonükleotidler temsil eder.
"Download kompozisyon dosyası" linki ile elde edilebilir "userfile.comp" adlı bir dosya olarak, tüm olası oligonükleotidler tüm frekans tablosu oluşturulur .
NOT: SRI analizörü tüm örtüşen oligonükleotidler kümesinin tamamını sayar.
4. Rastgele Diziler Giriş Diziler (isteğe bağlı) olduğu gibi aynı Oligonükleotid kompozisyon oluşturun.
(Bu görev için gerekli protokolün 3. adımı tamamlanması).
5. Analizi (MRG), Giriş ve Rastgele Diziler Orta sınıf İnhomojenlik.
6. Genomik MR Paketi (isteğe bağlı) içinde Ek Programlar.
Genomik MR kaynak, aynı zamanda çok özel bir rastgele dizileri nesil için iki gelişmiş seçenekler vardır. Onlar, "MR Jeneratör" ve en üst satırındaki "CDS Jeneratör" sekme mevcuttur .
7. Temsilcisi Sonuçlar
Bu protokol, bir kullanıcı, kompozisyon nükleotid dizilerinin homojen dersleri veriyor. Daha da önemlisi, aynı zamanda giriş dizilerinin yaklaşık bir oligonükleotid bileşimi ile çeşitli randomize dizilerinin üretimi destekler. Genellikle karmaşık ökaryotlar genomik sekansları kompozisyon homojen değildir, daha ziyade, özellikle nükleotidler ile zenginleştirilmiş dizisi segmentleri karmaşık bir mozaik (örneğin, pürin açısından zengin (G + T)-zengin, (A + T) zengin temsil vb.) Bu orta sınıf ölçekli (3-10 bp) desen üst mavi kramponları ve düşük kırmızı sivri gibi içerik yoksul kesimlerin (bkz. Şekil 1 ve 2) gibi zengin içerikli segmentleri seçilen gösterir MRI analizörü grafik çıkışı görüntülendi. Tipik olarak, doğal bir sıra (Şekil 1) herhangi bir içerik açısından zengin ve içerik fakir bölgelerin sayısı aynı oligonükleotid ilgili randomize dizileri bölgeler aynı tip (Şekil 2) sayısından daha yüksek kez sipariş. bileşimi. Nükleotid kompozisyonu orta sınıf homojen olan bu dizi bölümleri kullanıcı için ilgi olabilir. Bunlar, daha fazla araştırma için Genomik MR çıktı dosyalarını mevcuttur .
Şekil 1 adım 5.7 MRG analizörü grafik çıktı bir örnek. 44 insan intronların bir örnek üzerinde sonuçlar elde edilmiştir. Mavi çubuklar bu intronlar boyunca GC-zengin bölgelerde pozisyonları temsil eder. Kırmızı çubuklar GC-kötü (ya da AT-zengin) MRI bölgeleri temsil eder. Y-ekseni, belirli bir içerik türü için alt ve üst eşikleri içermektedir.
Rasgele dizisi "userfile.rand1_4" Şekil 2. MR analizörü çıktı.
GraphiSRI jeneratör programı kullanarak rasgele oluşturulmuş bir dizisi içinde MRI cal temsili.
Şekil 3. MR analizörü bir metin çıktı dosyasının başında bir örnek.
Programı tarafından tespit edilen tüm içerik ve zengin-fakir içerikli dizileri, en son (dördüncü) sütununda sunulmaktadır. Pencere sayısı olarak ölçülür Onların göreli konumları, ilk sütunda gösterilmiştir. Ikinci ve üçüncü sütunlarında sırasıyla, içerik ve zengin içerik-fakir bölgeler, göstergeleri.
Orta menzilli ölçeklerde homojen nükleotid bileşimi (30-1000 nükleotidler) Bölgeler karmaşık ökaryotlarda genomlarındaki haddinden ve (intergenic bölgeler, intronlar, ekzonlarının çevrilmemiş bölgelerde, tekrarlayan elemanlar) her yerde bulunabilir. Bu bölgelerde sık sık değişik DNA konformasyonlar ilişkilidir. Örneğin, purine-/pyrimidine-rich dizileri DNA triplexes (Y-DNA) oluşturmak için eğilimindedir; pürin / pirimidin bazlar alternatif dizileri Z-DNA konformasyonlar ile ilişkilidir; (G + C) zengin bölgelerde yapısal anormallikler de sergileyebilirler B- (2010 Fedorov & Fedorova tarafından gözden) - DNA ve omurga bölünme eğilimli olabilir elemanı gevşemek DNA (A + T) zengin bölgelerde olağandışı bir yapı oluşturmak olabilir. Bu orta sınıf desen bazıları (örneğin, (G + T) zengin bölgeleri) pek araştırılmış ve hala kapsamlı arama ve tanıma bekliyor. Genomik MR web kaynağın temel amacı, kullanıcılara daha fazla deneysel analizi ve olası fonksiyonları araştırılması için MRG bu bölgelerin belirlenmesi yardımcı olmaktır . Bilgi MRI bölgelerin içine ve gen tahmini programlarının yeni nesil (Shepard 2010) genom fonksiyonları ve özellikleri anlayışımızı geliştirmek ve ilerletmek olabilir.
Samuel Shepard, Peter Bazeley, John David Bell ve Genomik MR web sayfalarının yönetimi için müteşekkiriz. Bu çalışma, Ulusal Bilim Vakfı Kariyer ödülü "intron hücresel rolleri İncelenmesi" tarafından desteklenen hibe MCB-0643542].
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır