Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.
Bu protokol, biyoinformatiğe yeni başlayanlara, kullanıcıların CUT & RUN sıralama verilerinin ilk analizini ve doğrulamasını tamamlamalarını sağlayan giriş niteliğinde bir CUT & RUN analiz hattı aracılığıyla rehberlik eder. Burada açıklanan analiz adımlarının tamamlanması, aşağı akış tepe açıklaması ile birlikte, kullanıcıların kromatin regülasyonu hakkında mekanik içgörüler elde etmesine olanak tanır.
CUT&RUN tekniği, genom boyunca protein-DNA etkileşimlerinin tespit edilmesini kolaylaştırır. CUT & RUN'ın tipik uygulamaları arasında profil oluşturma, histon kuyruğu modifikasyonlarındaki değişiklikler veya transkripsiyon faktörü kromatin doluluğunun haritalanması yer alır. CUT & RUN'ın yaygın olarak benimsenmesi, kısmen, daha düşük hücre giriş gereksinimleri, daha düşük dizileme derinliği gereksinimleri ve aksi takdirde antikor epitoplarını maskeleyen çapraz bağlama ajanlarının eksikliği nedeniyle azaltılmış arka plan sinyali ile artan hassasiyet içeren geleneksel ChIP-seq'e göre teknik avantajlardan kaynaklanmaktadır. CUT&RUN'ın yaygın olarak benimsenmesi, Henikoff laboratuvarı tarafından reaktiflerin cömert bir şekilde paylaşılması ve yeni başlayanlar için benimsemeyi hızlandırmak için ticari kitlerin geliştirilmesi yoluyla da sağlanmıştır. CUT&RUN'ın teknik olarak benimsenmesi arttıkça, CUT&RUN sıralama analizi ve doğrulaması, ağırlıklı olarak ıslak laboratuvar ekipleri tarafından tam olarak benimsenmesini sağlamak için aşılması gereken kritik darboğazlar haline gelir. CUT&RUN analizi tipik olarak, sıralama derinliğini, okuma kalitesini ve olası sapmaları değerlendirmek için ham sıralama okumaları üzerindeki kalite kontrol kontrolleriyle başlar. Okumalar daha sonra bir referans genom dizisi düzeneğine hizalanır ve daha sonra protein zenginleştirmesinin genomik bölgelerini açıklamak, veri yorumlanabilirliğini doğrulamak ve biyolojik sonuçlar çıkarmak için çeşitli biyoinformatik araçlar kullanılır. CUT & RUN veri analizini desteklemek için birden fazla in silico analiz boru hattı geliştirilmiş olsa da, karmaşık çok modüllü yapıları ve çoklu programlama dillerinin kullanımı, platformları birden fazla programlama diline aşina olmayan ancak CUT & RUN analiz prosedürünü anlamak ve analiz boru hatlarını özelleştirmek isteyen biyoinformatik yeni başlayanlar için zorlaştırmaktadır. Burada, herhangi bir düzeyde biyoinformatik deneyimine sahip kullanıcılar için tasarlanmış tek dilli adım adım bir CUT&RUN analiz boru hattı protokolü sunuyoruz. Bu protokol, sıralama verilerinin biyolojik yorumlama için uygun olduğunu doğrulamak için kritik kalite kontrollerinin tamamlanmasını içerir. Bu makalede sağlanan giriş protokolünü takip etmenin, aşağı akış tepe ek açıklamasıyla birlikte kullanıcıların kendi CUT&RUN veri kümelerinden biyolojik içgörüler elde etmelerine olanak tanıyacağını umuyoruz.
Proteinler ve genomik DNA arasındaki etkileşimleri ölçme yeteneği, kromatin regülasyonunun biyolojisini anlamak için temeldir. Belirli bir protein için kromatin doluluğunu ölçen etkili tahliller, en az iki temel bilgi parçası sağlar: i) genomik lokalizasyon ve ii) belirli bir genomik bölgedeki protein bolluğu. Kromatin ile ilgilenen bir proteinin işe alım ve lokalizasyon değişikliklerinin izlenmesi, proteinin doğrudan hedef lokuslarını ortaya çıkarabilir ve bu proteinin transkripsiyonun düzenlenmesi, DNA onarımı veya DNA replikasyonu gibi kromatin bazlı biyolojik süreçlerdeki mekanik rollerini ortaya çıkarabilir. Günümüzde protein-DNA etkileşimlerinin profilini çıkarmak için mevcut olan teknikler, araştırmacıların düzenlemeyi benzeri görülmemiş bir çözünürlükte keşfetmelerini sağlıyor. Bu tür teknik ilerlemeler, Henikoff laboratuvarı tarafından Hedefler Altında Bölünme ve Nükleaz Kullanarak Serbest Bırakma (CUT & RUN) geliştirilmesini içeren yeni kromatin profilleme tekniklerinin tanıtılmasıyla mümkün olmuştur. CUT & RUN, geleneksel kromatin immünopresipitasyonuna (ChIP) göre daha düşük hücre giriş gereksinimleri, daha düşük dizileme derinliği gereksinimleri ve aksi takdirde antikor epitoplarını maskeleyen çapraz bağlama ajanlarının eksikliği nedeniyle azaltılmış arka plan sinyali ile artan hassasiyet gibi çeşitli teknik avantajlar sunar. Kromatin regülasyonunu incelemek için bu tekniği benimsemek, tekniğin altında yatan ilkenin kapsamlı bir şekilde anlaşılmasını ve CUT & RUN verilerinin nasıl analiz edileceğinin, doğrulanacağının ve yorumlanacağının anlaşılmasını gerektirir.
CUT & RUN prosedürü, prosedür boyunca düşük hücre sayılarının manipülasyonunu sağlamak için hücrelerin manyetik boncuklara konjuge Concanavalin A'ya bağlanmasıyla başlar. İzole edilmiş hücreler, ilgilenilen proteini hedef alan bir antikorun eklenmesini kolaylaştırmak için hafif bir deterjan kullanılarak geçirgenleştirilir. Mikrokokal nükleaz (MNaz) daha sonra enzime bağlı bir Protein A veya Protein A/G etiketi kullanılarak bağlı antikora alınır. Enzimatik aktiviteyi başlatmak için kalsiyum eklenir. MNaz sindirimi, mono-nükleozomal DNA-protein kompleksleri ile sonuçlanır. Kalsiyum daha sonra sindirim reaksiyonunu sona erdirmek için şelatlanır ve MNaz sindiriminden kısa DNA parçaları çekirdeklerden salınır, daha sonra DNA saflaştırmasına, kütüphane hazırlığına ve yüksek verimli dizilemeyetabi tutulur 1 (Şekil 1).
Genom boyunca protein doluluğunu haritalamak ve ölçmek için in silico yaklaşımlar, bu DNA-protein etkileşimlerini zenginleştirmek için kullanılan ıslak laboratuvar yaklaşımlarına paralel olarak geliştirilmiştir. Zenginleştirilmiş sinyallerin bölgelerinin (tepe noktaları) tanımlanması, biyoinformatik analizdeki en kritik adımlardan biridir. İlk ChIP-seq analiz yöntemleri, iyi niyetli protein-DNA bağlanma bölgelerini arka plan gürültüsünden ayırt etmek için istatistiksel modeller kullanan MACS2 ve SICER3 gibi algoritmalar kullandı. Bununla birlikte, CUT&RUN verilerinin daha düşük arka plan gürültüsü ve daha yüksek çözünürlüğü, ChIP-seq analizinde kullanılan bazı tepe çağrı programlarını CUT&RUN analizi4 için uygun olmayan hale getirir. Bu zorluk, CUT&RUN verilerinin analizi için daha uygun olan yeni araçlara olan ihtiyacı vurgulamaktadır. SEACR4, tipik olarak ChIP-seq analizine yönelik kullanılan araçlarla ilişkili sınırlamaların üstesinden gelirken, CUT & RUN verilerinden en yüksek çağrıyı sağlamak için yakın zamanda geliştirilen böyle bir aracı temsil eder.
CUT&RUN sıralama verilerinden elde edilen biyolojik yorumlar, analiz boru hattındaki tepe çağrısının aşağı akışındaki çıktılardan alınır. CUT & RUN verilerinden çağrılan tepe noktalarının potansiyel biyolojik alaka düzeyini tahmin etmek için çeşitli işlevsel açıklama programları uygulanabilir. Örneğin, Gen Ontolojisi (GO) projesi, ilgilenilen genlerin iyi kurulmuş fonksiyonel tanımlamasını sağlar 5,6,7. Çeşitli yazılım araçları ve kaynakları, CUT & RUN zirveleri 8,9,10,11,12,13,14 arasında zenginleştirilmiş genleri ve gen setlerini ortaya çıkarmak için GO analizini kolaylaştırır. Ayrıca, Deeptools15, Integrative genomics viewer (IGV)16 ve UCSC Genome Browser17 gibi görselleştirme yazılımları, genom boyunca ilgilenilen bölgelerdeki sinyal dağılımının ve modellerinin görselleştirilmesini sağlar.
CUT&RUN verilerinden biyolojik yorumlar çıkarma yeteneği, kritik olarak veri kalitesinin doğrulanmasına bağlıdır. Doğrulanması gereken kritik bileşenler arasında aşağıdakilerin değerlendirilmesi yer alır: i) CUT&RUN kütüphane sıralama kalitesi, ii) benzerliği çoğaltma ve iii) tepe merkezlerinde sinyal dağılımı. Her üç bileşenin de doğrulanmasının tamamlanması, CUT&RUN kütüphane örneklerinin ve aşağı akış analiz sonuçlarının güvenilirliğini sağlamak için çok önemlidir. Bu nedenle, biyoinformatiğe yeni başlayanların ve ıslak laboratuvar araştırmacılarının standart CUT&RUN analiz hatlarının bir parçası olarak bu tür doğrulama adımlarını yürütmelerini sağlamak için giriş niteliğinde CUT&RUN analiz kılavuzlarının oluşturulması önemlidir.
Islak laboratuvar CUT&RUN deneyinin geliştirilmesinin yanı sıra, CUT&RUNTools 2.018,19, nf-core/cutandrun20 ve CnRAP21 gibi çeşitli in silico CUT&RUN analiz boru hatları CUT&RUN veri analizini desteklemek için geliştirilmiştir. Bu araçlar, tek hücreli ve toplu CUT&RUN ve CUT&Tag veri kümelerini analiz etmek için güçlü yaklaşımlar sağlar. Bununla birlikte, nispeten karmaşık modüler program yapısı ve bu analiz boru hatlarını yürütmek için birden fazla programlama diline aşinalık gerektirmesi, CUT & RUN analiz adımlarını tam olarak anlamak ve kendi boru hatlarını özelleştirmek isteyen biyoinformatik yeni başlayanlar tarafından benimsenmesini engelleyebilir. Bu engelin aşılması, basit bir tek programlama dili kullanılarak kodlanmış basit adım adım komut dosyalarında sağlanan yeni bir giriş CUT&RUN analiz hattı gerektirir.
Bu makalede, yeni ve acemi kullanıcıların CUT&RUN sıralama analizi yapmalarını sağlamak için ayrıntılı açıklamalarla desteklenen adım adım komut dosyaları sağlayan basit bir tek dilli CUT&RUN analiz boru hattı protokolünü açıklıyoruz. Bu işlem hattında kullanılan programlar, özgün geliştirici grupları tarafından genel kullanıma açıktır. Bu protokolde açıklanan ana adımlar, biyolojik yorumlama için veri uygunluğunu ve güvenilirliğini belirlemek için numune kalitesini değerlendirmek için okuma hizalaması, tepe çağrısı, fonksiyonel analiz ve en önemlisi doğrulama adımlarını içerir (Şekil 2). Ayrıca, bu boru hattı kullanıcılara analiz sonuçlarını halka açık CUT&RUN veri kümeleriyle çapraz referans verme fırsatı sunar. Sonuç olarak, bu CUT&RUN analiz boru hattı protokolü, biyoinformatik analize yeni başlayanlar ve ıslak laboratuvar araştırmacıları için bir giriş kılavuzu ve referans görevi görür.
NOT: CUT&RUN fastq ile ilgili bilgiler GSE126612 Tablo 1'de mevcuttur. Bu çalışmada kullanılan yazılım uygulamaları ile ilgili bilgiler Malzeme Tablosu'nda listelenmiştir.
1. Easy-Shells_CUTnRUN pipeline'ı Github sayfasından indirme
2. Easy Shells CUTnRUN için gerekli programların kurulması
3. Herkese açık CUT&RUN veri setini Sequence Read Archive'dan (SRA) indirme
4. Ham sıralama dosyaları için ilk kalite kontrolü
5. Ham sıralama dosyaları için kalite ve adaptör kırpma
6. Gerçek ve spike-in kontrol örnekleri için referans genomlar için papyon2 indeksinin indirilmesi
7. Kırpılmış CUT&RUN dizileme okumalarının referans genomlara eşlenmesi
8. Eşlenmiş okuma çiftleri dosyalarını sıralama ve filtreleme
9. Eşlenmiş okuma çiftlerini BEDPE, BED ve ham okuma sayıları bedGraph dosyalarına dönüştürün
10. Ham okuma sayılarını bedGraph dosyalarını normalleştirilmiş bedGraph ve bigWig dosyalarına dönüştürme
11. Parça boyutu dağılımını doğrulama
12. MACS2, MACS3 ve SEACR kullanarak tepe noktalarını arama
13. Çağrılan tepe yatağı dosyaları oluşturma
14. Pearson korelasyonu ve Temel bileşen (PC) analizi kullanılarak replikasyonlar arasındaki benzerliğin doğrulanması.
15. Venn şemasını kullanarak replikasyonlar, tepe arama yöntemleri ve seçenekler arasındaki benzerliğin doğrulanması
16. Tepe noktaları olarak adlandırılan görselleştirmek için ısı haritalarını ve ortalama grafikleri analiz etmek.
Kalite ve adaptör kırpma, yüksek sıralama kalitesiyle okumaları korur
Yüksek verimli sıralama teknikleri, okumalarda dizi 'mutasyonları' gibi sıralama hataları oluşturmaya eğilimlidir. Ayrıca, kitaplık hazırlığı sırasında bağdaştırıcının zayıf çıkarılması nedeniyle sıralama bağdaştırıcısı dimerleri, sıralama veri kümelerinde zenginleştirilebilir. Okuma mutasyonları, uygun eşleme için gerekenden daha kısa okuma üretimi ve a...
Kromatin üzerindeki protein doluluğunu haritalama yeteneği, kromatin biyolojisi alanında mekanik çalışmalar yürütmek için esastır. Laboratuvarlar kromatin profili oluşturmak için yeni ıslak laboratuvar tekniklerini benimsedikçe, bu ıslak laboratuvar deneylerinden elde edilen sıralama verilerini analiz etme yeteneği, ıslak laboratuvar bilim adamları için ortak bir darboğaz haline gelir. Bu nedenle, biyoinformatiğe yeni başlayanların analiz darboğazının üstesin...
Yazarlar herhangi bir açıklama beyan etmemektedir.
Resimli tüm figürler BioRender.com ile oluşturulmuştur. CAI, Yumurtalık Kanseri Araştırma İttifakı Erken Kariyer Araştırmacısı Ödülü, Forbeck Vakfı Hızlandırıcı Hibesi ve Minnestoa Yumurtalık Kanseri İttifakı Ulusal Erken Teşhis Araştırma Ödülü aracılığıyla sağlanan desteği kabul eder.
Name | Company | Catalog Number | Comments |
bedGraphToBigWig | ENCODE | https://hgdownload.soe.ucsc.edu/admin/exe/ | Software to compress and convert readcounts bedGraph to bigWig |
bedtools-2.31.1 | The Quinlan Lab @ the U. of Utah | https://bedtools.readthedocs.io/en/latest/index.html | Software to process bam/bed/bedGraph files |
bowtie2 2.5.4 | Johns Hopkins University | https://bowtie-bio.sourceforge.net/bowtie2/index.shtml | Software to build bowtie index and perform alignment |
CollectInsertSizeMetrics (Picard) | Broad institute | https://github.com/broadinstitute/picard | Software to perform insert size distribution analysis |
Cutadapt | NBIS | https://cutadapt.readthedocs.io/en/stable/index.html | Software to perform adapter trimming |
Deeptoolsv3.5.1 | Max Planck Institute | https://deeptools.readthedocs.io/en/develop/index.html | Software to perform Pearson coefficient correlation analysis, Principal component analysis, and Heatmap/average plot analysis |
FastQC Version 0.12.0 | Babraham Bioinformatics | https://github.com/s-andrews/FastQC | Software to check quality of fastq file |
Intervenev0.6.1 | Computational Biology & Gene regulation - Mathelier group | https://intervene.readthedocs.io/en/latest/index.html | Software to perform venn diagram analysis using peak files |
MACSv2.2.9.1 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/macs_v2 | Software to call peaks |
MACSv3.0.2 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/master | Software to call peaks |
Samtools-1.21 | Wellcome Sanger Institute | https://github.com/samtools/samtools | Software to process sam/bam files |
SEACRv1.3 | Howard Hughes Medial institute | https://github.com/FredHutch/SEACR | Software to call peaks |
SRA Toolkit Release 3.1.1 | NCBI | https://github.com/ncbi/sra-tools | Software to download SRR from GEO |
Trim_Galore v0.6.10 | Babraham Bioinformatics | https://github.com/FelixKrueger/TrimGalore | Software to perform quality and atapter trimming |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır