Method Article
Dostarczono szczegółowy protokół metod analizy różnicowej ekspresji dla sekwencjonowania RNA: limma, EdgeR, DESeq2.
Sekwencjonowanie RNA (sekwencjonowanie RNA) jest jedną z najczęściej stosowanych technologii w transkryptomice, ponieważ może ujawnić związek między zmianami genetycznymi a złożonymi procesami biologicznymi i ma wielką wartość w diagnostyce, prognostyce i terapii nowotworów. Analiza różnicowa danych sekwencyjnych RNA ma kluczowe znaczenie dla identyfikacji nieprawidłowych transkrypcji, a limma, EdgeR i DESeq2 są skutecznymi narzędziami do analizy różnicowej. Jednak analiza różnicowa RNA-seq wymaga pewnych umiejętności posługiwania się językiem R i umiejętności wyboru odpowiedniej metody, której brakuje w programie edukacji medycznej.
Niniejszym udostępniamy szczegółowy protokół identyfikacji genów o zróżnicowanej ekspresji (DEG) między rakiem dróg żółciowych (CHOL) a normalnymi tkankami odpowiednio za pomocą limma, DESeq2 i EdgeR, a wyniki są pokazane na wykresach wulkanów i diagramach Venna. Trzy protokoły limma, DESeq2 i EdgeR są podobne, ale mają różne etapy w procesach analizy. Na przykład model liniowy jest używany do statystyk w limma, podczas gdy ujemny rozkład dwumianowy jest używany w edgeR i DESeq2. Dodatkowo, znormalizowane dane dotyczące liczby sekwencji RNA są niezbędne dla EdgeR i limma, ale nie są konieczne dla DESeq2.
Tutaj udostępniamy szczegółowy protokół dla trzech metod analizy różnicowej: limma, EdgeR i DESeq2. Wyniki tych trzech metod częściowo się pokrywają. Wszystkie trzy metody mają swoje zalety, a wybór metody zależy tylko od danych.
Sekwencjonowanie RNA (sekwencjonowanie RNA) jest jedną z najczęściej stosowanych technologii w transkryptomice, z wieloma zaletami (np. wysoką odtwarzalnością danych) i znacznie zwiększyła nasze zrozumienie funkcji i dynamiki złożonych procesów biologicznych1,2. Identyfikacja aberracyjnych transkryptów w różnych kontekstach biologicznych, które są również znane jako geny o zróżnicowanej ekspresji (DEC), jest kluczowym krokiem w analizie sekwencyjnej RNA. RNA-seq umożliwia dogłębne zrozumienie mechanizmów molekularnych i funkcji biologicznych związanych z patogenezą. Dlatego analiza różnicowa została uznana za cenną w diagnostyce, prognostyce i terapii nowotworów3,4,5. Obecnie opracowano więcej pakietów R/Bioconductor typu open source do analizy różnicowej ekspresji RNA-seq, w szczególności limma, DESeq2 i EdgeR1,6,7. Analiza różnicowa wymaga jednak pewnych umiejętności posługiwania się językiem R oraz umiejętności wyboru odpowiedniej metody, czego brakuje w programie nauczania edukacji medycznej.
W tym protokole, na podstawie danych dotyczących liczby sekwencyjnych RNA raka dróg żółciowych (CHOL) wyodrębnionych z Atlasu Genomu Raka (TCGA), trzy z najbardziej znanych metod (limma8, EdgeR9 i DESeq210) zostały przeprowadzone, odpowiednio, przez program R11 w celu identyfikacji stopni DEG między CHOL a normalnymi tkankami. Trzy protokoły limma, EdgeR i DESeq2 są podobne, ale mają różne etapy w procesach analizy. Na przykład znormalizowane dane dotyczące liczby sekwencji RNA są niezbędne dla EdgeR i limma8, 9, podczas gdy DESeq2 używa własnych rozbieżności bibliotecznych do poprawiania danych zamiast normalizacji10. Co więcej, edgeR jest szczególnie odpowiedni dla danych sekwencyjnych RNA, podczas gdy limma jest używana do mikromacierzy i sekwencji RNA. Model liniowy jest przyjmowany przez limma do oceny DEGs12, podczas gdy statystyki w edgeR są oparte na ujemnych rozkładach dwumianowych, w tym empirycznym oszacowaniu Bayesa, dokładnych testach, uogólnionych modelach liniowych i testach quasi-prawdopodobieństwa9.
Podsumowując, udostępniamy szczegółowe protokoły analizy różnicowej ekspresji RNA-seq za pomocą odpowiednio limma, DESeq2 i EdgeR. Odwołując się do tego artykułu, użytkownicy mogą łatwo przeprowadzić analizę różnicową RNA-seq i wybrać odpowiednie metody analizy różnicowej dla swoich danych.
Access restricted. Please log in or start a trial to view this content.
UWAGA: Otwórz program R-studio i załaduj plik R "DEGs.R", plik można pobrać z Dodatkowych plików/Skryptów.
1. Pobieranie i wstępne przetwarzanie danych
2. Analiza różnicowa wyrażeń za pomocą "limma"
3. Analiza różnicowa wyrażeń za pomocą "edgeR"
4. Analiza różnicowa wyrażeń za pomocą "DESeq2"
5. Diagram Venna
Access restricted. Please log in or start a trial to view this content.
Istnieją różne podejścia do wizualizacji wyników analizy różnicowej wyrażeń, wśród których szczególnie wykorzystywane są wykres wulkanu i diagram Venna. limma zidentyfikowała 3323 stopnie między CHOL a normalnymi tkankami za pomocą |logFC|≥2 i adj. P.Val <0,05 jako progi, wśród których 1880 było regulowanych w dół w tkankach CHOL, a 1443 było regulowanych w górę (Rysunek 1a). Tymczasem edgeR zidentyfikował 1578 DEG regulowanych w dół i 3121 DEG regulowanych w ...
Access restricted. Please log in or start a trial to view this content.
Obfite aberracyjne transkrypty w nowotworach można łatwo zidentyfikować za pomocą analizy różnicowej RNA-seq5. Jednak zastosowanie analizy różnicowej ekspresji RNA-seq jest często ograniczone, ponieważ wymaga pewnych umiejętności w zakresie języka R i zdolności do wyboru odpowiednich metod. Aby rozwiązać ten problem, przedstawiamy szczegółowe wprowadzenie do trzech najbardziej znanych metod (limma, EdgeR i DESeq2) oraz samouczki dotyczące stosowania analizy różnicowej wyraże?...
Access restricted. Please log in or start a trial to view this content.
Manuskrypt nie był wcześniej publikowany i nie jest brany pod uwagę do publikacji w innych miejscach. Wszyscy autorzy przyczynili się do powstania tego manuskryptu ze względu na ważne treści intelektualne oraz przeczytali i zatwierdzili ostateczną wersję rękopisu. Oświadczamy, że nie ma konfliktu interesów.
Ta praca była wspierana przez Narodową Fundację Nauk Przyrodniczych Chin (Grant nr 81860276) oraz Kluczowe Projekty Funduszu Specjalnego Narodowego Kluczowego Programu Badawczo-Rozwojowego (Grant nr 2018YFC1003200).
Access restricted. Please log in or start a trial to view this content.
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| R | wersja 3.6.2 | darmowe oprogramowanie | |
| Darmowe oprogramowanie | Rstudio |
Access restricted. Please log in or start a trial to view this content.
Request permission to reuse the text or figures of this JoVE article
Request Permission