Nasz przepływ pracy umożliwia łatwą analizę złożonych zbiorów danych multiomicznych o różnych rozdzielczościach. Podejście to wyodrębnia główne wzorce wariantów, które są unikatowe lub współdzielone z określonymi typami danych, i agreguje je. Powstałe w ten sposób tak zwane czynniki można następnie powiązać z procesami molekularnymi i współzmiennymi klinicznymi lub technicznymi.
Nasza analiza była jedną z pierwszych, w której zastosowano model MOFA do danych multiomicznych i danych z pojedynczych komórek z wielu próbek. Co ważne, próbki te pochodziły z klinicznej kohorty pacjentów po zawale serca. Pozwoliło nam to zidentyfikować wielokomórkowe sygnatury immunologiczne, które są związane z wynikiem i stanem chorobowym.
W związku z tym zwiększa się dostępność zestawów danych jednokomórkowych i wieloomicznych, ale często cechy tych zestawów danych są analizowane tylko oddzielnie. Ogranicza to wgląd, ponieważ zwykle procesy biologiczne są wynikiem interakcji między wieloma cechami i typami komórek. Dzięki naszym protokołom użytkownicy mogą łatwo przeprowadzić zintegrowaną analizę całego zestawu danych i zidentyfikować te programy wielokomórkowe.
Uważamy, że zastosowanie tego protokołu do dodatkowych zestawów danych multiomicznych pozwoli uzyskać nowe informacje na temat innych chorób lub kontekstów. Spostrzeżenia te zostaną następnie wykorzystane w przyszłych badaniach biomarkerowych lub terapeutycznych. Zacznij od dodania wszystkich wejściowych zestawów danych multiomicznych do folderu input_data.
Tutaj zawierają dane od pacjentów ze stabilnymi, przewlekłymi i ostrymi zespołami wieńcowymi. Aby wstępnie przetworzyć dane, kliknij symbol folderu, a następnie kliknij dwukrotnie mofa_workflow, skrypty i konfiguracje, aby uzyskać dostęp do folderu konfiguracji. Kliknij dwukrotnie plik CSV Data_Configuration, aby go otworzyć.
W kolumnie wartość wprowadź ścieżki do folderów danych wejściowych i wyników. W kolumnie wartości nazwy konfiguracji określ nazwę, która ma zostać dodana jako rozszerzenie pliku dla wszystkich zapisanych plików. Aby zapisać zmiany, wybierz Plik i Zapisz plik CSV z menu u góry.
Następnie korzystając z menu nawigacyjnego po lewej stronie, kliknij skrypty, aby przejść do folderu skryptów. Kliknij dwukrotnie 00_Configuration_Update. ipynb, aby otworzyć notes inicjalizacji.
Aby uruchomić skrypt, kliknij przycisk Uruchom ponownie jądro i uruchom wszystkie komórki u góry, a następnie kliknij Uruchom ponownie w wyskakującym okienku. Aby przejść do folderu konfiguracji, kliknij dwukrotnie konfiguracje. Następnie kliknij dwukrotnie 1_Pre_Processing_SC_Data.
csv, aby otworzyć plik. Sprawdź automatycznie wypełnione wartości. Wybierz Plik i Zapisz plik CSV z menu u góry, aby zapisać zmiany.
Następnie użyj menu nawigacyjnego po lewej stronie i kliknij skrypty, aby przejść do folderu skryptów. Kliknij dwukrotnie 01_Prepare_Pseudobulk. ipynb, aby otworzyć notes.
Aby uruchomić skrypt, kliknij przycisk Uruchom ponownie jądro i uruchom wszystkie komórki u góry, a następnie kliknij Uruchom ponownie w wyskakującym okienku. Aby przejść do folderu ilustracji, kliknij dwukrotnie najpierw ilustracje, a następnie 01_figures. Otwórz nowo wygenerowany wykres FIG01_Amount_of_Cells przegląd.
Następnie zbadaj wykres, aby zidentyfikować klastry typów komórek z bardzo małą liczbą komórek w próbce. Zanotuj nazwy tych identyfikatorów klastrów, aby wykluczyć je w kolejnych krokach. Aby wrócić do folderu konfiguracji, kliknij kropki i kliknij dwukrotnie konfiguracje.
Następnie otwórz plik 02_Pre_Processing_Config_SC.csv. Dodaj wszystkie identyfikatory klastrów zidentyfikowane do wykluczenia w poprzednim kroku, oddzielając je przecinkami w kolumnie cell_type_exclusion. Aby zapisać zmiany, wybierz Plik i Zapisz plik CSV z menu u góry.
Teraz otwórz plik 02_Pre_Processing_Config. csv i dostosuj konfigurację przetwarzania wstępnego dla każdego zestawu danych dołączonego i przechowywanego w folderze wprowadzania danych. Dostosuj parametry w kolumnach zgodnie z potrzebami, w zależności od tego, które kroki przetwarzania wstępnego mają zostać zastosowane.
Zapisz zmiany, wybierając pozycję Plik i Zapisz plik CSV. Aby przejść do folderu skryptów, kliknij skrypty. Otwórz notes 02_Integrate_and_Normalize_Data_Sources.ipynb.
Kliknij przycisk Uruchom ponownie jądro i uruchom wszystkie komórki u góry, a następnie kliknij Uruchom ponownie w wyskakującym okienku. Następnie przejdź do wygenerowanego folderu 02_results. Kliknij symbol folderu, a następnie kliknij dwukrotnie wyniki i 02_results.
Sprawdź, czy zawiera plik 02_Combined_Data_Config_Name_INTEGRATED. csv zawierający połączony plik wejściowy wstępnie przetworzonych danych. Rozpocznij od przetworzonych i zharmonizowanych danych wejściowych, które zawierają pięć kolumn, typ identyfikatora próby, zestaw danych, zmienną i wartość.
Dane te zostaną wykorzystane w modelu MOFA. Następnie przejdź do Jupyter Lab i kliknij symbol folderu. Kliknij dwukrotnie mofa_workflow, a następnie skrypty i konfiguracje.
Otwórz plik 03_MOFA_Configs.csv. Wprowadź liczbę czynników, które mają zostać oszacowane w modelu MOFA, i dostosuj wartości w pliku, aby określić, czy ma być stosowane ważenie i skalowanie. Wybierz Plik i Zapisz plik CSV z menu u góry, aby zapisać zmiany.
Korzystając z menu nawigacyjnego po lewej stronie, przejdź do folderu skryptów, klikając skrypty. Następnie otwórz notes 03_Run_MOFA.ipynb. Kliknij przycisk Uruchom ponownie jądro i uruchom wszystkie komórki u góry, aby uruchomić skrypt, a następnie kliknij ponownie w wyskakującym okienku.
Aby przejść do folderu 03_figures, kliknij dwukrotnie rysunki, a następnie 03_Figures. Otwórz wygenerowany FIG03_Overview_Variance_Decomposition_MOFRA_ResultName wykresu i sprawdź wynik modelu. Przejdź do menu nawigacyjnego po lewej stronie.
Kliknij symbol folderu. Następnie kliknij dwukrotnie input_data, aby przejść do folderu input_data. Przeciągnij i upuść Przygotowane.
Plik CSV zawierający wszystkie metadane próbek, które mają być analizowane w połączeniu z wygenerowanym plikiem czynników do folderu input_data. Kliknij symbol folderu. Następnie kliknij dwukrotnie mofa_workflow, a następnie skrypty i konfiguracje, aby wrócić do folderu konfiguracji.
Otwórz plik 04_Factor_Analysis pliku CSV. W kolumnie wariantów numerycznych dodaj nazwy wszystkich kolumn numerycznych w przygotowanym przykładowym pliku CSV metadanych, które będą badane w odniesieniu do czynników MOFA, oddzielając je przecinkami. W kolumnie współzmiennych jakościowych dodaj nazwy wszystkich kolumn kategorii w przygotowanym przykładowym pliku CSV metadanych, które będą badane w odniesieniu do czynników MOFA, oddzielając je przecinkami.
Zapisz zmiany, wybierając Plik i Zapisz plik CSV z menu u góry. Następnie kliknij skrypty, aby przejść do folderu skryptów. Kliknij dwukrotnie notatnik 04_Downstream_Factor_Analysis.
ipynb, aby go otworzyć. Aby uruchomić skrypt, kliknij przycisk Uruchom ponownie jądro i uruchom wszystkie komórki u góry, a następnie kliknij Uruchom ponownie w wyskakującym okienku. Użyj menu nawigacyjnego po lewej stronie, aby przejść do folderu 04_figures, klikając dwukrotnie rysunki, a następnie 04_figures.
Aby otworzyć wygenerowane wykresy, kliknij je dwukrotnie i zbadaj czynniki pod kątem interesujących wzorców i skojarzeń.