Per iniziare, scarica i file di dati sull'Alzheimer per l'unione dei campioni e configura i percorsi dei dati e i nomi dei campioni. Importare gli esempi scaricati e assegnare loro nomi specifici per genere sotto i nomi delle funzioni. Utilizzando l'elenco delle funzioni e Read10x, è possibile generare oggetti Seurat per tutti i campioni in modo batch e specificare i parametri delle celle minime a 3 e le caratteristiche minime a 200.
Con la funzione RenameCells, aggiungi ID campione come prefissi ai codici a barre delle celle per preservarli durante il processo di unione. Per il controllo di qualità, utilizzando la funzione PercentageFeatureSet, calcolare i rapporti tra i geni eritrocitari mitocondriali e ribosomi per ogni cellula. Archiviare questi rapporti calcolati nei metadati utilizzando l'operatore delle parentesi quadre doppie per allegare queste informazioni direttamente ai metadati di ogni cella.
Utilizzando la funzione del sottoinsieme, condurre la filtrazione cellulare con i parametri appropriati per RNA, mitocondri, ribosomi ed eritrociti. Normalizzare i dati utilizzando la funzione NormalizeData. Con FindVariableFeatures, identificare le prime 2000 funzionalità variabili nel set di dati.
Utilizza RunPCA per condurre l'analisi dei componenti principali sui dati, conservando 50 componenti principali. Utilizzando la funzione ElbowPlot, genera un grafico a gomito per determinare il numero ottimale di dimensioni per l'analisi successiva. Considerando le prime 50 dimensioni, selezionare i dati di scala per portare tutte le funzionalità su una scala comparabile.
Con la funzione FindNeighbors, è possibile identificare i vicini più vicini in base a 30 dimensioni ed eseguire l'algoritmo UMAP per ridurre la dimensionalità dei dati a 30 dimensioni. Selezionare la funzione DimPlot per visualizzare i dati elaborati con il parametro di riduzione impostato su UMAP nel gruppo. dai parametri impostati sull'identità originale.
Utilizzando la funzione SCTransform, normalizza e standardizza i dati e applica l'algoritmo di armonia per integrare i restanti dati dei singoli nuclei. Selezionare il test SCT per l'integrazione e impostare il numero massimo di iterazioni di armonia su 20. Eseguire quindi la funzione FindClusters e impostare il parametro di risoluzione su 0,07 per identificare cluster distinti all'interno dei dati, utilizzando la funzione RunUMAP per ridurre ulteriormente la dimensionalità dei dati e visualizzare i cluster in uno spazio dimensionale inferiore.
Per l'annotazione del tipo di cellula, identificare l'eterogeneità del cluster cellulare e classificare il tipo di ciascuna cellula del cluster utilizzando i geni marcatori espressi esplicitamente. Presenta vari tipi di cellule con la visualizzazione UMAP utilizzando il pacchetto ggplot2, in cui i vari tipi di cellule sono evidenziati con diversi codici colore. Infine, calcola le proporzioni di ciascun tipo di cellula, stratificate per genere.
Utilizzando questo metodo, le proporzioni per ciascun tipo di cellula suddivise per genere sono state identificate nei dati di 17 pazienti maschi e 17 femmine con malattia di Alzheimer. Le espressioni medie dei marcatori del tipo di cellula noti per ciascun tipo di cellula gliale sono state proiettate sui grafici UMAP per identificare le popolazioni cellulari.