Laden Sie zunächst die Alzheimer-Datendateien für das Zusammenführen von Stichproben herunter, und konfigurieren Sie die Datenpfade sowie die Beispielnamen. Importieren Sie die heruntergeladenen Beispiele, und weisen Sie ihnen unter den Funktionsnamen geschlechtsspezifische Namen zu. Generieren Sie mit den Funktionen list und Read10x Seurat-Objekte für alle Proben in einer Batch-Verarbeitungsweise und geben Sie die Parameter von mindestens 3 Zellen und minimalen Merkmalen auf 200 an.
Fügen Sie mit der Funktion "Zellen umbenennen" den Zellen-Barcodes Beispiel-IDs als Präfixe hinzu, um sie während des Zusammenführungsprozesses beizubehalten. Berechnen Sie zur Qualitätskontrolle mit der Funktion PercentageFeatureSet das mitochondriale Erythrozyten- und Ribosomen-Genverhältnis für jede Zelle. Speichern Sie diese berechneten Verhältnisse in den Metadaten, indem Sie den Operator mit doppelten eckigen Klammern verwenden, um diese Informationen direkt an die Metadaten der einzelnen Zellen anzuhängen.
Unter Verwendung der Teilmengenfunktion führen Sie die Zellfiltration mit den entsprechenden Parametern für RNA, Mitochondrien, Ribosomen und Erythrozyten durch. Normalisieren Sie die Daten mit der NormalizeData-Funktion. Identifizieren Sie mit FindVariableFeatures die 2000 wichtigsten variablen Features im Dataset.
Verwenden Sie RunPCA, um eine Analyse der Hauptkomponenten der Daten durchzuführen und dabei 50 Hauptkomponenten beizubehalten. Generieren Sie mit der Funktion EllbogenDiagramm ein Bogendiagramm, um die optimale Anzahl von Dimensionen für die nachfolgende Analyse zu bestimmen. Wählen Sie unter Berücksichtigung der ersten 50 Dimensionen Maßstabsdaten aus, um alle Features auf einen vergleichbaren Maßstab zu bringen.
Identifizieren Sie mit der Funktion FindNeighbors die nächsten Nachbarn basierend auf 30 Dimensionen, und führen Sie den UMAP-Algorithmus aus, um die Dimensionalität der Daten auf 30 Dimensionen zu reduzieren. Wählen Sie die DimPlot-Funktion, um die verarbeiteten Daten zu visualisieren, wobei der Reduktionsparameter in der Gruppe auf UMAP eingestellt ist. Nach Parametern, die auf Ursprüngliche Identität festgelegt sind.
Normalisieren und standardisieren Sie mit der SCTransform-Funktion die Daten und wenden Sie den Harmoniealgorithmus an, um die verbleibenden Einzelkerndaten zu integrieren. Wählen Sie den SCT-Assay für die Integration aus und legen Sie die maximale Anzahl von Harmonie-Iterationen auf 20 fest. Führen Sie dann die FindClusters-Funktion aus, und legen Sie den Auflösungsparameter auf 0,07 fest, um unterschiedliche Cluster in den Daten zu identifizieren, während Sie die RunUMAP-Funktion verwenden, um die Dimensionalität der Daten weiter zu reduzieren und die Cluster in einem niedrigerdimensionalen Raum zu visualisieren.
Für die Zelltyp-Annotation ist die zelluläre Clusterheterogenität zu identifizieren und der Typ jeder Clusterzelle anhand der explizit exprimierten Markergene zu klassifizieren. Präsentieren Sie verschiedene Zelltypen mit UMAP-Visualisierung unter Verwendung des ggplot2-Pakets, in dem verschiedene Zelltypen mit unterschiedlichen Farbcodes hervorgehoben werden. Berechnen Sie abschließend die Anteile der einzelnen Zelltypen, geschichtet nach Geschlecht.
Mit dieser Methode wurden die Anteile für jeden Zelltyp, aufgeteilt nach Geschlecht, in den Daten von 17 männlichen und 17 weiblichen Alzheimer-Patienten identifiziert. Die durchschnittliche Expression der bekannten Zelltypmarker für jeden Gliazelltyp wurde auf die UMAP-Diagramme projiziert, um die Zellpopulationen zu identifizieren.