Pour commencer, téléchargez les fichiers de données sur la maladie d’Alzheimer pour la fusion des échantillons, et configurez les chemins d’accès aux données ainsi que les noms des échantillons. Importez les échantillons téléchargés et attribuez-leur des noms spécifiques au genre sous les noms de fonction. À l’aide de la liste des fonctions et de Read10x, générez des objets Seurat pour tous les échantillons de manière à traitement par lots et spécifiez les paramètres des cellules minimales à 3 et des caractéristiques minimales à 200.
À l’aide de la fonction RenameCells, ajoutez des exemples d’ID en tant que préfixes aux codes-barres de cellule afin de les conserver pendant le processus de fusion. Pour le contrôle de la qualité, à l’aide de la fonction PercentageFeatureSet, calculez les rapports des gènes de l’érythrocyte mitochondrial et du ribosome pour chaque cellule. Stockez ces ratios calculés dans les métadonnées à l’aide de l’opérateur entre crochets doubles pour attacher ces informations directement aux métadonnées de chaque cellule.
En utilisant la fonction de sous-ensemble, effectuez la filtration cellulaire avec les paramètres appropriés pour l’ARN, les mitochondries, les ribosomes et les érythrocytes. Normalisez les données à l’aide de la fonction NormalizeData. À l’aide de FindVariableFeatures, identifiez les 2000 principales entités variables du jeu de données.
Utilisez RunPCA pour effectuer une analyse des composants principaux sur les données, en conservant 50 composants principaux. À l’aide de la fonction ElbowPlot, générez un graphique de coude pour déterminer le nombre optimal de dimensions pour l’analyse ultérieure. En tenant compte des 50 premières dimensions, sélectionnez les données d’échelle pour rassembler toutes les entités à une échelle comparable.
Avec la fonction FindNeighbors, identifiez les voisins les plus proches en fonction de 30 dimensions et exécutez l’algorithme UMAP pour réduire la dimensionnalité des données à 30 dimensions. Sélectionnez la fonction DimPlot pour visualiser les données traitées avec le paramètre de réduction défini sur UMAP dans le groupe. par des paramètres définis sur l’identité d’origine.
À l’aide de la fonction SCTransform, normalisez et standardisez les données et appliquez l’algorithme d’harmonie pour intégrer les données restantes des noyaux uniques. Sélectionnez le test SCT pour l’intégration et définissez le nombre maximal d’itérations d’harmonie sur 20. Exécutez ensuite la fonction FindClusters et définissez le paramètre de résolution sur 0,07 pour identifier les clusters distincts dans les données tout en utilisant la fonction RunUMAP pour réduire davantage la dimensionnalité des données et visualiser les clusters dans un espace de dimension inférieure.
Pour l’annotation du type de cellule, identifiez l’hétérogénéité du cluster cellulaire et classifiez le type de chaque cellule du cluster à l’aide des gènes marqueurs explicitement exprimés. Présentez différents types de cellules avec la visualisation UMAP à l’aide du package ggplot2, où différents types de cellules sont mis en évidence avec différents codes de couleur. Enfin, calculez les proportions de chaque type de cellule, stratifiées par sexe.
À l’aide de cette méthode, les proportions de chaque type de cellule ventilées par sexe ont été identifiées dans les données de 17 patients masculins et 17 patients féminins atteints de la maladie d’Alzheimer. Les expressions moyennes des marqueurs de type cellulaire connus pour chaque type de cellule gliale ont été projetées sur les graphiques UMAP afin d’identifier les populations cellulaires.