Para empezar, descargue los archivos de datos de Alzheimer para la combinación de muestras y configure las rutas de datos, así como los nombres de las muestras. Importe las muestras descargadas y asígneles nombres específicos de género en los nombres de función. Usando la lista de funciones y Read10x, genere objetos Seurat para todas las muestras en un proceso por lotes y especifique los parámetros de las celdas mínimas a 3 y las características mínimas a 200.
Con la función RenameCells, agregue identificadores de muestra como prefijos a los códigos de barras de celda para conservarlos durante el proceso de fusión. Para el control de calidad, empleando la función PercentageFeatureSet, calcule las proporciones de genes de eritrocitos y ribosomas mitocondriales para cada célula. Almacene estas proporciones calculadas en los metadatos utilizando el operador de corchetes dobles para adjuntar esta información directamente a los metadatos de cada celda.
Utilizando la función de subconjunto, realice la filtración celular con los parámetros apropiados para ARN, mitocondrias, ribosomas y eritrocitos. Normalice los datos mediante la función NormalizeData. Con FindVariableFeatures, identifique las 2000 características de variable principales del conjunto de datos.
Utilice RunPCA para realizar análisis de componentes principales en los datos, conservando 50 componentes principales. Empleando la función ElbowPlot, genere un gráfico de codo para determinar el número óptimo de dimensiones para el análisis posterior. Teniendo en cuenta las primeras 50 dimensiones, seleccione los datos de escala para llevar todas las características a una escala comparable.
Con la función FindNeighbors, identifique a los vecinos más cercanos en función de 30 dimensiones y ejecute el algoritmo UMAP para reducir la dimensionalidad de los datos a 30 dimensiones. Seleccione la función DimPlot para visualizar los datos procesados con el parámetro de reducción establecido en UMAP en el grupo. por parámetros establecidos en la identidad original.
Usando la función SCTransform, normalice y estandarice los datos y aplique el algoritmo de armonía para integrar los datos restantes de un solo núcleo. Seleccione el ensayo SCT para la integración y establezca el número máximo de iteraciones de armonía en 20. A continuación, ejecute la función FindClusters y establezca el parámetro de resolución en 0,07 para identificar clústeres distintos dentro de los datos, al tiempo que emplea la función RunUMAP para reducir aún más la dimensionalidad de los datos y visualizar los clústeres en un espacio dimensional inferior.
Para la anotación del tipo de célula, identifique la heterogeneidad del grupo celular y clasifique el tipo de cada célula del grupo utilizando los genes marcadores expresados explícitamente. Presente varios tipos de células con visualización UMAP utilizando el paquete ggplot2, donde varios tipos de células se resaltan con diferentes códigos de color. Por último, calcula las proporciones de cada tipo de célula, estratificadas por sexo.
Utilizando este método, se identificaron las proporciones de cada tipo de célula dividida por género en los datos de 17 pacientes con enfermedad de Alzheimer masculinos y 17 femeninos. Las expresiones medias de los marcadores de tipo celular conocidos para cada tipo de célula glial se proyectaron en los gráficos UMAP para identificar las poblaciones celulares.