DiCoExpress proporciona un análisis aoristo completo desde el control de calidad hasta la coexpresión. Realiza análisis diferenciales basados en contrastes dentro del modelo lineal generalizado. Además, también puede realizar un análisis de enriquecimiento en la lista de genes expresados diferencialmente y los grupos de genes coexpresados.
La principal ventaja de DiCoExpress es que puede ser utilizado por personas como yo, sin ningún conocimiento particular en estadísticas o programación aérea. Realmente ayuda a un usuario no especializado a escribir el contraste necesario para el análisis diferencial de expresión génica. También proporciona resultados gráficos que ilustran los resultados listos para su publicación.
DiCoExpress no es una herramienta dedicada al plan. Se puede utilizar para cualquier organismo, siempre y cuando el diseño experimental esté completo con hasta dos factores biológicos. Además, también es posible el diseño de una membrana con un número desigual de réplicas entre las condiciones.
Un principiante debe tener conocimientos preliminares en R.Debe saber cómo usar una función e identificar argumentos requeridos y opcionales. Luego, el paso crítico es proporcionar correctamente los archivos que contienen el y el diseño experimental. Para comenzar, abra la sesión de R studio.
Establezca el directorio en scripts de plantilla y abra el script punto R del tutorial de DiCoExpress. Cargue las funciones de DiCoExpress en la sesión de R. A continuación, cargue los archivos de datos en la sesión de R y divida los archivos de datos de objeto en varios objetos para manipular los archivos fácilmente.
A continuación, seleccione una estrategia entre las condiciones NB o las réplicas NB y un umbral para filtrar los genes de baja expresión. Especifique los colores del grupo y seleccione un método de normalización. A continuación, realice el control de calidad.
Si los datos se emparejan según el factor de replicación, el estado se replica como true, de lo contrario, state como false. Asigne la interacción como verdadera para considerar una interacción entre los dos factores biológicos. De lo contrario, asigne false, especifique el modelo estadístico y defina el umbral de la tasa de descubrimiento falso.
Realizar el análisis diferencial seguido de la fijación de un umbral para el análisis de enriquecimiento y la realización del análisis de enriquecimiento de las listas de genes expresados diferencialmente. Seleccione las listas DEG que desea comparar. Proporcione un nombre para la comparación de listas y utilice el mismo nombre para el directorio donde se guardarán los archivos de salida.
Establezca la operación de parámetro en unión o intersección para especificar la acción que se realizará en las listas DEG y compare las listas. Llevar a cabo un análisis de coexpresión seguido de la realización del análisis de enriquecimiento de los grupos de coexpresión. Y por último, generar dos archivos de registro que contengan toda la información necesaria para reproducir el análisis.
Los recuentos totales normalizados por muestra deben ser similares cuando se comparan las condiciones intra e inter. Los recuentos normalizados de expresión génica mostraron una mediana y varianza similares, tanto en condiciones intra como inter. Para identificar las posibles estructuras de datos subyacentes, se generaron gráficos PCA.
Se observó una distinción clara entre los tratamientos y la agrupación estuvo ausente, lo que indica un conjunto de datos de buena calidad. Los histogramas de valor bruto se trazaron para evaluar la calidad del modelado. La distribución de los valores brutos fue uniforme, con un pico en el extremo izquierdo de la distribución, como se esperaba.
La ausencia de un pico en el extremo derecho indica que el modelado estadístico parece correcto. Se trazó el perfil de expresión del gen CIG62301.1, en cada genotipo y condición. Además del número de genes expresados diferencialmente hacia arriba y hacia abajo, también se trazaron para cada contraste probado.
El análisis de co-expresión se realizó sobre la unión de cinco listas DEG. Identificados por el contrario, buscando la variación de la respuesta al tratamiento entre el genotipo uno o dos frente a otros. Los genes coexpresados para cada grupo identificado se imprimieron en archivos de texto individuales y se trazó el perfil de expresión de los genes.
Con DiCoExpress, los biólogos obtendrán análisis de expresión génica que son estadísticamente sólidos. El siguiente paso es tener sentido biológico, a partir de estos resultados.