DiCoExpress обеспечивает полный аористический анализ от контроля качества до совместного выражения. Выполняет дифференциальный анализ на основе контрастов внутри обобщенной линейной модели. Кроме того, он также может выполнять анализ обогащения по списку дифференциально экспрессированных генов и коэкспрессированных кластеров генов.
Основным преимуществом DiCoExpress является то, что его могут использовать такие же люди, как я, без каких-либо специальных знаний в области статистики или эфирного программирования. Это действительно помогает пользователю, не являющемуся специалистом, написать контраст, необходимый для дифференциального анализа экспрессии генов. Он также предоставляет графические выходные данные, иллюстрирующие результаты, готовые к публикации.
DiCoExpress не является инструментом, предназначенным для планирования. Он может быть использован для любого организма до тех пор, пока экспериментальный дизайн дополнен до двух биологических факторов. Кроме того, возможна конструкция мембраны с неравным количеством реплик между условиями.
Новичок должен обладать предварительными знаниями в R.Вы должны знать, как использовать функцию и определять обязательные и необязательные аргументы. Тогда критическим шагом является правильное предоставление файлов, содержащих экспериментальный дизайн. Для начала откройте сеанс R studio.
Задайте в каталоге шаблонные скрипты и откройте скрипт DCoExpress tutorial dot R. Загрузите функции DiCoExpress в сеанс R. Затем загрузите файлы данных в сеансе R и разделите файлы объектных данных на несколько объектов для удобного управления файлами.
Затем выберите стратегию среди условий NB или реплик NB и порог для фильтрации генов с низкой экспрессией. Укажите цвета группы и выберите метод нормализации. Затем выполните контроль качества.
Если данные сопряжены в соответствии с состоянием реплицируемого фактора, реплицируется как true, в противном случае — как false. Назначьте взаимодействие как истинное, чтобы рассмотреть взаимодействие между двумя биологическими факторами. В противном случае присвойте значение false, затем укажите статистическую модель и определите пороговое значение частоты ложного обнаружения.
Выполнение дифференциального анализа с последующим установлением порога для анализа обогащения и выполнением анализа обогащения дифференциально экспрессированных списков генов. Выберите списки DEG для сравнения. Укажите имя для сравнения списка и используйте то же имя для каталога, в котором будут сохранены выходные файлы.
Задайте для операции параметра объединение или пересечение, чтобы указать действие, которое должно быть выполнено в списках DEG, и сравните списки. Проводят анализ коэкспрессии с последующим проведением анализа обогащения кластеров коэкспрессии. И, наконец, сгенерируйте два лог-файла, содержащих всю необходимую информацию для воспроизведения анализа.
Общие нормализованные подсчеты на выборку должны быть одинаковыми при сравнении как внутри, так и между условиями. Нормализованные показатели экспрессии генов демонстрировали аналогичную медиану и дисперсию, как во внутренних, так и в интер-условиях. Для выявления потенциальных базовых структур данных были сгенерированы графики PCA.
Было отмечено четкое различие между методами лечения и кластеризация отсутствовала, что указывает на набор данных хорошего качества. Необработанные гистограммы pvalue были построены для оценки качества моделирования. Распределение необработанных значений было равномерным, с пиком в левой конечной части распределения, как и ожидалось.
Отсутствие пика на правой конечной стороне указывает на то, что статистическое моделирование кажется правильным. Был построен профиль экспрессии гена CIG62301.1 в каждом генотипе и состоянии. А также количество дифференциально экспрессированных генов вверх и вниз, также были построены для каждого тестируемого контраста.
Анализ совместной экспрессии проводился на объединении пяти списков DEG. Идентифицированный, напротив, ищет вариации ответа на лечение между генотипом один или два против других. Совместно экспрессированные гены для каждого идентифицированного кластера были напечатаны в отдельных текстовых файлах, и был построен профиль экспрессии генов.
С помощью DiCoExpress биологи получат анализ экспрессии генов, который является статистически обоснованным. Следующий шаг — сделать биологический смысл из этих результатов.