DiCoExpress는 품질 관리에서 공동 발현에 이르기까지 완벽한 분석적 분석을 제공합니다. 일반화 선형 모델 내부의 대비를 기반으로 미분 분석을 수행합니다. 더욱이, 차등적으로 발현된 유전자 및 공동-발현된 유전자 클러스터의 리스트에 대한 농축 분석을 수행할 수도 있다.
DiCoExpress의 가장 큰 장점은 통계나 항공 프로그래밍에 대한 특별한 지식 없이도 저와 같은 사람들이 사용할 수 있다는 것입니다. 전문가가 아닌 사용자가 차등 유전자 발현 분석에 필요한 조영제를 작성하는 데 진정으로 도움이 됩니다. 또한 게시할 준비가 된 결과를 보여주는 그래픽 출력을 제공합니다.
DiCoExpress는 플랜 전용 도구가 아닙니다. 실험 설계가 최대 두 가지 생물학적 요인으로 완성되는 한 모든 유기체에 사용할 수 있습니다. 또한 조건 간에 반복실험 횟수가 같지 않은 멤브레인의 설계도 가능합니다.
초보자는 R에 대한 예비 지식이 있어야 합니다.함수를 사용하고 필수 및 선택적 인수를 식별하는 방법을 알아야 합니다. 그런 다음 중요한 단계는 및 실험 설계가 포함 된 파일을 올바르게 제공하는 것입니다. 시작하려면 R 스튜디오 세션을 엽니다.
디렉터리를 템플릿 스크립트로 설정하고 DiCoExpress 자습서 점 R 스크립트를 엽니다. R 세션에서 DiCoExpress 함수를 로드합니다. 그런 다음 R 세션에서 데이터 파일을로드하고 파일을 쉽게 조작 할 수 있도록 개체 데이터 파일을 여러 개체로 분할합니다.
다음으로, NB 조건 또는 NB 복제 중에서 전략을 선택하고 낮은 발현 유전자를 필터링하기 위한 임계값을 선택합니다. 그룹 색상을 지정하고 정규화 방법을 선택합니다. 그런 다음 품질 관리를 수행하십시오.
반복 요인 상태에 따라 데이터가 쌍을 이루면 true로 반복되고, 그렇지 않으면 false로 반복됩니다. 두 생물학적 요인 간의 상호 작용을 고려하기 위해 상호 작용을 true로 할당합니다. 그렇지 않으면 false를 할당한 다음 통계 모델을 지정하고 거짓 발견 비율의 임계값을 정의합니다.
감별 분석을 수행한 후 농축 분석을 위한 역치를 고정하고 차등적으로 발현된 유전자 목록의 농축 분석을 수행한다. 비교할 DEG 목록을 선택합니다. 목록 비교를 위한 이름을 제공하고 출력 파일이 저장될 디렉터리에 동일한 이름을 사용합니다.
DEG 목록에서 수행할 작업을 지정하기 위해 매개 변수 작업을 유니온 또는 교차로 설정하고 목록을 비교합니다. 공동발현 분석을 수행한 후 공동발현 클러스터의 농축 분석을 수행한다. 마지막으로 분석을 재현하는 데 필요한 모든 정보가 포함 된 두 개의 로그 파일을 생성합니다.
표본당 정규화된 총 카운트는 내부 조건과 사후 조건을 비교할 때 유사해야 합니다. 정규화된 유전자 발현 계수는 내부 및 내부 조건 모두에서 유사한 중앙값 및 분산을 나타냈다. 잠재적인 기본 데이터 구조를 식별하기 위해 PCA 플롯이 생성되었습니다.
처리 사이에 명확한 구분이 관찰되었고 클러스터링이 없었으며, 이는 양질의 데이터 세트를 나타냅니다. 원시 p값 히스토그램은 모델링의 품질을 평가하기 위해 플로팅되었습니다. 원시 pvalue의 분포는 균일했으며 예상대로 분포의 왼쪽 끝에 피크가 있었습니다.
오른쪽 끝에 피크가 없으면 통계 모델링이 올바른 것으로 보입니다. 모든 유전자형 및 조건에서 유전자 CIG62301.1의 발현 프로필을 플롯팅하였다. 상하 차등적으로 발현된 유전자의 수뿐만 아니라, 시험된 모든 조영제에 대해서도 플롯하였다.
공동 발현 분석은 5 개의 DEG 목록의 합집합에 대해 수행되었습니다. 대조적으로, 다른 유전자형에 대한 유전자형 1 또는 2 사이의 치료 반응 변화를 찾고 있습니다. 확인된 모든 클러스터에 대해 공동-발현된 유전자를 개별 텍스트 파일에 인쇄하고 유전자의 발현 프로필을 플롯하였다.
DiCoExpress를 통해 생물학자들은 통계적으로 건전한 유전자 발현 분석을 얻을 수 있습니다. 다음 단계는 이러한 결과에서 생물학적으로 의미가 있습니다.