숙주 병원체 상호 작용을 조사하기 위한 고처리량 전사 분석 의정서에 오신 것을 환영합니다. 이 프로토콜은 다음 단계로 나뉩니다. 품질 관리는 낮은 품질의 판독을 필터링하고 또한 어댑터 서열 시퀀싱 및 주석을 제거하기 위해, 당신은 참조 게놈으로 판독을 매핑하고 유전자에 읽기를 주석해야합니다.
분화유전자를 정의하고 또한 공동 발현 모듈을 찾아낸 통계 및 공동 발현 분석. 잠재적 인 이상치 샘플을 찾기 위해 교란 분석의 분자 정도. 그리고 마지막으로, 기능 분석은 분화 유전자의 생물학적 기능을 결정한다.
이러한 파이프라인을 활용하는 모든 도구는 Linux 시스템에 사전 설치되었으며 Docker 컨테이너로 캡슐화되었습니다. 이러한 프로토콜을 활용하는 샘플은 PLOS 병원체에서 우리 그룹이 발행한 논문에서 파생되었습니다. 샘플은 치쿤구냐 바이러스에 감염된 20명의 건강한 사람들과 39명의 환자를 포함합니다.
혈액 샘플을 채취하였고, RNA 시퀀싱이 수행되었다. Windows 시스템에 Docker를 설치하려면 다음 단계를 수행해야 합니다. Docker의 공식 웹 페이지로 이동하여 시작 하기에서 클릭 합니다.
창에 대 한 Docker 데스크톱에 대 한 설치 프로그램을 찾을 수 있습니다. 파일을 다운로드합니다. 컴퓨터에 로컬로 설치합니다.
이 두 옵션이 표시되어 있는지 확인합니다. 프로그램을 설치한 후 이 프로토콜에 대한 Docker 이미지를 다운로드합니다. Windows 터미널로 이동합니다.
이미지를 다운로드하도록 명령을 실행합니다. 이미지를 다운로드한 후 Docker 데스크톱에서 파일을 볼 수 있으며 이 이미지에서 컨테이너를 시작할 수 있습니다. 라운드 버튼을 클릭한 후 원래 매개 변수 및 옵션을 확장하여 컨테이너 이름을 정의하고 로컬 컴퓨터의 폴더를 Docker 내부폴더와 연결해야 합니다.
그런 다음 Run을 클릭하여 컨테이너를 시작합니다. 그런 다음 Docker 내부의 Linux 시스템에 있는 터미널에 액세스할 수 있습니다. 배쉬 명령을 입력한 다음 이 프로토콜의 모든 명령을 실행할 수 있습니다.
먼저 이 프로토콜의 모든 도구를 사용할 수 있도록 소스를 실행해야 합니다. 디렉터리 스크립트에 액세스해야 합니다. 전사 분석을 수행하려면 먼저 기준 게놈을 다운로드해야 합니다.
이를 위해 다음 명령을 실행해야 합니다. 게놈이 다운로드된 후에는 유전자의 부조를 다운로드해야 합니다. 이렇게 하려면 다음 명령을 입력해야 합니다.
그런 다음 fastq 덤프를 구성해야 합니다. 이렇게 하면 예제의 시퀀싱 파일을 다운로드할 수 있습니다. 다음 명령을 입력한 후 탭 버튼을 사용하여 도구 옵션으로 이동하고 옵션 전류 디렉터리표시를 표시해야 합니다.
탭 단추를 사용하여 저장한 다음 확인합니다. 그런 다음 도구 fastq-덤프를 종료합니다. 이제 다음 명령을 입력하여 읽기 다운로드를 시작할 수 있습니다.
품질 관리는 순서읽기에서 오류의 확률로 구성되고 그래픽적으로 평가합니다. 이 단계에서어댑터와 같은 기술 시퀀스를 제거해야 합니다. 품질 관리 그래프를 생성하려면 FastQC 프로그램을 실행해야 합니다.
어댑터 시퀀스와 저품질 시퀀스를 제거하려면 다음 명령을 입력해야 합니다. 양질의 읽기를 통해 이제 판독을 참조 게놈으로 매핑해야 합니다. 매핑 후, 우리는 인간 유전자에 따라 유전자에 대해 고개를 불고 각 인간 유전자와 일치하는 읽기 수를 계산해야합니다.
첫 번째 단계는 다음 명령을 입력하여 기준 게놈을 인덱싱하는 것입니다. 그리고 우리는 이 명령을 입력하여 판독을 인간 게놈으로 매핑합니다. 그런 다음 읽기에 인가하는 스크립트를 실행해야 합니다.
매핑 및 별표 후, 다른 그룹에 비해 한 그룹에서 발현이 더 높거나 낮은 유전자를 찾는 것으로 구성된 차동 발현 분석을 수행할 수 있다. 차별화된 발현 유전자 또는 DEG를 식별하려면 명령을 따라 실행해야 합니다. 그런 다음 Docker에서 로컬 컴퓨터로 데이터 결과를 전송할 수 있습니다.
이를 위해 터미널로 이동하여 다음 명령을 입력하여 모든 결과를 로컬 폴더에 저장합니다. 나머지 분석을 수행하려면 디렉터리 데이터의 모든 파일을 로컬 컴퓨터의 디렉터리에 복사해야 합니다. 로컬 컴퓨터에서 Docker에서 데이터를 저장한 디렉터리를 볼 수 있습니다.
보시다시피 모든 라이브러리에 액세스할 수 있습니다. 품질 관리 보고서가 포함된 HTML 파일을 열 수도 있습니다. 또한 분화 유전자를 포함하는 디렉토리에 접근할 수 있다.
그리고이 디렉토리 안에, 당신은 당신이 건강한 대조군 대 Chikungunya 바이러스에 감염된 환자 대 다른 대 한 그룹에서 상류 또는 다운 규제되는 유전자를 볼 수있는 화산 플롯을 찾을 수 있습니다. 이 프로토콜의 나머지 모든 단계는 브라우저를 사용하여 웹 도구에서 실행될 것입니다. 먼저 CEMiTool로 시작해 봅시다.
브라우저로 이동하여 다음 주소를 입력합니다. CEMiTool은 사용자가 제공하는 식 데이터 집합의 공동 식 모듈을 식별합니다. 메인 페이지에서 메뉴로 이동하여 실행 버튼을 클릭할 수 있습니다.
이렇게 하면 식 파일을 업로드할 수 있는 새 페이지가 열립니다. 이 파일은 로컬 컴퓨터의 디렉터리 데이터에 있습니다. 세 개의 식 파일이 있고 CEMiTool에 사용할 파일은 정규화 호출 tmm입니다.
그런 다음 단백질-단백질 상호 작용을 포함하는 파일에 대해 동일한 것인 페노데이터 파일을 선택하고 마지막으로 유전자 세트 또는 경로를 포함하는 파일을 업로드해야 합니다. 유전자 세트 파일을 통해 CEMiTool은 각 공동 발현 모듈에 대한 농축 분석을 수행할 수 있습니다. 그런 다음 매개 변수 섹션을 확장하고 VST 적용을 클릭해야 합니다.
그 후, 당신은 단지 CEMiTool 실행을 클릭 할 수 있습니다. CEMiTool을 실행하면 12개의 공동 식 모듈이 식별된 것을 볼 수 있습니다. 여기를 클릭하면 이러한 분석의 모든 결과를 다운로드할 수 있습니다.
이 프로토콜에서 활용할 또 다른 도구는 민주당, 또는 동요의 분자 학위입니다. 그냥 브라우저 민주당.sysbio.tools에 입력합니다. 민주당은 잠재적 이상치뿐만 아니라 이 그룹에 비해 각 시료의 왜곡이 얼마나 혼란스럽는지 찾기 위해, 이 경우 건강한 대조군과 비교하여 각 시료의 분자 거리를 계산한다.
실행 페이지에서 단추를 클릭하고 파일을 선택하여 표현식 파일을 업로드할 수 있습니다. 그런 다음 페노데이터 파일을 업로드해야 합니다. 그런 다음 그룹 또는 클래스에 대한 정보가 포함된 열을 정의한 다음 해당 클래스 또는 그룹이 대조군에 해당하도록 정의해야 합니다.
그 후 민주당을 운영할 수 있습니다. 막대 그래프는 각 샘플에 대해 분자 정도의 섭동 점수를 막대로 표시하고 색상은 서로 다른 그룹을 나타냅니다. 그리고 상자 플롯은 각 점에 표시되는 동일한 결과를 시각화하는 또 다른 방법입니다.
기능 분석을 수행하기 위해 Enrichr 도구를 사용할 것입니다. 이를 위해, 당신은 차분하게 표현된 유전자의 목록을 선택해야, 위 또는 다운 규제, Enrichr 도구에서 입력 유전자 목록으로 사용. 탭이 다른 것을 볼 수 있습니다.
모든 결과를 로컬 컴퓨터에 다운로드할 수도 있습니다. 전사 분석을 위한 컴퓨터 환경이 Docker 플랫폼에 배치되었습니다. 이 방법을 사용하면 Linux 시스템에 대한 사전 경험이 없는 사용자가 터미널을 활용할 수 있습니다.
이 컨테이너에는 모든 분석에 필요한 데이터 집합 및 스크립트에 미리 정의된 폴더 구조가 있습니다. 파이프라인에서 사용자는 치쿤구냐 바이러스에 감염된 20명의 건강한 개인과 39명의 환자로부터 혈액 전사 데이터를 활용할 것입니다. 시퀀싱 플랫폼은 DNA 서열을 포함하는 FASTQ 파일 집합(즉)을 반환합니다.
각 뉴클레오티드 염기에 대한 판독 및 관련 품질. 프레드 품질 척도는 각 베이스에 대해 잘못된 판독의 가능성을 나타냅니다. 도구는 샘플에서 낮은 품질의 읽기를 식별하고 제거하고 매핑 판독의 확률을 높입니다.
이 단계에서, 매핑 모듈, 복구된 고품질 판독은 인간 참조 게놈에 맞추기 위한 입력으로 사용된다. CEMiTool은 공동 식 모듈을 식별하고 분석합니다. 동일한 모듈 내의 유전자는 공동 표현되며, 이는 데이터 세트의 샘플에서 유사한 표현 패턴을 나타낸다는 것을 의미합니다.
네트워크 분석은 가장 연결된 유전자, 즉 허브에 대한 정보를 제공합니다. 그 유전자의 이름은 네트워크에 표시됩니다.
노드의 크기는 연결 정도에 비례합니다. DEG 분석에서 얻은 결과는 화산 플롯에 요약되었습니다. 섭란의 분자 정도의 분석은 건강하고 감염된 개별에게서 혼란시료의 확인을 허용합니다.
민주당은 어떤 샘플이 잠재적인 생물학적 이상치라고 제안합니다. 이러한 샘플을 제거하면 다운스트림 결과에 영향을 미칩니다. AURA를 이용한 기능적 농축 분석은 농축기 도구를 사용하여 수행할 수 있습니다.
이 단계는 차별화적으로 표현된 몇몇 유전자의 일반적인 기능적인 역할을 드러냄으로써 결과를 해석하는 것을 돕습니다. 바 그래프에 나타난 생물학적 과정은 p-값 순위에 따라 상위 10개의 농축 유전자 세트입니다. 결론적으로, 이 프로토콜은 RNA-Seq 분석의 모든 단계를 다룹니다.
파이프라인은 Docker라는 비상업적 시스템으로 개발및 캡슐화되었습니다. 이미지에 과학계에 사용할 수 있습니다. 컨테이너 시스템으로 인해 모든 스크립트와 도구는 재현성을 보장하기 위해 동일한 특정 버전에 따라 사용됩니다.
또한, 생물정보학 분석의 일부는 무료 사용자 친화적 인 웹 도구를 통해 수행되었다.