이 프로토콜은 후보 유전자의 분자 진화와 발현을 조사하기 위한 생물정보학적 단계를 간략하게 설명합니다. 여기서 우리는 최소한의 생물 정보 학적 경험을 가진 사람이이 프로토콜을 통해 실행할 수 있도록 철저한 지침을 제공합니다. 이 파이프라인은 모든 유기체 및 유전자 패밀리에 적용될 수 있습니다.
생물 정보학을 할 때 한 가지 일반적인 문제는 쉘 스크립트가 실패하는 것입니다. 이 프로토콜을 시도할 때 최신 소프트웨어가 있는지 확인하고 오류 파일을 읽고 수동으로 주의 깊게 확인합니다. 시작하려면 터미널 또는 PuTTY 응용 프로그램 창에서 컴퓨터 클러스터 계정에 로그인합니다.
터미널에서 Wget을 사용하여 SRA Toolkit 버전 2.8.1을 다운로드한 다음 프로그램 설치를 완료합니다. 원하는 샘플에 대한 SRA 가입 번호에 대한 NCBI를 검색한 다음 말단 창에서 RNA 서열 데이터를 얻습니다. 페어링 된 끝 파일 유형에 대한 두 개의 FASTQ 파일을 가져옵니다.
참조 게놈이 존재하는 경우 온라인으로 참조 게놈을 찾으십시오. 참조 어셈블리를 얻으려면 터미널 창에 wget을 입력하고 링크 주소를 붙여 넣습니다. 사용 가능한 경우 참조 게놈에 대한 GTF 파일 및 단백질 FASTA 파일을 복사합니다.
게놈을 색인한 다음 각 샘플에 대한 표현을 읽고 계산합니다. 결과 파일의 이름을 설명된 것으로 변경하고 모든 카운트의 행렬을 생성합니다. 인터넷 브라우저 창을 열고 NCBI GenBank로 이동합니다.
검색 바에서관심 유전자의 이름과 시퀀스된 밀접한 관련이 있는 종의 이름을 입력합니다. 검색 모음 왼쪽에서 단백질을 선택한 다음 검색을 클릭합니다. 보내기를 클릭하여 시퀀스를 추출한 다음 파일을 선택합니다.
형식 에서 FASTA를 선택한 다음 파일 만들기를 클릭합니다. 로컬 터미널 창 또는 FileZilla를 사용하여 FASTA 파일의 호모로그 파일을 컴퓨터 클러스터로 이동합니다. 다음으로, BLAST+컴퓨터 클러스터를 사용하여 후보 유전자를 검색하고, 게놈 또는 전사 번역 단백질인 FASTA로부터 BLAST 데이터베이스를 만든다.
NCBI에서 관심 있는 종의 데이터베이스로 동종 유전자 서열을 폭발한 다음 명령을 사용하여 출력 파일을 더 봅니다. 관심 있는 종의 고유한 유전자 아이디를 새 텍스트 파일로 복사합니다. 후보 유전자의 서열을 추출합니다.
상호 BLAST를 사용하여 유전자 음표를 확인하려면 BLAST 로컬 정렬 검색 도구로 이동하여 BLASTP를 선택한 다음 후보 서열을 붙여 넣고 비중복 단백질 서열 데이터베이스를 선택하고 BLAST를 클릭합니다. MEGA를 열고 정렬을 클릭한 다음 정렬 빌드를 편집하고 새 정렬 만들기를 선택하고 확인을 클릭합니다. 단백질을 선택합니다. 정렬 창이 열리면 편집을 클릭합니다.
파일에서 서열을 삽입하고 후보 유전자및 가능한 동형 구형의 단백질 서열로 FASTA를 선택합니다. 모든 시퀀스를 선택합니다. 팔 기호를 찾아 그 위에 마우스를 가져가십시오.
그것은 근육 알고리즘을 사용하여 정렬 순서를 말해야한다. 팔 기호를 클릭한 다음 단백질 정렬을 클릭하여 서열 편집 매개 변수를 정렬하거나 확인을 클릭하여 기본 매개 변수를 사용합니다. 이 프로토콜은 식물 성 Cnidaria에 속하는 담수 무척추 동물인 히드라 저속한 조직에 적용되었습니다.
Opsin 유전자는 동물의 눈과 빛 발견의 진화에 대한 통찰력을 얻기 위해 조사되었다. H.vulgaris 및 기타 종의 opsin 관련 유전자에 대한 시퀀스는 NCBI GenBank에서 FASTA 파일로 추출되었다. opsin 유전자는 MEGA에 정렬되었다, 빛에 민감한 분자를 결합하는 데 필요한 보존 리신 아미노산을 누락 된 히드라 opsins을 식별 할 수 있도록.
히드라 저속가리스 및 기타 종의 opsin 서열을 사용하여 최대 가능성 트리가 생성되었습니다. 필로겐은 opsin 유전자가 cnidarians에 있는 혈통 특정 중복에 의해, 그리고 H.vulgaris에 있는 탠덤 중복에 의해 잠재적으로 진화하고 있다는 것을 건의합니다. 다음으로, opsin 유전자의 절대발현을 조사하기 위해 edgeR에서 차동 발현 분석을 수행했다.
하나 이상의 수술이 저포메에서 상류 조절되는지 여부를 결정하기 위해, 또는 머리, 몸 기둥대 가설의 쌍 현명한 비교, 신진 영역, 발 및 촉수가 수행되었다. 1, 774개의 녹취록이 가설과 신체 기둥 사이에 차별화된 것으로 나타났습니다. 다중 비교를 통해 위로 통제된 유전자는, Blast2GO에 있는 기능적인 농축이 수행되었습니다.
마지막으로, opsin 유전자의 절대적인 발현은 신진의 다른 단계 도중 및 재생의 다른 시간 점 도중 다른 조직에서 조사되었습니다. 정렬 및 트리의 육안 검사는 후보 유전자가 관심의 가족에 속하는지 여부를 확인합니다. 서열또는 다른 모든 것의 외부 단에서 너무 다른 유전자는 아마 다른 유전자 가족의 일부입니다.
이 프로토콜의 결과는 가설 생성으로 간주될 수 있습니다. 이 파이프라인은 향후 연구에서 기능적으로 공부할 후보 유전자를 강조할 수 있습니다. Hydra opsin 발현을 탐구한 후에, 우리는 지금 기능의 유사성 그리고 다름을 확인하기 위하여 종에 걸쳐 관련 유전자를 조사하기 위하여 유사한 기술을 사용하고 있습니다.