JoVE Logo

로그인

JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

이 프로토콜의 목적은 RNA 염기서열 분석 데이터를 사용하여 후보 유전자의 진화 와 발현을 조사하는 것이다.

초록

전체 게놈 또는 전사 데이터와 같은 대규모 데이터 집합을 증류하고 보고하는 것은 종종 어려운 작업입니다. 결과를 분해하는 한 가지 방법은 유기체와 연구에 중요한 하나 이상의 유전자 가족에 집중하는 것입니다. 이 프로토콜에서, 우리는 생물학적 단계를 설명하고 필로겐을 생성하고 관심있는 유전자의 표현을 정량화합니다. 필로유전학 나무는 유전자가 종 안팎에서 어떻게 진화하고 있는지, 그리고 종이학을 드러내는지에 대한 통찰력을 제공할 수 있습니다. 이러한 결과는 RNA-seq 데이터를 사용하여 상이한 개인 또는 조직에서 이러한 유전자의 발현을 비교하는 것으로 향상될 수 있다. 분자 진화와 발현의 연구는 종 사이 유전자 기능의 진화 그리고 보존의 모드를 밝힐 수 있습니다. 유전자 가족의 특성화는 미래 연구를 위한 발판으로 봉사할 수 있고 새로운 게놈 또는 전사 종이에 있는 중요한 유전자 가족을 강조할 수 있습니다.

서문

시퀀싱 기술의 발전은 비모델 유기체의 게놈 및 전사의 시퀀싱을 용이하게 했습니다. 많은 유기체에서 DNA와 RNA를 시퀀싱하는 것의 증가된 타당성 이외에, 관심 있는 유전자를 연구하기 위하여 데이터의 풍부가 공개적으로 유효합니다. 이 프로토콜의 목적은 관심있는 유기체에서 중요한 역할을 할 수있는 유전자의 분자 진화 와 발현을 조사하기 위한 생물 정보 학적 단계를 제공하는 것입니다.

유전자 또는 유전자 가족의 진화를 조사하는 것은 생물학 시스템의 진화에 대한 통찰력을 제공할 수 있습니다. 유전자 가족의 구성원은 전형적으로 보존된 모티프 또는 동상적 유전자 서열을 식별하여 결정됩니다. 유전자 가족 진화는 이전에 먼 관련 모형 유기체1에서게놈을 사용하여 조사되었습니다. 이 접근에 제한은 이 유전자 가족이 밀접하게 관련된 종및 다른 환경 선택적인 압력의 역할에서 어떻게 발전하는지 명확하지 않다는 것입니다. 이 프로토콜에서는 밀접하게 관련된 종의 동종에 대한 검색이 포함됩니다. 필럼 수준에서 필로겐을 생성함으로써 보존 된 유전자 또는 혈통 별 복제와 같은 유전자 가족 진화의 동향을 주목할 수 있습니다. 이 수준에서, 우리는 또한 유전자가 정형 소또는 패러로그인지 여부를 조사할 수 있습니다. 많은 동형 모로그가 서로 유사하게 작동할 가능성이 있지만 반드시2는아닙니다. 이 연구 결과에 있는 phylogenetic 나무를 통합하는 것은 이 동종 유전자가 정형술인지 여부를 해결하는 것이 중요합니다. 진핵생물에서, 많은 정형술은 효모 정형술3의기능을 복원하는 포유류 단백질의 능력에 의해 입증된 바와 같이 세포 내에서 유사한 기능을 유지한다. 그러나, 비직교 유전자가 특징적인 기능4를수행하는 경우가 있다.

필로유전학 나무는 유전자와 종 사이의 관계를 묘사하기 시작하지만, 기능은 유전 적 관계에 따라 전적으로 할당 할 수 없습니다. 기능성 주석 및 농축 분석과 결합된 유전자 발현 연구는 유전자 기능에 대한 강력한 지원을 제공합니다. 유전자 발현이 개인 또는 조직 모형을 통해 정량화되고 비교될 수 있는 케이스는 잠재적인 기능의 더 많은 말하기일 수 있습니다. 다음 프로토콜은 히드라 저속가스7에서opsin 유전자를 조사하는 데 사용되는 방법을 따르지만 모든 종 및 유전자 패밀리에 적용 될 수 있습니다. 이러한 연구의 결과는 비 모델 유기체에서 유전자 기능 및 유전자 네트워크에 대한 추가 조사를위한 기초를 제공합니다. 예를 들어, 광유도 캐스케이드를 시작하는 단백질인 opsins의 물리학에 대한 조사는 눈과 광 검출8,9,10,11의진화에 대한맥락을제공한다. 이 경우, 비모델 유기체는 특히 cnidarians 또는 ctenophores와 같은 기저 동물 종은12,13,14에걸쳐 광반유도 캐스케이드 및 시력의 보존 또는 변화를 해명할 수 있다. 유사하 게, 다른 유전자 가족의 phylogeny, 발현 및 네트워크를 결정 하는 것은 분자 메커니즘 기본 적응에 대해 알려 줄 것 이다.

프로토콜

이 프로토콜은 UC 어바인 동물 관리 지침을 따릅니다.

1. RNA-seq 라이브러리 준비

  1. RNA를 다음과 같은 방법을 사용하여 분리한다.
    1. 샘플을 수집합니다. RNA를 나중에 추출하는 경우, RNA 저장용액(15)에 시료 또는 배치를동결한다(재료의 표).
    2. 관심 있는 조직을 분리하기 위해 유기체를 안락사시키고 해부한다.
    3. 추출 키트를 사용하여 총 RNA를 추출하고 RNA 정화 키트(재료 표)를 사용하여RNA를 정화합니다.
      참고 : 다른 종 및 조직 유형16,17에더 잘 작동 할 수있는 프로토콜과 키트가 있습니다. 우리는 나비18과 젤라틴 히드라19의 다른 신체 조직에서 RNA를 추출했습니다 (토론 참조).
    4. 각 시료의 RNA의 농도 및 품질을측정한다(재료표). RNA 무결성 번호(RIN)가 8보다 높은 샘플을 사용하여 이상적으로 는 920에 가깝고 cDNA 라이브러리를 구성합니다.
  2. 다음과 같이 cDNA 라이브러리 및 서열을 구성합니다.
    1. 라이브러리 준비 지침 설명서에 따라 cDNA 라이브러리를 빌드합니다(토론 참조).
    2. cDNA 농도 및품질(재료 표)을결정합니다.
    3. 라이브러리를 멀티플렉스하고 시퀀스합니다.

2. 컴퓨터 클러스터에 액세스

참고 : RNA- seq 분석은 대용량 파일의 조작이 필요하며 컴퓨터 클러스터(재료 표)에서수행하는 것이 가장 좋습니다.

  1. 터미널(Mac) 또는 PuTTY(Windows) 응용 프로그램 창에서 명령 ssh username@clusterlocation 사용하여 컴퓨터 클러스터 계정에 로그인합니다.

3. RNA-seq 읽기 받기

  1. RNA-seq는 시퀀싱 시설에서 또는, 발행물에서 생성된 데이터의 경우, 증착된 데이터 리포지토리로부터(3.2 또는 3.3)을 얻습니다.
  2. ArrayExpress와 같은 리포지토리에서 데이터를 다운로드하려면 다음을 수행합니다.
    1. 가입 번호를 사용하여 사이트를 검색합니다.
    2. 데이터를 다운로드할 링크를 찾은 다음 왼쪽 단추를 클릭하고 링크 복사를선택합니다.
    3. 터미널 창에서 wget을 입력하고 붙여넣기 링크를 선택하여 분석을 위해 데이터를 디렉토리에 복사합니다.
  3. NCBI 짧은 읽기 아카이브 (SRA) 데이터를 다운로드하려면 다음 대체 단계를 따르십시오.
    1. 터미널 다운로드 SRA 툴킷 대 2.8.1 wget을사용하여.
      참고: 컴퓨터 클러스터에 프로그램을 다운로드하고 설치하려면 루트 액세스가 필요할 수 있으며 설치가 실패할 경우 컴퓨터 클러스터 관리자에게 문의해야 합니다.
    2. 타르 -xvf $TARGZFILE입력하여 프로그램 설치를 완료합니다.
    3. 다운로드할 샘플에 대한 SRA 가입 번호에 대한 NCBI를 검색하면 SRRXXX형식이 있어야 합니다.
    4. 말단 창에 [스툴킷 위치]/빈/프리페치 SRRXXXXXX를 입력하여 RNA-seq 데이터를 가져옵니다.
    5. 페어링 형 파일 유형 [스툴킷 위치]/빈/fastq-dump --분할 파일 SRRXXXXXX는 두 개의 fastq 파일(SRRXXXXXX_1.FASTQ 및 SRRXXXXXX_2.FASTQ)을 가져옵니다.
      참고 : 트리니티 드 노보 어셈블리를 수행하려면 명령 [sratoolkit 위치]/빈 /fastq-덤프 --defline-seq '@$sn[_$rn]/$ri'를 사용하입니다 .

4. 어댑터 및 낮은 품질 읽기 를 트림 (선택 사항)

  1. 컴퓨팅 클러스터에 Trimmomatic21 대 0.35를 설치하거나 로드합니다.
  2. RNA-seq 데이터 파일이 있는 디렉토리에서 트리모틱 항아리 파일, 입력 FASTQ 파일, 출력 FASTQ 파일 및 읽기 길이 및 품질과 같은 선택적 매개 변수를 포함하는 명령을 입력합니다.
    참고: 명령은 읽기의 원시 및 원하는 품질과 길이에 따라 달라집니다. 일루미나 43 bp넥테라 프라이머와 함께 읽기의 경우 자바 -jar /데이터 /앱 / 트리모매틱 / 0.35 / 트리모매틱 - 0.35.jar PE $READ 1을 사용했습니다. FASTQ $READ 2. fastQ paired_READ1. FASTQ unpaired_READ1. FASTQ paired_READ2. FASTQ unpaired_READ2. FASTQ 일루미나클립:어댑터.fa:2:30:10 선두:20 [20] 슬라이딩윈도우:4:17 MINLEN:30.

5. 참조 어셈블리 획득

  1. 구글, 엔셈블게놈, NCBI 게놈 및 뉴클레오티드 TSA(스태레코메 산탄총 조립)를 검색하여 관심 종에 대한 참조 게놈 또는 조립된 전사체(그림1)를검색한다.
    참고: 기준 게놈 또는 전사가 제공되지 않거나 품질이 낮은 경우 6단계로 진행하여 드 노보 어셈블리를 생성합니다.
  2. 참조 게놈 또는 조립된 전사가 존재하는 경우 아래 단계에 따라 분석이 수행될 위치에 대한 fasta 파일로 다운로드하십시오.
    1. 게놈을 다운로드할 수 있는 링크를 찾아 왼쪽 클릭 및 복사 링크를 클릭합니다.
    2. 터미널 창 에서 wget 및 붙여 넣기 링크 주소. 사용 가능한 경우 참조 게놈에 대한 GTF 파일 및 단백질 FASTA 파일을 복사합니다.

6. 드 노보 어셈블리 생성(5단계 대안)

  1. 고양이 *READ1을 입력하여 모든 샘플에 대한 RNA-seq READ1 및 READ2 패스트크 파일을 결합합니다. FASTQ > $all_READ1. FASTQ와 고양이 *READ2. FASTQ > all_READ2. 터미널 창에 FASTQ.
  2. 트리니티22 v.2.8.5를 컴퓨팅 클러스터에 설치하거나 로드합니다.
  3. 생성 및 단말입력하여 조립: 트리니티 --seqType fq --max_memory 20G --왼쪽 $all_READ1. FASTQ -- 오른쪽 $all_READ2. FASTQ.

7. 지도는 게놈 (7.1) 또는 드 노보 전사 (7.2)를 읽습니다.

  1. 맵은 STAR23 대 2.6.0c 및 RSEM24 대 1.3.0을 사용하여 기준 게놈을 읽습니다.
    1. 설치 또는 로드 STAR 대 2.6.0c. 및 RSEM 대 1.3.0 컴퓨팅 클러스터에.
    2. rsem 준비 참조를 입력하여 게놈을 $GENOME. GTF --스타 -p 16 $GENOME. FASTA $OUTPUT.
    3. 맵은 rsem 계산식 -p 16 -star-짝-끝 $READ 1을 입력하여 각 샘플에 대한 식을 읽고 계산합니다. FASTQ $READ 2. fastQ $INDEX $OUTPUT.
    4. mv RSEM.genes.결과 $sample.genes.결과를 사용하여 결과 파일의 이름을 설명하는 것으로 변경합니다.
    5. rsem 생성 데이터 매트릭스 *[유전자/isoforms.results] > $OUTPUT입력하여 모든 카운트의 매트릭스를 생성합니다.
  2. RSEM과 나비넥타이를 사용하여 트리니티 드 노보 어셈블리에 RNA-seq를 매핑합니다.
    1. 설치 또는 로드 트리니티22 v.2.8.5, 보우타이25 대 1.0.0, RSEM 대 1.3.0.
    2. 맵은 [trinity_location]/align_and_estimate_abundance.pl -prep-reference --성적증명서를 $TRINITY 입력하여 각 샘플에 대한 표현을 읽고 계산합니다. FASTA --seqType fq --왼쪽 $READ 1. FASTQ --오른쪽 $READ 2. FASTQ --est_method RSEM --aln_method 나비 넥타이 --trinity_mode -output_dir $OUTPUT.
    3. mv RSEM.genes.결과 $sample.genes.결과를 사용하여 결과 파일의 이름을 설명하는 것으로 변경합니다.
    4. [trinity_location]/abundance_estimates_to_matrix.pl 입력하여 모든 카운트의 매트릭스를 생성합니다 --est_method RSEM *[유전자/isoforms].결과

8. 관심 유전자 식별

참고: 다음 단계는 뉴클레오티드 또는 단백질 FASTA 파일로 수행할 수 있지만 가장 잘 작동하며 단백질 서열로 더 간단합니다. 단백질을 단백질에 이용한 BLAST 검색은 다른 종 사이에서 검색할 때 결과를 줄 가능성이 높습니다.

  1. 기준 게놈의 경우, STEP 5.2.2로부터의 단백질 FASTA 파일을 사용하거나 보조 물질을 참조하여 맞춤형 유전자 특징 GTF를 생성한다.
  2. 노보 전사의 경우 TransDecoder를 사용하여 단백질 FASTA를 생성합니다.
    1. 설치 또는 컴퓨터 cluser에 TransDecoder 대 5.5.0로드.
    2. [Transdecoder 위치]/TransDecoder.LongOrfs -t $TRINITY 입력하여 가장 긴 열린 판독 프레임 및 예측 펩티드 시퀀스를 찾습니다. FASTA.
  3. 밀접하게 관련된 종의 동종에 대한 NCBI 젠뱅크를 검색합니다.
    1. 인터넷 브라우저 창을 열고 https://www.ncbi.nlm.nih.gov/genbank/.
    2. 검색 바에 관심있는 유전자의 이름과 서열 또는 속 또는 필럼이 된 밀접하게 관련된 종의 이름. 검색 표시줄 왼쪽에서 단백질을 선택한 다음 검색을 클릭합니다.
    3. 보내기를 클릭하여 시퀀스를 추출한 다음 파일을 선택합니다. 형식 에서 FASTA를 선택한 다음 파일 만들기를 클릭합니다.
    4. 로컬 터미널 창에서 scp $FASTA username@clusterlocation:/$DIR 입력하여 FASTA 파일의 호모로그를 컴퓨터 클러스터로 이동하거나 FileZilla를 사용하여 컴퓨터 및 클러스터로 파일을 전송합니다.
  4. BLAST+26을사용하여 후보 유전자를 검색합니다.
    1. 컴퓨터 클러스터에 BLAST+ 대 2.8.1을 설치하거나 로드합니다.
    2. 컴퓨터 클러스터에서 [BLAST+ 위치]/마크블라스트드드-$PEP 입력하여 게놈 또는 전사 변환 단백질 FASTA에서 BLAST 데이터베이스를 만듭니다. FASTA -dbtype 프로트 아웃 $OUTPUT
    3. [BLAST+ 위치]/블래스트 -db $DATABASE -query $FASTA-evalue 1e-10-outfmt 6-max_target_seqs -out-out $OUTPUT입력하여 NCBI에서 동종 유전자 서열을 폭발시키는 것이 관심 있는 종의 데이터베이스로.
    4. 명령을 사용하여 출력 파일을 더 볼 수 있습니다. 관심 있는 종의 고유한 유전자 아이디를 새 텍스트 파일로 복사합니다.
    5. perl-ne 'if(/^>(\S+)/)$c)를 입력하여 후보 유전자의 시퀀스를 추출하십시오.txt $PEP {$1}$c}$i{$1}$c?인쇄:chomp;$i{$_}=1@ARGV$gene_id.txt $PEP. FASTA > $OUTPUT.
  5. 상호 BLAST를 사용하여 유전자 성서를 확인합니다.
    1. 인터넷 브라우저에서 https://blast.ncbi.nlm.nih.gov/Blast.cgi 이동합니다.
    2. 트블라스트를선택한 다음 후보 서열을 붙여 넣고 중복되지 않는 단백질 서열 데이터베이스를 선택하고 BLAST를 클릭합니다.
  6. 게놈 또는 전사학의 모든 유전자에 대한 추가 유전자를 유전자 온톨로지(GO) 용어로 표시합니다(토론 참조).
    1. 단백질 FASTA를 로컬 컴퓨터로 전송합니다.
    2. 다운로드 및 로컬 컴퓨터에 Blast2GO27,28,29 대 5.2를 설치합니다.
    3. Blast2GO를 열고 파일을클릭하고 로드로이동하여 시퀀스를로드하고 Fasta 파일로드 (fasta)를 클릭합니다. FASTA 파일을 선택하고 로드를클릭합니다.
    4. 폭발을 클릭, NCBI 폭발을선택하고 다음을클릭합니다 . 매개 변수를 편집하거나 다음을클릭하고 매개 변수를 편집하고 실행을 클릭하여 가장 유사한 유전자 설명을 찾습니다.
    5. 매핑을 클릭한 다음 실행을 클릭하여 유사한 단백질에 대한 유전자 온톨로지 주석을 검색합니다.
    6. 다음 인터프로를클릭하고 EMBL-EBI InterPro를선택하고 다음을 클릭합니다. 매개 변수를 편집하거나 다음을클릭하고 Run을 클릭하여 알려진 유전자 패밀리 및 도메인의 서명을 검색합니다.
    7. 파일을클릭하여 주석을 내보내고 내보내기를선택하고 내보내기 테이블을 클릭합니다. 찾아보기를클릭, 파일 이름을 클릭, 저장을클릭, 내보내기를클릭합니다 .
    8. 추가 후보 유전자를 식별하기 위해 관심있는 GO 용어에 대한 부기 표를 검색합니다. FASTA 파일에서 시퀀스를 추출합니다(STEP 8.4.5)

9. 물리 유전학 나무

  1. 다운로드 및 로컬 컴퓨터에 MEGA30 대 7.0.26을 설치합니다.
  2. 메가 열기, 정렬을클릭, 편집 / 정렬을클릭, 새로운 정렬 클릭 확인을 선택, 단백질을선택합니다.
  3. 정렬 창이 열리면 편집을클릭하고 파일에서 서열을 삽입하고 후보 유전자 및 가능한 동형 로그의 단백질 서열로 FASTA를 선택합니다.
  4. 모든 시퀀스를 선택합니다. 팔 기호를 찾아 그 위에 마우스를 가져가십시오. 그것은 근육31 알고리즘을 사용하여 정렬 시퀀스를 말해야한다. 팔 기호를 클릭한 다음 단백질 정렬을 클릭하여 서열을 정렬합니다. 매개 변수를 편집하거나 확인을 클릭하여 기본 매개 변수를 사용합니다.
  5. 수동 변경 내용을 시각적으로 검사하고 변경한 다음 정렬 창을 저장하고 닫습니다.
  6. 메인 메가 윈도우에서 모델을클릭하고 최고의 DNA / 단백질 모델 찾기 (ML)를클릭하고 정렬 파일을 선택하고 다음과 같은 해당 매개 변수를 선택하십시오 : 분석 : 모델 선택 (ML), 사용 트리 : 자동 (이웃 결합 트리), 통계 적 방법 : 최대 가능성, 대체 유형 : 아미노산, 갭 / 누락 된 데이터 처리 : 모든 사이트를 사용, 분기 사이트 필터 : 없음.
  7. 데이터에 가장 적합한 모델이 결정되면 기본 MEGA 창으로 이동합니다. 필로겐을 클릭하고 Contruct/테스트 최대 가능성 트리를 클릭한 다음 필요한 경우 정렬을 선택합니다. 트리에 대한 적절한 매개 변수를 선택 : 통계 방법 : 최대 가능성, 필로겐시험 : 100 복제와 부트 스트랩 방법, 대체 유형 : 아미노산, 모델 : Freqs와 LG. (+F), 사이트 간 요금: 감마 분산(G) 5개의 개별 감마 카테고리, 갭/누락 된 데이터 처리: 모든 사이트 사용, ML 휴리스틱 방법: 가장 가까운-이웃-교환(NNI).

10. TPM을 사용하여 유전자 발현을 시각화

  1. 트리니티의 경우 컴퓨터 클러스터에서 abundance_estimates_to_matrix.pl 실행되고 출력 중 하나가 행렬이어야하는 디렉터리로 이동합니다. TPM.not_cross_norm. 이 파일을 로컬 컴퓨터로 전송합니다.
    참고: 교차 샘플 정규화를 위한 보충 재질을 참조하십시오.
  2. 게놈 분석에서 TPM의 경우 아래 단계를 따릅니다.
    1. 컴퓨터 클러스터에서 RSEM 설치 위치로 이동합니다. scp rsem 생성 데이터 매트릭스 rsem 생성-TPM-matrix를입력하여 rsem 생성 데이터 행렬을 복사합니다. 나노를 사용하여 새 파일을 편집하고 TPM에 대해 "내 $offsite = 4"를 4에서 5로 변경하려면 이제 "내 $offsite = 5"를 읽어야합니다.
  3. RSEM 출력 파일 .genes.결과가 있는 디렉터리로 이동하여 이제 rsem 생성-TPM-매트릭스 *[유전자/isoforms.results] > $OUTPUT 사용하여 TPM 매트릭스를 생성합니다. 결과를 로컬 컴퓨터로 전송합니다.
  4. 결과를 ggplot2로 시각화합니다.
    1. 로컬 컴퓨터에 R v. 4.0.0 및 RStudio 대 1.2.1335를 다운로드합니다.
    2. 화면 오른쪽에 있는 RStudio열기는 패키지 탭으로 이동하여 설치를클릭합니다. ggplot2를 입력하고 설치를클릭합니다.
    3. TPM 테이블에서 데이터를 입력하여 읽는 R 스크립트 창에서<-read.table("$tpm.txt",헤더 = T)
    4. 그림 4와 유사한 막대 그래프의 경우 p<-ggplot() + geom_bar(aes(y=TPM, x=기호, 채우기=조직), 데이터=데이터, stat="ID")
      채우기 <-c("#d7191c",#fdae61", "#ffffbf", "#abd9e9", "#2c7bb6")
      p<-p+scale_fill_manual(값=채우기)
      p + 테마(axis.text.x = element_text(각도 = 90))

결과

위의 메서드는 그림 1에 요약되어 있으며 히드라 저속조직의 데이터 집합에 적용되었습니다. H. 저속한 은 또한 산호, 해파리, 바다 말미잘을 포함하는 phylum Cnidaria에 속하는 담수 무척추 동물입니다. H. 저속한 신진에 의해 무성을 재현할 수 있으며 양분 시 머리와 발을 재생할 수 있습니다. 이 연구에서는 히드라7에서opsin ?...

토론

이 프로토콜의 목적은 RNA-seq 데이터를 사용하여 유전자 가족을 특성화하기 위한 단계의 개요를 제공하는 것이다. 이러한 방법은 다양한 종 및 데이터 집합4,34,35에대해 작동하는 것으로 입증되었습니다. 여기에 설립 된 파이프 라인은 단순화되었으며 생물 정보학의 초보자가 뒤따를 만큼 쉬워야합니다. 프로토콜의 중요성은 ?...

공개

저자는 공개 할 것이 없습니다.

감사의 말

우리는 우리의 워크 플로우에 이러한 단계의 일부를 통합에 조언과 지침을 아드리아나 브리스코, 길 스미스, 라비 무라드와 Aline G. Rangel 감사합니다. 우리는 또한 원고에 대한 의견에 캐서린 윌리엄스, 엘리자베스 렙보아, 나타샤 Picciani에 감사드립니다. 이 작품은 A.M.M 의학 연구 펠로우십을 위한 조지 E. 휴이트 재단에 의해 부분적으로 지원되었습니다.

자료

NameCompanyCatalog NumberComments
Bioanalyzer-DNA kitAgilent5067-4626wet lab materials
Bioanalyzer-RNA kitAgilent5067-1513wet lab materials
BLAST+ v. 2.8.1On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC)On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0On computer cluster
Bowtie v. 1.0.0On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended)NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1On computer cluster
edgeR v. 3.26.8 (in R)In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0On computer cluster
Java v. 11.0.2On computer cluster
MEGA7 (on your PC)On local computer
https://www.megasoftware.net
MEGAX v. 0.1On local computer
https://www.megasoftware.net
NucleoSpin RNA II kitMacherey-Nagel740955.5wet lab materials
perl 5.30.3On computer cluster
pythonOn computer cluster
Qubit 2.0 FluorometerThermoFisherQ32866wet lab materials
R v.4.0.0On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlaterThermoFisherAM7021wet lab materials
RNeasy kitQiagen74104wet lab materials
RSEM v. 1.3.0Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3Computer software
SRA Toolkit v. 2.8.1On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0cOn computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4dOn computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzolThermoFisher15596018wet lab materials
TruSeq RNA Library Prep Kit v2IlluminaRS-122-2001wet lab materials
TURBO DNA-free KitThermoFisherAM1907wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

참고문헌

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

171

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유