우리의 프로토콜은 공동 정화 시퀀스에서 분리 될 수없는 게놈 서열을 식별하는 데 사용할 수 있기 때문에 중요합니다. 이 기술의 주요 장점은 유연뿐만 아니라 다운로드 할 수있는 주로 무료 소프트웨어를 사용하여 저렴하다는 것입니다. 당신은 많은 생물학적 질문에 적용 할 수 있습니다.
잠재적인 응용 프로그램은 세균백신 표적을 식별하고 서열이 알려진 미생물과 매우 다른 바이러스를 식별하는 것을 포함합니다. 이 방법은 유전체 표적없이 기준 서열을 사용할 수 있는 한 알 수 없는 것을 실험적으로 분리할 수 없는 모든 시스템에 적용될 수 있다. 이 기술은 몇 가지 시행 착오를 소요, 그래서 인내심이 중요하다.
프로그램을 촬영하는 데 문제가 있을 수 있습니다. 여기에서 설명하는 프로그램과 다른 프로그램을 사용할 수 있습니다. 가능한 한 사용자 설명서를 사용합니다.
이 메서드의 시각적 데모는 계산 작업이 명령줄 프로그래밍의 구조화 방식에 대한 기본적인 이해에 따라 달라지므로 유용합니다. 먼저 Trimmomatic 0.32를 사용하여 일루미나 어댑터와 저품질 베이스를 제거합니다. Pear 버전 0.9.11을 사용하여 기본 매개 변수를 사용하여 트리모틱 출력 쌍 읽기에서 고품질 병합 된 읽기를 만듭니다.
그런 다음 파충류 버전 1.1을 사용하여 배를 통해 생성된 읽기를 수정합니다. 마지막으로 트리니티 버전 2.4.0을 기본 모드에서 사용하여 수정된 시퀀스를 조립합니다. 가닥 특정 라이브러리의 경우 SS_lib_type 매개 변수를 사용합니다.
출력은 trinity_output 라는 새 디렉토리에 배치될 FASTA 파일입니다. 참조 시퀀스의 BLAST 데이터베이스를 nucleotide_reference 합니다. 명령줄에서 fasta.
BLAST는 참조 데이터베이스에 조립된 쿼리와 일치합니다. 출력 파일을 얻으려면 BLAST_results 사용합니다. txt 파이썬 스크립트와 하위 시퀀스 처리 단계에 필요한 표 출력을 생성하려면, outfmt 6 증가 문자열을 사용, 뉴클레오티드 데이터베이스의 6 방향 번역을 수행하는 번역 뉴클레오티드 BLAST와 함께 BLAST 쿼리로 어셈블리에서 단백질 서열을 사용합니다.
쿼리에 대한 단백질 서열을 얻으려면 TransDecoder을 실행합니다. Long0rfs 명령은 조립된 쿼리 시퀀스에서 가장 긴 열린 읽기 프레임을 식별합니다. 이제 트블라스트를 실행합니다.
필요한 경우 적절한 코드 옵션을 사용하여 db_gencode 연구중인 유기체에 대해 올바른 유전 코드를 선택했는지 확인하십시오. 고품질 단백질 기준을 사용할 수 있는 경우, 단백질 기준의 BLAST 데이터베이스를 만드는 트래스트보다는 블래스트와 일치하는 단백질 단백질을 사용하십시오. 결과를 다운스트림 처리를 위한 파일로 저장하고 표 출력을 사용하여 Python 스크립트가 올바르게 구문 분석할 수 있는지 확인합니다.
이제 감산 파이썬 스크립트를 사용하여 일치하는 시퀀스를 제거합니다. 판독을 어셈블리에 매핑하려면 BWA-MEM 버전 0.7.12 또는 bowtie 2를 사용하여 다운로드한 원시 읽기를 쿼리 어셈블리에 매핑합니다. 먼저 어셈블리를 색인한 다음 읽기를 매핑합니다.
출력은 SAM 형식입니다. 파이썬 스크립트제거를 실행합니다. PY는 SAM 파일을 입력으로 사용합니다.
이렇게 하면 일치하는 읽기 없이 쿼리 시퀀스의 이름을 식별하고 새 텍스트 파일에 저장합니다. 이전 단계의 출력은 txt 파일의 시퀀스 이름 목록입니다. 이러한 시퀀스를 통해 FASTA 파일을 추출합니다.
출력은 fasta 파일이 됩니다. Genius를 사용하여 최적의 프라이머 시퀀스를 수동으로 결정합니다. 포워드 프라이머에 대해 21~28개의 베이스 쌍의 후보 순서를 강조하여 4개 이상의 베이스의 런을 피하십시오.
모든 기본 쌍의 상당히 균일한 조합으로 영역을 대상으로 시도합니다. 프라임 엔드 3개에서 하나의 G 또는 C가 유익하여 프라이머를 고정하는 데 도움이 됩니다. 화면 오른쪽에 있는 통계 탭을 클릭하여 후보 영역이 강조 표시될 때 해당 시퀀스의 예상 용융 온도를 확인합니다.
반복을 피하면서 섭씨 55도에서 60도 사이의 용융 온도를 목표로 하고, G C.의 긴 달리기는 150~250개의 기본 쌍이 포워드 프라이머의 3개의 프라임에 위치하여 동일한 방식으로 역프라이머를 선택합니다. 프라이머 길이가 일치할 필요는 없지만 예측된 용융 온도는 전방 프라이머의 온도에 최대한 가까워야 합니다. 메뉴 옵션에서 시퀀스가 강조 표시된 동안 Genius를 마우스 오른쪽 단추로 클릭하여 시퀀스를 다시 클릭해야 합니다.
다른 방법은 시퀀스 창의 상단 도구 모음에 있는 프라이머 디자인 함수를 사용하는 것입니다. 대상 영역 아래에 증폭하려면 영역을 삽입합니다. 특성 탭에서 원하는 크기, 용융 온도 및 %G C를 삽입한 다음 확인을 클릭하여 프라이머가 생성됩니다.
나머지 서열의 정량적인 PCR 유효성 검사를 수행하기 위해 먼저 SYBR 그린 마스터 믹스, 전방 및 역 프라이머 및 물과 함께 트리플리케이트의 각 템플릿에 대한 반응 혼합물을 준비하여 총 25 마이크로리터의 부피를 준비합니다. 이전에 검증된 온도 및 확장 시간으로 정보를 받은 qPCR 프로그램을 실행합니다. 최종 데칭 곡선은 단일 DNA 생성물의 증폭을 검증하기 위해 프라이머가 qPCR에 사용될 때 적어도 처음 생성되어야 한다.
모든 경우 Ct에 의해 Actin에 비해 qPCR SYBR 녹색 신호를 측정하고 액틴에 비해 Ct에 대한 평균 및 2의 표준 편차를 계산합니다. qPCR에 의해 올바른 제품 크기 검출을 확인하기 위해 엔드포인트 젤 전기 포전을 수행합니다. 여기서, 200볼트에서 200볼트에 2%의 TAE 아가로즈 젤에 6X 글리터올 염료 5개와 혼합된 qPCR 제품의 25마이크로리터를 200볼트로 실행한다.
qPCR에서 대상 시퀀스를 식별하지 않은 것으로 표시되면 온라인 데이터베이스에서 가져올 수 있는 새 참조로 전체 주기를 반복합니다. 이 경우 감산 프로젝트는 남성과 여성 성인 얼룩말 핀치의 세균 이늘어선 조직에서 RNA를 시퀀싱하는 것으로 시작되었습니다. 궁극적으로, 이전에 전체 게놈 별표에 포함되지 않은 935개의 체혈 유전자가 확인되었다.
계산 필터링 후 양적 PCR은 조류 조직 전반에 걸쳐 검출에 차이가 없는 부정적인 결과를 얻을 수 있습니다. 반대로, 게놈 DNA qPCR이 참조에 비해 관심 있는 조직에서 통계적으로 더 큰 검출을 보여 주면 진정한 표적 서열의 식별을 나타내는 양성 결과가 확인된다. 여기서, 알파 스냅 유전자는 Actin에 상응하는 수준이 존재하는 고환 DNA에 비해 체세포 조직에서 고갈되었기 때문에 세균성 제한으로 검증되었다.
각 계산 단계에서 올바른 입력을 사용하는 것이 중요합니다. 대상 서열 또는 시퀀스를 얻기 위해 주기 뺄셈을 여러 번 거쳐야 할 수 있습니다. 다양한 물리유전학, 구조적 및 기능적 분석은 발견된 유전자에서 수행될 수 있다.
이 추가 방법은 유전자의 진화적이고 기능적인 역할에 대한 통찰력을 제공합니다. 우리는 이 놀라운 게놈 요소에 대한 관심을 넓힌 생식선 제한 송버드 염색체에 첫번째 유전자를 확인했습니다. 후속 작업은 많은 추가 유전자를 포함하는 많은 송버드 종에서 유사한 염색체를 보여주었습니다.