Method Article
이 프로토콜은 오줌 박테리아의 배양, 시퀀싱 및 드 노보 하이브리드 게놈 조립에 대한 포괄적 인 접근 방식을 자세히 설명합니다. 그것은 오줌 식민지, 병기 발생 및 항균 저항 보급에 기여하는 염색체 및 외염색체 유전 요소 둘 다 공부에 유용한 완전하고 원형 게놈 서열의 생성을 위한 재현 가능한 절차를 제공합니다.
완전한 게놈 서열은 유전적 다양성과 오줌 미생물의 독특한 식민지 요인에 대한 이해를 위한 귀중한 데이터를 제공합니다. 이러한 데이터는 플라스미드 및 외염색체 파지와 같은 이동식 유전 적 원소를 포함할 수 있으며, 이는 항균 저항의 보급에 기여하고 요로 감염 (UTI)의 치료를 더욱 복잡하게 합니다. 게놈 구조의 미세한 분해능을 제공하는 것 외에도, 완전하고 폐쇄된 게놈은 상세한 비교 유전체학 및 진화 분석을 가능하게 합니다. 완전한 게놈 드 노보의 생성은 사용 가능한 시퀀싱 기술의 한계로 인해 오랫동안 도전적인 작업이었습니다. 페어링 엔드 차세대 염기서열 분석(NGS)은 고품질의 짧은 판독을 생성하여 정확하지만 단편화된 게놈 어셈블리를 생성합니다. 반대로, 나노포어 시퀀싱은 일반적으로 오류가 발생하기 쉬운 완전한 어셈블리로 이어지는 낮은 품질의 긴 판독을 제공합니다. 이러한 오류는 게놈 전체 협회 연구를 방해하거나 오해의 소지가 있는 변형 분석 결과를 제공할 수 있습니다. 따라서 짧고 긴 판독을 모두 결합한 하이브리드 접근법은 매우 정확한 폐쇄세균 게놈을 달성하기 위한 신뢰할 수 있는 방법으로 부상했습니다. 본 명세서에서 보고된 다양한 오줌 박테리아의 배양, 종 식별에 의한 16S rRNA 유전자 시퀀싱, 게놈 DNA(gDNA)의 추출, NGS 및 나노포어 플랫폼에 의한 짧고 긴 판독의 생성이 각각 이다. 또한,이 방법은 추가로, 추가된 완전한 게놈 서열의 생성을 위한 품질 관리, 조립 및 유전자 예측 알고리즘의 생물포계 파이프라인을 기술합니다. 생물 정보 도구의 조합은 하이브리드 게놈 조립 및 다운스트림 분석을위한 고품질 읽기 데이터의 선택을 가능하게합니다. 이 프로토콜에 기재된 하이브리드 드 노보 게놈 어셈블리에 대한 간소화된 접근법은 임의의 컬투성 박테리아에서의 사용을 위해 적응될 수 있다.
요로 미생물군유전체는 요로가 건강한 개인에게 멸균된다는 수십 년 의 긴 오해를 산산조각 난 연구의 신흥 영역입니다. 요로 미생물의 구성원은 요로 환경의 균형을 맞추고 요로 감염 (UTI)1,2를예방하는 역할을 할 수 있습니다. 비뇨기증 균은 요로를 침범하고 상주 미생물을 대체하고, 비뇨기과를 식민지화하고, 면역 반응을 회피하고, 환경 압력에 중화하기 위해 다양한 독성 메커니즘을사용한다 3,4. 소변은 높은 진동, 제한된 질소 및 탄수화물 가용성, 낮은 산소, 낮은 pH5,6,7을특징으로 상대적으로 영양 제한 매체이다. 소변은 또한 항균제로 간주되며, 인체 카플리시딘 LL-378과같은 억제 우레아 및 항균 펩티드의 고농도로 구성된다. 요로를 식민지화하기 위해 상주 박테리아와 비뇨기과 물질 모두에 의해 채택된 기계장치를 조사하는 것은 요로 건강을 더 이해하고 UTI 처리를 위한 새로운 전략을 개발하는 것이 중요합니다. 더욱이, 일선 항균요법의 실패가 보편화됨에 따라, 오줌박테리아의 집단 내에서 항균저항 결정제를 운반하는 이동식 유전적 원소의 보급을 감시하는 것이 점점 더 중요해지고 있다9,10.
요로 박테리아의 유전자형 과 표현형을 조사하기 위해 성공적인 배양과 후속 전체 게놈 시퀀싱 (WGS)이 필수적입니다. 배양의존적 방법은 소변샘플(11)에서가능한 미생물을 검출하고 식별하는 데 필요하다. 표준 임상 소변 배양은 소변을 5% 양 혈액 한천(BAP)과 맥콩키 한천에 도금하고 24h12에대해 35°C에서 항공적으로 배양하는 것을 포함한다. 그러나, ≥105 CFU/mL13의검출 임계값을 가진, 오줌 microbiota의 많은 구성원은 이 방법에 의해 보고되지 않습니다. 향상된 정량소변 배양(EQUC)(11)와 같은 향상된 배양 기술은 표준 소변 문화에 의해 일반적으로 놓친 미생물을 확인하기 위하여 다른 소변 볼륨, 잠복기, 배양 매체 및 대기 조건의 각종 조합을 채택합니다. 본 프로토콜에 기재된 EQUC의 수정된 버전은, 여기에 변형된 향상된 소변 배양 프로토콜이라고 불리는, 선택적 배지와 최적의 대기 조건을 사용하여 다양한 오줌 박테리아와 비뇨기병균을 배양할 수 있지만 본질적으로 정량적이지는 않습니다. 오줌 박테리아의 성공적인 격리는 하류 WGS 및 게놈 조립을 위한 게놈 DNA (gDNA)의 추출을 가능하게 합니다.
게놈 어셈블리, 특히 완전한 어셈블리는, 상주 미생물과 비뇨기과 박테리아 둘 다 중 식민지화, 틈새 유지 보수 및 독성에 기여할 수 있는 유전 적 요인의 발견을 가능하게 합니다. 초안 게놈 어셈블리에는 시퀀싱 오류및 방향 정보가 부족할 수 있는 다양한 수의 연속 서열(연속)이 포함되어 있습니다. 완전한 게놈 어셈블리에서 모든 베이스 쌍의 방향과 정확도가모두 14로확인되었습니다. 더욱이, 완전한 게놈 서열을 얻는 것은 게놈 구조, 유전적 다양성 및 이동성 유전원15에대한 통찰력을 제공한다. 짧은 읽기만으로는 중요한 유전자의 존재 또는 부재를 식별할 수 있지만 그들의 게놈컨텍스트(16)를정확히 찾아낼 수는 없다. 옥스포드 나노포어 및 PacBio와 같은 장시간 읽은 시퀀싱 기술을 가능하게 함으로써, 세균 게놈의 폐쇄 드 노보 어셈블리를 생성하면 더 이상 멀티플렉스 PCR17,18에의한 드 노보 어셈블리의 수동 폐쇄와 같은 격렬한 방법이 필요하지 않다. 차세대 단기 판독 시퀀싱 과 나노포어 장기 읽기 시퀀싱 기술의 조합은 상대적으로 저렴한비용으로정확하고 완전하며 폐쇄된 세균 게놈 어셈블리의 촉진 생성을 허용한다. 짧은 읽기 시퀀싱은 일반적으로 평균 40-100 개의 연속으로 구성된 정확하면서도 단편화된 게놈 어셈블리를 생성하며, Nanopore 시퀀싱은 정확도가 낮지만 연통에 가입하고 유전체 시니를 해결하는 스캐폴드로 작용할 수 있는 길이약 5-100 kb의 긴 판독을 생성합니다. 짧은 읽기 및 긴 읽기 기술을 모두 활용하는 하이브리드 접근 방식은 정확하고 완전한 세균 게놈19를생성할 수 있습니다.
여기에 설명된 것은 하이브리드 어셈블리 접근법을 이용한 인간 소변, 게놈 추출, 시퀀싱 및 완전한 게놈 조립으로부터 박테리아의 격리 및 식별을 위한 포괄적인 프로토콜이다. 이 프로토콜은 플라스미드와 같은 폐쇄된 세균 염색체 및 초염색체 원소의 정확한 조립을 위해 짧은 읽기 및 긴 읽기 시퀀싱으로 생성된 읽기를 올바르게 수정하는 데 필요한 단계에 중점을 둡니다.
박테리아는 기관 검토 위원회 승인 연구의 일환으로 동의 여성에서 수집 소변에서 배양 되었다 19MR0011 (UTD) 및 STU 032016-006 (UTSW).
1. 수정 된 강화 된 소변 문화
참고: 모든 배양 단계는 멸균 조건하에서 수행해야 합니다. 모든 기기, 솔루션 및 미디어를 소독합니다. 70%의 에탄올로 작업 영역을 청소한 다음 분젠 버너를 설치하고 화염에 조심스럽게 가까이 가서 오염 가능성을 줄입니다. 또는, 클래스 II 생물 안전 캐비닛멸균 환경을 유지하기 위해 사용될 수있다. 잠재적으로 병원성 미생물에 노출되지 않도록 적절한 개인 보호 장비 (PPE)를 착용하십시오.
2. 16S rRNA 유전자 Sanger 시퀀싱에 의한 세균성 종 식별
참고: 미생물 정체성은 매트릭스 보조 레이저 탈광 이온화 시간 비행 질량 분석법(MALDI-TOF)20을사용하여 확인될 수 있다.
3. 게놈 DNA (gDNA) 추출
참고: 이 섹션에서는 다양한 세균 성 종에서 고품질 게놈 DNA의 높은 수율 추출을 위해 재료 표에 참조 된 gDNA 추출 키트에 제공 된 시약 및 스핀 컬럼을 활용합니다. 아래는 권장 수정 및 지침입니다.
4. 추출 된 gDNA의 품질 평가
5. 페어링 엔드 차세대 단기 읽기 시퀀싱 및 라이브러리 준비
참고: 짧은 읽기 시퀀싱은 뚜렷한 읽기 길이와 방향으로 다양한 계측기에서 수행될 수 있습니다. 세균WGS에 150 bp (300 사이클) 페어링 엔드 시퀀싱을 권장합니다. 도서관 준비와 시퀀싱은 모두 핵심 시설 이나 상업 실험실에 아웃소싱 될 수 있습니다.
6. 나노포레 미니온 시퀀싱 라이브러리 준비
7. 읽기 평가 및 준비
참고: 권장 디렉토리 구조가 그림 4에묘사됩니다. 아래 계산 단계를 진행하기 전에 데스크톱(즉Long_Reads, Short_Reads 및 Trimmed_Reads)에 있는 디렉터리를 만듭니다.
8. 하이브리드 게놈 조립 생성
참고: 다음 조립 파이프라인은 유니사이클러19,28,29,30을 사용하여 7.1 과 7.2(그림3)에서준비된 짧고 긴 읽기를 결합합니다. 외발 자전거 및 종속성을 설치하고 아래 명령을 실행합니다. 7.1.5 단계에서 내보낸 짧은 읽기 파일은 trimmed_short_file 명명된 것으로 가정합니다. R1.fastq 및 trimmed_short_file. 단순성 R2.fastq.
9. 조립 품질 평가
참고: 다음 프로토콜은 붕대31 및 QUAST32를사용하며, 사용하기 전에 설정해야 하는 두 가지 프로그램(그림2 및 그림 4)을사용합니다. 붕대는 일단 다운로드하면 설치가 필요하지 않으며 QUAST는 기본 명령줄 사용에 익숙해야합니다. 또한 벤치마킹 범용 단일 복사 정형(BUSCO)33을사용하여 게놈 완성도를 평가하는 것이 좋습니다.
10. 게놈 성서
참고: 아래 음표 파이프라인은 사용 전에 설치해야 하는 명령줄 도구인 Prokka34를사용합니다. 또는, 자동 GUIK-베이스(재료표)를통해 Prokka를 사용하거나 웹 서버RAST(35)를통해 게놈에 부가한다. 게놈을 NCBI에 증착하는 경우, 프로카요틱 게놈 노팅 파이프라인(PGAP)36을사용하여 자동으로 인장됩니다.
11. 데이터 민주화를 위한 제안 된 관행
이 프로토콜은 도 1에나열된 제네라에 속하는 요로균의 배양 및 시퀀싱에 최적화되어 있다. 모든 오줌 박테리아는이 방법에 의해 컬터. 문화권 미디어 및 조건은 그림 1의속에 의해 지정됩니다. gDNA 무결성의 예시겔 전기전도 평가는 도 2에서묘사된다. 판독 처리, 게놈 어셈블리 및 별표 시퀀싱을 위한 생물정보학 파이프라인의 개요는 도 3에설명되어 있다. 프로토콜 이해를 단순화하고 성공적인 조직을 위한 프레임워크를 제공하기 위해 그림 4에 계산 디렉터리 구조에 대한 가이드가 제공됩니다. 더욱이, 이 프로토콜에 의해 생성된 2개의 Klebsiella spp., K. pneumoniae 및 K. oxytoca의대표적인 완전 게놈이 포함됩니다. 이러한 어셈블리의 표현은 도 5에 제공되며 또한 추가 불완전한 예 K. 폐렴 게놈을 포함한다. 완전히 인가된 각 전체 게놈에 대한 자세한 개요는 도 6에나와 있다. 마지막으로, 표 1에 시퀀싱 읽기 통계의 요약이 제공되어 고품질 폐쇄 게놈 어셈블리생성에 충분한 원시 및 트리밍 된 데이터에 대한 광범위한 이해를 제공합니다. 또한 두 대표의 주요 매개 변수는 Klebsiella spp를 완료합니다. 게놈이 나열됩니다. 게놈과 원시 데이터는 BioProject PRJNA683049에 따라 Genbank에 입금되었습니다.
그림 1: 다양한 요로 게네라의 소변 배양을 수정했습니다. 다양한 오줌 제네라를 배양하는 데 사용될 수 있는 한천 및 액체 국물에 대한 차트. 모든 배양은 1.1절에 기재된 바와 같이 35°C에서 수행될 것을 제안된다. 원은 특정 속을 배양하는 데 적합한 미디어를 나타내며, 색상은 임의로 선택되어 한 미디어 유형을 다른 미디어 유형과 구별합니다. CDC-AN BAP (빨간색), CDC 혐기성 양 혈액 천; 5% 양-BAP (오렌지), 양 피 한천; BHI (녹색), 뇌 심장 주입; TSB (노란색), 트립틱 콩 국물; 크로마가르 오리엔테이션(파란색). 가드너엘라질은 HBT 바이레이어 G. 질경 선택적 천에서 미세 열과소및 특별한 국물 배양 요건44하에서배양되어야 한다. b유산균 이너는 5% 토끼-BAP 플레이트와 NYCIII 국물에 미세 비행대기에서 배양되어야 합니다. c유산균 스프. 미세 에어로필 조건에서 MRS에 배양 될 수있다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
그림 2: 유전체 DNA 추출 아가로즈 젤 이미지. gDNA 추출 결과를 묘사한 대표적인 젤 이미지. (A)레인 1: 1 kb 사다리, 레인 2: 손상되지 않은 gDNA는 성공적인 추출, 레인 3: 단편화된 gDNA를 나타내는 얼룩을 나타낸다. (B)레인 1: 1 kb 사다리, 차선 2 및 3 : rRNA 오염은 1.5 kb와 3 kb 사이의 두 밴드에 의해 표시된다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
그림 3: 하이브리드 게놈 조립 워크플로우. 읽기 품질 관리 및 사전 처리에서 어셈블리 별표에 이르는 단계의 회로도. 읽기 트리밍은 모호하고 품질이 낮은 읽기를 제거합니다. Q 점수 및 길이 매개 변수가 표시되고 유지되는 읽기를 나타냅니다. 어셈블리는 짧고 긴 읽기를 모두 활용하여 하이브리드 드 노보 게놈 어셈블리를 생성합니다. 조립 품질은 지정된 도구및 매개 변수를 사용하여 완전성과 정확성에 따라 평가됩니다. 최종 게놈 어셈블리는 모든 유전자와 관심의 특정 loci에 대해 추가됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
그림 4: 생물 정보학 디렉토리 구조 가이드. 짧고 긴 읽기, 하이브리드 어셈블리 및 게놈 별표 및 QC의 처리를 위한 권장 디렉토리 및 파일 조직의 회로도. 주요 명령줄 데이터 처리 단계는 해당 파일 및 디렉터리 옆에 강조 표시됩니다. 명령 및 플래그(굵게), 입력 파일(파란색), 출력 파일 또는 디렉토리(빨간색), 파일 명명 규칙(마젠타)과 같은 사용자 입력을 유도합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
그림 5: 붕대에 의한 게놈 어셈블리 그래프. 대표적인 완전한 게놈 조립 그래프(A) Klebsiella oxytoca KoPF10 및(B) 클렙시엘라 폐렴 KpPF25 및 불완전한 게놈 조립의(C) Klebsiella pneumoniae KpPF46. KoPF10의 완전한 게놈은 단일 폐쇄 염색체를 보여주고 KpPF25의 완전한 게놈은 닫힌 염색체 및 5개의 닫힌 플라스미드로 이루어져 있습니다. KpPF46의 불완전한 염색체는 두 개의 상호 연결된 연속체로 구성됩니다. 외발 자전거 하이브리드 드 노버 어셈블리는 붕대에 의해 시각화되는 어셈블리 그래프를 생성합니다. 어셈블리 그래프는 단일 연속의 두 끝을 연결하는 링커에 의해 닫힌 염색체 또는 플라스미드를 나타내는 게놈의 단순 한 회로도를 제공합니다. 상호 연결된 연속체가 하나 이상 존재하면 불완전한 어셈블리가 있음을 나타냅니다. 붕대에서도 연속적인 크기와 깊이를 지적할 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
그림 6: 추가 된 하이브리드 어셈블리의 완전한 게놈지도. (A) K. 옥시토카 KoPF10 및(B) K. 폐렴 KpPF25의 완전한 게놈에 대한 제네어스 프라임에 의해 생성된 조립 지도는 플라스미드 백본을 따라 유색 화살표로 표시된 불음 유전자를 보여주는 것이다. 염색체는 단순성만을 위한 rRNA 및 tRNA 유전자를 보여줍니다. 게놈 주석은 이 프로토콜의 섹션 10에 표시된 바와 같이 Prokka를 사용하여 수행되었다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
표 1: 대표 클레브시엘라 spp. K. 옥시토카 균주 KoPF10 및 K. 폐렴 균주 KpPF25. NCBI에 대한 증착된 데이터에 대한 수탁 번호가 제공된다. 트리밍 이전과 트리밍 후 의 읽기 수는 시퀀싱 기술 모두에 대해 지정됩니다. N50은 짧은 읽기가 제어 된 길이이기 때문에 긴 읽기에 대해 제공됩니다. 플라스미드 레플리시온은 플라스미드파인더 v2.1 엔테로박테리아세이 데이터베이스를 사용하여 80%의 정체성과 60%길이로 설정된 파라미터를 사용할 것으로 예측했다. MLST, 멀티로커스 시퀀스 유형. b CDS, 코딩 시퀀스. c 플라스미드 레플리콘은 플라스미드파인더 v2.1 엔테로박테리아세이 데이터베이스를 사용하여 80%의 정체성과 60%길이로 설정된 파라미터를 사용할 것으로 예측하였다. d 옥스포드 나노 포어 기술 (ONT) 읽기 데이터를 입금. e 일루미나예금 읽기 데이터. 이 테이블을 다운로드하려면 여기를 클릭하십시오.
여기에서 기술된 포괄적인 하이브리드 게놈 조립 프로토콜은 다양한 오줌 microbiota 및 비뇨기요법의 성공적인 배양및 그들의 게놈의 완전한 조립을 위한 능률적인 접근을 제공합니다. 세균성 게놈의 성공적인 WGS는 그들의 게놈 DNA를 추출하기 위하여 다양하고 때때로 까다로운 세균의 격리로 시작합니다. 현재까지, 기존의 소변 배양 프로토콜은 많은 오줌 종을 검출하는 데 필요한 감도가 부족하거나 연장 된 시간과 자원을 필요로하는 길고 광범위한 접근 방식을 포함(11). 설명된 수정된 향상된 소변 문화 접근은 잠재적으로 병원성 또는 유익한 성공종을 포함하여 17개의 일반적인 오줌 제네라에 속하는 박테리아의 성공적인 격리를 위한 단순화되면서도 포괄적인 프로토콜을 제안하며, 촉진및 의무유산소 또는 혐기성 박테리아. 이것은 차례차례로 세균게놈의 정확한 순서 및 조립및 오줌 건강과 질병의 이해에 기여하는 중요한 현상제 실험을 위한 필요한 시작 물질을 제공합니다. 더욱이, 이 수정된 배양 접근법은 소변 견본에서 찾아낸 실행 가능한 미생물의 보다 정의된 임상 진단을 제공하고 미래 게놈 연구를 위한 그들의 biobanking를 허용합니다. 그러나 이 프로토콜은 제한 없이 는 아닙니다. 그것은 유기체에 따라서 긴 잠복기뿐만 아니라 쉽게 사용할 수 없을 수 있습니다 저산소실 또는 제어 인큐베이터와 같은 자원의 사용을 필요로 할 수있다. 혐기성 GasPaks의 사용은 대체 솔루션을 제공하지만 비용이 많이 들고 항상 지속적이고 통제 된 환경을 생성하지는 않습니다. 마지막으로, 배양 편향뿐만 아니라 샘플 다양성은 특정 유기체와 비뇨기과균이 까다로운 박테리아를 능가하는 것을 허용할 수 있습니다. 이러한 제한에도 불구 하 고, 다양 한 오줌 박테리아의 문화는이 접근에 의해 가능.
유전체 시퀀싱은 차세대 시퀀싱 기술의 발전으로 인기를 얻고 있으며, 이는 시퀀싱 데이터14,15의수율과 정확도를 크게 증가시켰습니다. 데이터 처리 및 드 노보 어셈블리를 위한 알고리즘의 개발과 함께 완전한 게놈 서열은 초보자와 전문 과학자 모두15,45의손끝에 있습니다. 완전한 게놈에 의해 제공된 전반적인 게놈 조직의 지식은 유전자 중복, 유전자 손실 및 수평 유전자 전송14를포함하여 중요한 진화적이고 생물학 통찰력을 제공합니다. 추가적으로, 항균 저항 및 독성에 중요한 유전자는 수시로 초안 게놈 어셈블리에서 전형적으로 해결되지 않는 모바일 요소에 국한됩니다15,16.
본 명세서에서 프로토콜은 완전한 게놈 어셈블리를 생성하기 위해 짧은 읽기 및 긴 읽기 플랫폼에서 데이터를 시퀀싱하는 조합을 위한 하이브리드 접근 방식을 따릅니다. 오줌 세균게놈에 집중하는 동안, 이 절차는 각종 격리 근원에서 다양한 박테리아에 적응될 수 있습니다. 이 접근법의 중요한 단계는 적당한 살균 기술을 따르고 순수한 오줌 박테리아의 격리를 위한 적당한 매체 및 문화 조건을 이용하는 것을 포함합니다. 또한, 고수율 gDNA의 추출은 조립 성공을 저해할 수 있는 오염 판독이 없는 시퀀싱 데이터를 생성하는 데 필수적입니다. 후속 라이브러리 준비 프로토콜은 충분한 길이와 깊이의 품질 읽기 생성에 매우 중요합니다. 따라서, 이 기술의 가장 큰 장점은 이론적 상반수 제한없이 긴 읽기의 생성이기 때문에, 특히 긴 읽기 시퀀싱에 대한 라이브러리 준비 중에 주의gDNA를 처리하는 것이 매우 중요합니다. 또한 시끄러운 데이터를 제거하고 어셈블리 결과를 향상시키는 시퀀싱 읽기의 적절한 품질 관리(QC)에 대한 섹션도 설명되어 있습니다.
성공적인 DNA 격리, 라이브러리 준비 및 시퀀싱에도 불구하고, 일부 종의 게놈 아키텍처의 특성은 여전히 폐쇄 게놈 어셈블리45,46의생성에 대한 장애물을 제공 할 수 있습니다. 반복적인 시퀀스는 종종 어셈블리 계산을 복잡하게 하며 긴 읽기 데이터에도 불구하고 이러한 영역은 낮은 신뢰도로 해결되거나 전혀 해결되지 않을 수 있습니다. 따라서 긴 읽기는 게놈 또는 커버리지에서 가장 큰 반복 영역보다 평균적으로 더 길어야 한다 (>100x)19. 일부 게놈은 불완전한 상태로 남아 있으며 완료를 위해 수동 접근이 필요할 수 있습니다. 그럼에도 불구하고, 하이브리드 조립 불완전한 게놈은 일반적으로 짧은 읽기 초안 게놈 보다는 더 적은 연속으로 이루어지고 있습니다. 어셈블리 알고리즘의 기본 매개 변수를 조정하거나 읽기 QC에 대한 보다 엄격한 차단을 따르는 것이 도움이 될 수 있습니다. 또는 가장 가능성이 높은 어셈블리 경로에 대한 증거를 찾기 위해 불완전한 영역에 긴 판독을 매핑한 다음 증폭 된 영역의 PCR 및 Sanger 시퀀싱을 사용하여 경로를 확인하는 것이 좋습니다. Minimap2를 사용하여 읽기 매핑이 제안되고 붕대는 연속연결(47)에대한 증거를 제공하는 조립된 연속화를 따라 매핑된 읽기의 시각화를 위한 유용한 도구를 제공합니다.
완전한 게놈을 생성하는 추가적인 과제는 명령줄 도구를 사용하여 친숙함과 편안함에 있습니다. 많은 생물 정보 도구는 모든 사용자에게 계산 기회를 제공하기 위해 개발되었습니다. 그러나, 그들의 활용은 UNIX 및 프로그래밍의 기초와 이해에 의존. 이 프로토콜은 사전 명령줄 경험이 없는 개인이 폐쇄된 게놈 어셈블리를 생성하고 이에 대해 알수 할 수 있도록 충분히 상세한 지침을 제공하는 것을 목표로 합니다.
저자는 공개 할 것이 없습니다.
우리는 이 프로토콜에 기여한 무두세 주바이다 이슬람 박사와 루크 조이스 박사에게 감사드립니다. 우리는 또한 그들의 의견과 지원을 위해 달라스 게놈 센터에 있는 텍사스 대학을 인식하고 싶습니다. 이 작품은 웰치 재단에 의해 지원되었다, 수상 번호 AT-2030-20200401 N.J.D.에, 건강의 국립 연구소에 의해, K.P.에 수여 번호 R01AI116610, 그리고 펠레시아와 존 케인 의자에 의해, P.E.Z.에 의해 개최.
Name | Company | Catalog Number | Comments |
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | -- | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | -- | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | -- | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | -- | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | -- | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | -- | -- | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | -- | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | -- | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System - GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep - (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | -- | -- | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | -- | -- | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | -- | -- | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | -- | |
CRISPRcasFinder | -- | -- | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | -- | |
gVolante (BUSCO) | -- | -- | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | -- | -- | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | -- | -- | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | -- | |
NanoFilt | -- | -- | https://github.com/wdecoster/nanofilt |
NanoStat | -- | -- | https://github.com/wdecoster/nanostat |
PHASTER | -- | -- | https://phaster.ca/ |
Prokka | -- | -- | https://github.com/tseemann/prokka |
QUAST | -- | -- | http://quast.sourceforge.net/quast |
Trim Galore | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | -- | -- | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | -- | -- | https://github.com/rrwick/Unicycler#necessary-read-length |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유