Method Article
차세대 시퀀싱 (NGS) 플랫폼 (~0.5–2.0%)의 높은 오류 속도 의해 제한 되는 genomic 특성 분석을 위한 강력한 도구입니다. NGS 오류율을 제거 하 고 변형 대립 유전자 분수 0.0001 희귀에서 변이 감지 수 있는 오류 수정 시퀀싱의 우리의 방법을 설명 합니다.
기존의 차세대 시퀀싱 기술 (NGS) 10 년 이상에 대 한 거 대 한 게놈 특성에 대 한 수 있다. 특히, NGS 악성에 클론 돌연변이의 스펙트럼을 분석 하 사용 되었습니다. 비록 전통적인 Sanger 방법, 식별 하는 ~0.5–2.0 %의 그것의 높은 에러율으로 인해 드문 클론와 subclonal 돌연변이와 NGS 투쟁 보다 훨씬 더 효율적. 따라서, 표준 NGS는 돌연변이 대 한 검색의 제한이 > 0.02 변형 대립 유전자 분수 (VAF). 이 환자에서 희소 한 돌연변이 대 한 임상 중요성 동안 알려진된 질병 불분명, 남아 없이 백혈병 치료 하는 환자 크게 향상 결과 잔여 질병 때 < 0.0001 cytometry에 의해. NGS의이 artefactual 배경, 완화 하기 위해 수많은 방법이 개발 되었습니다. 여기 오류 수정 DNA와 RNA 시퀀싱 (ECS), 개별 분자 임의의 인덱스 오류 수정에 대 한 혈압의 16와 다중화 8 혈압 환자 특정 인덱스를 태그를 포함 하는 방법을 설명 합니다. 우리의 방법은 감지 하 고 변형 대립 유전자 분수 (VAFs) 두 배나 NGS의 검출 한계 보다 낮은 희귀 0.0001 VAF에 클론 변이 추적할 수 있습니다.
우리가 나이, mutagens, 게놈, 그리고이에 체세포 착오의 축적에서 세포 분열 결과 중 확률 오류 노출에 기초가 악성 변화의 근본적인 병 인 신경 발달 질환, 소아 질환과 정상적인 노화1,2. 질병-운전 잠재력 체세포 돌연변이 조기 발견 및 위험 관리3,,45에 대 한 중요 한 진단 및 예 후 바이오 마커. 더 나은 physiologic clonogenesis 이해, 어떤 임상 통보 되며 결정, 정확한 정량화 및이 돌연변이의 특성화 연구 기본 중요성 이다. 차세대 시퀀싱 (NGS)은 현재 이기종 DNA 샘플; 클론 변이 공부 하는 데 사용 됩니다. 그러나, NGS 식별에서 돌연변이로 제한 됩니다 > 0.02 변형 대립 유전자 분수 (VAF)-0.5-2.0의 고유한 오류 비율 때문 시퀀싱 플랫폼6,7,8%. 그 결과, 추적 진단 및 prognostically 중요 한 체세포 변종 낮은 VAF에 얻을 수 없다 표준 NGS를 사용 하 여.
최근, 다양 한 방법은 NGS8,9,,1011의 오류율을 회피 하기 위해 개발 되었습니다. 이러한 방법을 활용 분자 태그, 시퀀싱 후 오류 수정 가능 하 게 합니다. 각 분자 또는 시퀀싱 라이브러리에서 게놈 단편으로는 임의의 독특한 분자 식별자 (우미) 그 분자에 관련 된 태그입니다. Umi는 무작위 뉴클레오티드 (8-16 N)의 문자열의 순열에 의해 구성 됩니다. 두 번째 샘플 전용 바코드 또한 동일한 NGS 시퀀싱 실행에 여러 샘플을 멀티플렉싱 있도록 워크플로에 통합 된다. PCR 증폭 분자로 태그 라이브러리에서 수행 되 고 그 후 라이브러리 시퀀싱에 대 한 전송 됩니다. 라이브러리 준비 동안 PCR 증폭 및 시퀀싱8동안 오류 게놈 단편을 무작위로 소개 것 이다는 예상 된다. 임의의 연속 오류를 제거 하려면 원시 시퀀싱 읽기 우미에 따라 그룹화 됩니다. 시퀀싱에서 아티팩트 하지 진정한 variant를 충실 하 게 증폭 하 고 같은 바다를 공유 하는 모든 읽기에 시퀀싱 것 소개의 확률적 특성으로 인해 동일한 게놈 위치에 동일한 우미와 모든 읽기에 있을 예정 이다. 아티팩트는 제거 하는 bioinformatically. 여기, 우리가 설명 하는 세 가지 방법의 오류 수정 시퀀싱 (ECS) 단일 뉴클레오티드 변종 (SNVs) 및 작은 삽입-삭제 (Indels), 식별 하기 위해 dna 그리고 RNA 유전자 발현 아래의 정량화를 촉진 하기 위해 실험실에 최적화 된 NGS 오류 임계값입니다.
첫 번째 방법은 연구자에 의해 설계 된 유전자 특정 뇌관을 사용 하 여 희귀 체세포 이벤트에 대 한 보고 하는 방법을 설명 합니다. 라이브러리 준비, 이전 연구자 관심의 파편을 대상으로 프라이 머를 설계 해야 합니다. 우리가 사용 하는 웹 애플 리 케이 션 Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). 200-250 bp의 Amplicons 연쇄 반응 (PCR)에 대 한 이상적인 Umi 통합 되었습니다 일단이 것으로, 150 bp 쌍 간 읽기와 쌍 간 읽기 중복 생성. 사용 될 최적의 뇌관 디자인 조건: 최소 뇌관 크기 = 19; 최적의 뇌관 크기 = 25; 최대 뇌관 크기 = 30; 최소 Tm = 64 ° C; 최적의 Tm = 70 ° C; 최대 Tm = 74 ° C; 최대 Tm 차이 = 5 ° C; 최소 GC 내용 = 45; 최대 GC 내용 = 80; 반환 번호 = 20; 최대 3' 끝 안정성 = 100.
방법 2에서 우리가 ECS DNA 프로토콜 클론 SNVs 및 작은 Indels 희귀 0.0001 VAF amplicons의 수백을 포함 하는 상업적으로 이용 가능한 유전자 패널을 사용 하 여 조사를 Illumina 화학 결합 하는 방법을 설명 합니다. 우리는 우리의 실험에 대 한 TruSight 골수성 시퀀싱 패널 (Illumina)를 사용 하 고 소아 골수성 질환에 대 한 관심의 추가 유전자를 포함 하는 확장 된 패널을 설계. 이러한 패널 팬 들은 그래서 우리 자신의 어댑터 전략이이 패널에 추가 했습니다 오류 정정을 촉진 것이 독특한 분자 식별자 (Umi)의 정보를 제공 하지는. ECS 작동 한다 다른 질병와 관련 된 유전자에 대 한 풍부 하 게 설계 된 다른 패널의 동등 하 게 잘. DNA 분리 및 조직 또는 관심의 샘플에서 후속 정량화, 다음 것이 좋습니다 적어도 500 재고 DNA 견본 당 ng. 우리는 정기적으로 250를 사용 하 여 단일 시퀀싱 라이브러리 확인 중복 및 VAF 계산으로 가능한 한 많은 독특한 게놈 단편으로 하류 캡처하기 위해 DNA의 ng 읽습니다. 선택적 복제 시퀀싱 라이브러리 나머지 250으로 만들어질 수 있다 DNA의 ng. 우리는 항상 표본, 당 2 개의 복제 라이브러리 만들고 참 긍정으로 둘 다 복제에 독립적으로 검색 하는 이벤트에만 생각. 우리는 또한4,13전화 이체의 정확도를 높이 genomic 위치 특정 이항 오류 모델 구현.
마지막으로,는 상용 QIAseq 대상 RNA 패널 (Qiagen)를 사용 하 여 사본 정량화에 대 한 RNA 시퀀싱에 ECS를 연결 하는 방법에 설명 합니다. 중복에는 Umi 필요한 오류 수정 키트에 통합 되었습니다 및 연구원은 제조 업체의 권장 사항에 따라 라이브러리를 만들 수 있습니다. Bioinformatically, 연구자는 ECS-DNA, 프로토콜 섹션에서 자세히 설명 될 것 이다를 위한 파이프라인을 따를 수 있습니다.
1. 타겟 dna 시퀀싱 오류 수정
2. 유전자의 DNA 시퀀싱 오류 수정 패널
표 1: 예제 위치 특정 이항 오류 모델을 구성 하는 방법을 설명 합니다.
3. RNA의 연속 오류 수정
Targeted Error-Corrected dna 시퀀싱, 함께 우리는 돌연변이 환자 상업 genomic DNA에 DNA를 diluting 원리 실험의 증거를 수행 했습니다. 환자 GATA1 돌연변이 했다 (chrX:48650264, C > G) 0.19의 원래 VAF와. ECS 단일 뉴클레오티드 변종 1:10,000의 수준으로 양적은 그림 1 에서 설명 합니다.
그림 1: GATA1 SNV 보여주는 ECS 1:10,000의 수준으로 양적은 희석 시리즈. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
우리는 또한 ECS DNA 안정적으로 성인 급성 골수성 백혈병 (AML) 건강 한 노인 개인4에 recurrently 유전자에 드문 클론 변이 감지 하는지 보여준다. 우리는 간호사의 건강 연구 틀 약 떨어져 ~ 10 년에서에서 20 건강 한 개인에서 버 피 코트 샘플을 얻었다. 우리는이 샘플에 ECS-DNA 패널 프로토콜을 적용. 이 실험에 대 한 우리 Illumina TruSight 골수성 시퀀싱 패널 568 amplicons (자세한 내용은 https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html에 유전자 목록에) 구성 된 적응 및 시퀀싱 20 개인에서 80 라이브러리 (다른 시간 지점에서 2 컬렉션, 시간 당 개인 당 2 복제 지점) 47.7 백만 쌍 간 읽기의 평균 및 오류를 수정 하는 3.4 백만의 평균을 생성 Illumina NextSeq 플랫폼을 사용 하 여 도서관4당 합의 시퀀스입니다. 라이브러리 당 평균 뉴클레오티드 커버리지 (3.4 수백만 568로 나눈 값) x 6000 대략 이었다. 각 샘플에 대 한 우리는 동일한 샘플에서 되지 않은 시퀀스 된 라이브러리를 사용 하 여 위치 특정 오류 프로필을 건설 한다. 우리는 하나 이상의 컬렉션 시간 지점의 두 복제에 109 클론 체세포 돌연변이 발견. 이러한 돌연변이 VAF 0.0003-0.1451에서 배열 있다. 우리가 알려진된 우주 표현으로 21 돌연변이 선택 하 고 하나 또는 두 개의 컬렉션 시간 포인트 ddPCR를 사용 하 여 모든 21 돌연변이 확인 (n = 34, 그림 2, 젊은 외. 20164에서 적응).
그림 2: ECS로 식별 하는 돌연변이 매우 조화 된 VAFs와 ddPCR를 통해 확인 했다. (n = 34, 젊은 외. 20164수정). 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
ECS RNA 프로토콜을 사용 하 여 오류 수정 식 수준에 관하여 우리 다양 한 암 (QIAseq 인간의 암 Transcriptome 패널에서 적응), 그리고 우리와 관련 된 것으로 알려진 416 유전자의 구성 된 QIAseq 화학을 사용 하 여 유전자 패널 사용자 정의 ( 보충 자료1에서 유전자 목록) 주어진된 유전자의 가장 일반적으로 표현한 exon 증폭. 우리 쌍 간 형식 라이브러리, 당 8.3 백만 읽기의 평균을 준 Illumina MiSeq 플랫폼을 사용 하 여 라이브러리를 시퀀싱 그리고 우리 0.417 백만 오류 수정 합의 시퀀스의 평균을 잡으려고 관리. 우리 식 수준 낮은 풍부한 사본 보여주었다 (< 50에서 1000 사본 수 총 RNA의 ng) 복제 사이 높은 재현성은 (데이터 요소 n = 300, 그림 3). DdPCR (식의 다양 한 정도의 6 선택 된 유전자)에 의해 유효성 검사 유전자의 식 수준 올바르게 정규화에 대 한 필요 없이 ECS 프로토콜에 의해 점령 되었습니다 했다 설명 했다.
그림 3: 상단, 대 본의 상관 관계 계산 ECS RNA에 의해 동일한 샘플의 복제 사이 (n = 300). 하단, ECS로 식별 하는 건의 했다 ddPCR에 의해 확인 하는 사본 (n = 6). 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
다른 질병에 낮은 VAFs와 돌연변이 연구를 쉽게 구현할 수 있는 오류 수정 시퀀싱 프로토콜의 집합을 설명 합니다. 그들은 원시 읽기 오류 보정을 가능 하 게 가장 중요 한 요소 시퀀싱 전에 각 분자 Umi의 법인입니다. 여기에 설명 된 방법을 상용 유전자 패널을 자체 설계 유전자 특정 oligos 사용자 지정된 Umi를 통합 하는 연구를 허용 합니다.
표준 NGS 프로토콜 precludes 시퀀싱 오류 비율 때문 2% 아래 VAF와 변이의 탐지 하 고이 희소 한 이체의 탐지는 중요 한 연구에서 NGS의 응용 프로그램을 제한 합니다. 우회 표준 NGS 오류율, ECS이 원시 이체의 민감한 감지 수 있습니다. 예를 들어, 이러한 돌연변이 처음 (따라서 데 낮은 VAF) 발생 때 병원 성 변이의 탐지 병14,15의 조기 개입에 게 필수적입니다. 백혈병 연구, 최소한의 잔류의 검출에에서 질병 (잔여 leukemic 세포 후 처리) 위험 계층을 알립니다 및 이진 흐름 cytometric 평가 수 없습니다 하는 방식으로 치료 옵션을 통보 하는 데 사용할 수. 또한, ECS 순환 종양 핵 산을 검출 하 고 단단한 종양 환자에서 전이성 잠재력을 평가 하는 존재/부재로의 기본 특성은 특정 돌연변이의 변형 부담을 평가 하 여 적용 됩니다. 종양16.
표 1에서처럼 변종 전화 위치 특정 오류 이항 분포-기반 모델을 사용 하 여 전원 시퀀싱 오류 모델을 구축 하는 데 사용의 깊이 뿐만 아니라 시퀀스 라이브러리의 수에 따라 달라 집니다. 오류 모델의 견고성 샘플 및 시퀀싱 깊이 더 높은 수가 증가합니다. 각 샘플에 대 한 오류 프로필 범위의 오류 수정 읽기 샘플 당 3000 x의 평균 최소한 10 시퀀스 샘플을 사용 하는 것이 좋습니다. 위치-특정 방식은 비슷한 MAGERI, 하지만 모든 6 다른 대체 종류에 대 한 집계 오류 비율을 사용 하는 대신 (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)13, 우리 모든 위치에 독립적으로 각 대체 모델. 예를 들어, C의 오류 비율 > T는 genomic 위치는 다른 위치에서 다른. 우리의 접근 방법 또한 걸립니다 계정에 연속 배치 효과 관찰 한 시퀀싱 실행 기본 대체 속도에서 실행 하는 다른 다를 수 있습니다. 따라서 그것은 특히 다른 시퀀싱 실행에서 샘플 모델 구축 풀링되지 때 모든 대체 형식에 대 한 각 위치를 모델링 하는 것이 중요.
ECS 실험을 설계할 때 중요 한 고려 사항은 원하는 검출 임계값입니다. NGS 연구의 아름다움은 그 그들은 쉽게 확장할 수 유전자/대상 관심, 검출 임계값 (시퀀싱의 깊이 의해 결정), 및 쿼리 하는 개인의 수의 점에서. 예를 들어 연구원은 0.0001의 감지 임계값을 갖는 2 개의 amplicons에 드문 돌연변이 찾을 관심이 있다면, 그들은 최대 15 백만 읽기 출력 MiSeq V2 화학을 사용 하 여 실행 한 시퀀싱에 극대로 75 샘플 수영장 수 (2 amplicons * 10000 분자 * 10 오류 수정에 대 한 읽기 * 75 샘플 15 백만 시퀀싱 읽기 =). 연구원은 시퀀싱 또는 단일 시퀀스 검출 임계값 조정 실행에 풀링된 샘플 수로가 하는 분자의 수를 변화할 수 있다. 우리의 연구에서 우리 0.0001 VAF (1:10, 000)의 감지 임계값으로 돌연변이 찾을 목적 Illumina 유전자 패널을 사용 하 여. 우리가 일상적으로 250를 사용 하 여 상기 검출 임계값을 달성 하기 위해 충분 한 분자 캡처되는지 확인에 DNA 시작의 ng. 연구팀은 DNA의 낮은 금액으로 시작 하도록 선택할 수 있습니다 (50 ng는 것이 좋습니다) 원하는 검색 제한이 > 0.001 VAF.
Umi i5 인덱스에 추가 됩니다, 시퀀싱 설정을 적절 하 게 수정 되어야 할. 예를 들어 16 N Umi, 사용 하 고 시퀀싱 설정 된 2 x 144 짝된 끝 읽기, 인덱스 1의 8 주기 및 인덱스 2의 일반적인 8 사이클 반대로 인덱스 2의 16 주기. 인덱스 2 주기 증가 사이클 읽기에 할당 된의 총 수에 있는 감소에 의해 보상 된다. 연구원은 12N Umi10,17를 사용 하기로 선택한 경우 인덱스 2의 12 주기를 설정은 변경 되어야 합니다.
이 우미 기반 시퀀싱 방법은 시퀀싱 오류 수정 최적화 됩니다. 모든 확대 기반 방법에 대 한 문제는 차선의 PCR jackpotting 처리에 남아 있습니다. 라운드 후 시퀀싱 및 게시물-생물 정보학 유효성 검사 ddPCR를 사용 하 여 수행 하 고 거의 PCR jackpotting 때문에 어떤 잘못 된 반응 감지. 그럼에도 불구 하 고, 연구원은 낮은 증폭 오류를 고화질 중 합 효소를 사용 하 여 실험을 실시 하는 것이 좋습니다.
저자는 공개 없다.
우리 아 이들의 종양학 그룹 AAML1531 연구 및 환자 샘플의 형태로 그들의 공헌에 대 한 간호사 건강 연구에서 참가자를 감사합니다. 이 작품은 건강의 국가 학회 (UM1 CA186107, RO1 CA49449 RO1 CA149445), 아 이들의 발견 연구소의 워싱턴 대학교 세인트 루이스 어린이 병원 (엠씨-II-2015-461)와 일 라이 세스 매튜 스 백혈병 재단에 의해 투자 되었다.
Name | Company | Catalog Number | Comments |
Q5 High Fidelity Hot Start Master Mix | New England BioLabs | M0492S | |
Agencourt AMPure XP | Beckman Coulter | A63880 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | |
SYBR Safe DNA Gel Stain | Thermo Fisher Scientific | S33102 | |
Truseq Custom Amplicon Index Kit | Illumina | FC-130-1003 | |
UMI i5 adapter sequences | Integrated DNA Technologies | - | |
NEBNext Ultra End Repair/dA-Tailing Module | New England BioLabs | E7442S | |
NEBNext Ultra II Ligation Module | New England BioLabs | E7595S | |
QX200 ddPCR EvaGreen Supermix | Bio-Rad | 1864034 | |
QX200 Droplet Generation Oil for EvaGreen | Bio-Rad | 1864005 | |
QX200 Droplet Digital PCR System | Bio-Rad | 1864001 | |
ddPCR 96-Well Plates | Bio-Rad | 12001925 | |
DG8 Cartridges for QX200/QX100 Droplet Generator | Bio-Rad | 1864008 | |
DG8 Gaskets for QX200/QX100 Droplet Generator | Bio-Rad | 1863009 | |
Bioanalyzer | Agilent Genomics | G2939BA | |
TapeStation | Agilent Genomics | G2991AA | |
TruSight Myeloid Sequencing Panel | Illumina | FC-130-1010 | |
Bowtie 2 | Johns Hopkins University | - | |
Customized QIAseq Targeted RNA Panel | Qiagen | - | |
Rneasy Plus Mini Kit (50) | Qiagen | 74134 |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유