우리는 바이러스유전염 시퀀싱을 사용하여 바이러스가 어디에서 왔는지, 어떻게 퍼지는지 이해합니다. 예를 들어, 이러한 데이터를 실시간으로 사용하려면 데이터가 제공하는 정확한 양을 정확히 이해해야 합니다. 이러한 기술의 주요 장점은 상대적으로 저렴하고 빠르며 현장 시퀀싱에 사용할 수있는 실시간 기본 코딩을 가능하게한다는 것입니다.
이 방법은 예를 들어, 다수의 병원체의 기원을 결정하는 데 사용될 수 있는 시퀀스 데이터의 적시 생성에 사용될 수 있다. 이 기술은 처음 사용자에게 복잡할 수 있으며 기본적인 유닉스 지식이 필요합니다. 특히 다른 소프트웨어 패키지의 설치에 대 한.
이 메서드의 시각화는 사용자가 특정 시퀀싱 프로토콜의 오류 속도를 결정하는 데 도움이 됩니다. 그리고 연구 질문에 대답합니다. 시퀀스 실행은 MinIT에 연결된 MinION에서 시작됩니다.
나노포어 플랫폼에서 시퀀스를 미리 형성한 후 데이터 로드를 Porechop에 로드합니다. 오염을 방지하고 정확도를 향상시키려면 요구 밑줄 2개를 사용하고 바코드 플래그를 강조표시하고 표시된 대로 명령을 입력합니다. 탈 멀티플렉스 후, 큐적응을 사용하여 지시된 대로 명령을 사용하여 75뉴클레오티드보다 짧은 길이로 프라이머 서열 및 서열을 제거한다.
Minimap2를 사용하여 미니맵2를 사용하여 고유한 참조 균주의 패널에 대해 디멀티플렉스 시퀀스 판독을 매핑합니다. 그리고 Samtools를 사용하여 합의 순서를 생성합니다. 참조 기반 정렬의 경우, 가장 가까운 참조 변형률을 식별하기 위해 생성된 컨센서스 시퀀스와 함께 폭발을 제거하고 검색하는 것이 필수적입니다.
그런 다음 참조로 가장 가까운 참조 변형과 참조 기반 정렬을 반복합니다. 나노포어 시퀀싱에서 오류 프로파일을 보정하는 데 필요한 판독 범위를 결정하기 위해 한 앰플리콘에 대한 시퀀스 매핑을 선택하고 Minimap2를 사용하여 나노포어가 이 앰플리콘에 대해 읽는 맵을 매핑합니다. Samtools를 사용하여 읽기 매핑만 Amplicon26으로 선택하고 표시된 명령을 사용하여 bam 파일을 패스트크로 변환합니다.
예를 들어 200시퀀스는 1천 번 읽는 하위 집합을 임의로 선택합니다. 임의로 선택된 모든 시퀀스 읽기는 Amplicon26에 정렬됩니다. KMA를 사용하여 서열 판독을 매핑하고 BC 나노 플래그에 표시된 대로 나노포어 시퀀싱에 최적화된 설정을 사용하여 컨센서스 서열을 즉시 생성합니다.
생성된 합의 시퀀스를 검사하려면 표시된 대로 명령을 사용합니다. 제목 아래에 있는 통계 점 트 txt에 오류 율을 표시하려면 오차 속도 불일치 베이스가 매핑된 대로 명령을 사용합니다. 인델 수를 표시하려면 사이클당 제목 인델 아래에 표시된 대로 명령을 사용합니다.
기본 색상 플립 플롭과 함께 새로운 흐름 셀을 사용하면 40 배의 판독 범위가 일루미나 염기서열분석과 비교하여 동일한 결과를 초래합니다. 30배의 판독 범위는 0.02%의 오차율을 초래하여 585, 000뉴클레오티드 마다 하나의 오류에 해당한다. 20배의 판독 범위는 매 63, 529뉴클레오티드시퀀스마다 하나의 오차를 초래한다.
10배의 판독 범위는 시퀀시드된 3, 312뉴클레오티드마다 하나의 오차를 초래한다. 4개의 우스투 바이러스 게놈 당 3개 이상의 뉴클레오티드가 잘못 불려지고 있다는 것을 의미합니다. 30회 이상의 판독 범위를 통해 인델은 관찰되지 않습니다.
20배의 판독 범위는 하나의 인델 위치를 감지하는 결과를 낳고, 10배의 판독 범위는 29개의 위치에서 인델을 생성합니다. 기억해야 할 가장 중요한 것은 항상 명백하지는 않지만 소프트웨어의 업데이트가 자주 발생하고 결과에 영향을 미칠 수 있다는 것입니다. 사용할 소프트웨어에는 여러 가지 옵션이 있습니다.
우리는 가장 일반적으로 사용되는 프로그램을 시연했습니다. 그러나 다른 소프트웨어와 이러한 소프트웨어의 다른 버전은 다른 결과를 초래할 수 있습니다. 생성되는 시퀀스 데이터의 품질을 확인하는 방법에 대한 예를 보여 주겠습니다.
이는 신뢰할 수 있는 발병 지원에 매우 중요합니다.