이 프로토콜은 바이러스의 공학, 다양화 및 계층화를 가능하게 함으로써 바이러스의 자연적 진화와 인간 유전자 치료를 위한 재조합 벡터로서의 사용 사이의 상당한 격차를 해소합니다. 이 기술을 사용하면 짧은 AAV 변이체에서 신규, 분리 또는 조작된 아데노 관련 바이러스에 대한 고처리량 병렬 스크리닝이 가능하므로 동물 수, 작업, 비용 및 시간을 절약할 수 있습니다. 확인된 AVV 캡시드 변이체는 치료적 이식유전자의 AAV 기반 전달의 효능 및 특이성을 증가시켜 필요한 바이러스 용량을 감소시킬 수 있습니다.
이것은 유전자 치료의 안전성과 적용 가능성을 향상시킬 수 있습니다. 동일한 접근법이 다른 유전자 전달 비히클의 캡시드 또는 프로모터 엔지니어링에도 사용될 수 있으며, 이는 생물학 및 유전자 치료에서의 사용에 대한 이해를 향상시킵니다. 이 절차를 시연하는 데 도움이되는 박사 과정 학생 인 Jonas Becker와 Jixin Liu, 박사후 연구원 Joanna Szumska와 Margarita Zayas, 그리고 연구 조교 인 Emma Gerstmann과 Ellen Widtke가 내 실험실에서 나올 것입니다.
먼저 Python 3 및 Biopython을 사용하여 NGS 염기서열 분석 데이터를 분석합니다. NGS 분석은 두 단계로 구성됩니다. 첫 번째 단계에서는 스크립트 1을 사용하여 측면 시퀀스, 길이 및 위치와 같은 특정 기준을 충족하는 시퀀스와 필요한 정보를 제공하는 구성 파일을 시퀀스 파일에서 검색합니다.
두 번째 단계의 경우, 스크립트 번호 2와 구성 및 zuordnung을 사용하여 AGWGGC 시퀀스에서 시작하여 추출된 시퀀스를 번역합니다. 필요한 정보를 제공하는 txt 파일입니다. 스크립트와 데이터라는 두 개의 폴더를 준비합니다.
시퀀싱으로 인한 Gzip 압축 파일을 데이터 폴더에 복사합니다. 그런 다음 Python 및 구성 파일을 텍스트 원고에 설명된 대로 스크립트 폴더에 복사합니다. 스크립트를 실행하기 전에 zuordnung을 엽니다.
txt 파일을 열고 두 개의 탭으로 구분된 열을 추가합니다. 1열에 Gzip 파일의 이름을 입력하고 2열에 원하는 최종 이름을 입력합니다. 텍스트 원고에 설명된 대로 구성 파일의 변수를 변경합니다.
특정 명령을 사용하여 변이 서열 검출 및 추출을 시작합니다. 출력은 추출된 DNA 서열과 판독 횟수가 포함된 TXT 파일입니다. 이 파일의 헤더에는 통계 데이터가 포함되어 있으며 이러한 데이터는 다음 파일로 전송됩니다.
이 TXT 데이터는 DNA 서열이 번역, 순위 지정 및 분석되는 스크립트 번호 2의 입력 파일이 됩니다. 특정 명령을 사용하여 텍스트 원고에 설명된 대로 스크립트 1의 텍스트 출력 파일에 대한 PV 변환 및 분석을 시작합니다. 스크립트 번호 2의 출력 파일은 zuordnung에 있는 조회 테이블의 두 번째 열을 사용하여 이름이 지정됩니다.
분석 유형에 따라 확장자가 있는 txt입니다. 세 개의 출력 파일의 첫 번째 행과 입력 텍스트 파일의 각 DNA 서열 색인이 있는 첫 번째 열에 통계 데이터가 포함되어 있는지 확인합니다. 나머지 컬럼은 DNA 서열, 판독 횟수, 순방향 또는 역방향 판독 및 번역된 펩타이드 서열로 구성되어야 합니다.
유효하지 않은 시퀀스에는 NA가 있어야 하며 마지막 두 열에서 유효하지 않아야 합니다. 사용자의 필요에 따라 사용 가능한 소프트웨어를 사용하여 출력 파일을 시각화합니다. Python 3에서 사용자 지정 코드를 사용하여 NGS 염기서열 분석 데이터 분석을 수행하기 위한 워크플로우는 측면 염기서열, 길이 및 위치에 따라 안내되는 바코드 염기서열 검출, 조직 세트에 대한 바코드 농축 및 분포 분석으로 구성됩니다.
스크립트와 데이터라는 두 개의 폴더를 준비합니다. 시퀀싱으로 인한 Gzip 압축 파일을 데이터 폴더에 복사합니다. 그런 다음 python 및 구성 파일을 텍스트 원고에 설명된 대로 script 폴더에 복사합니다.
스크립트를 실행하기 전에 탭으로 구분된 두 개의 텍스트 파일인 capsidvariance를 만듭니다. txt 파일에 AAV 캡시드 변형 이름에 할당된 바코드 시퀀스와 오염이 있습니다. 오염 가능성으로 인한 바코드 시퀀스가 있는 TXT 파일.
마지막으로, 시퀀싱 데이터가 있는 폴더 경로, 바코드의 측면 영역 순서, 바코드 위치 및 바코드 감지를 위한 창 크기 정보를 포함하도록 구성 파일을 편집합니다. 해당 명령을 사용하여 제공된 경로 및 구성 파일로 바코드 감지 스크립트를 실행합니다. 이 명령 실행의 출력은 캡시드 변형당 재카운트와 원시 데이터에서 복구된 총 읽기 수가 있는 TXT 파일입니다.
zuordnung에서 조직 또는 기관 사이에 바코드화된 AAV 캡시드의 분포를 평가합니다. TXT 파일, 바코드 검출 실행에서 얻은 각 텍스트 파일의 이름을 조직 또는 장기 이름에 할당합니다. 첫 번째 열에 텍스트 파일의 이름을 추가하고 탭으로 구분된 할당에 해당 조직 또는 장기 이름을 추가합니다.
장기를 만듭니다. TXT 파일에 on-target 및 off-target 기관의 이름 목록이 포함되어 있으며, 이는 Zuordnung 과제에 주어진 이름에 해당합니다. txt 파일.
그런 다음 normalization_organ 만듭니다. txt 및 normalization_variant. TXT 탭은 모든 캡시드 변이체와 모든 장기 및 조직에 대해 정규화된 값으로 구분된 텍스트 파일입니다.
normalization_organ가 있는 첫 번째 열에서. txt 파일에 각 장기에 대해 주어진 이름을 쓰고 두 번째 열에는 해당 조직에 대한 정규화 값을 씁니다. normalization_variant의 첫 번째 열을 채웁니다.
txt 파일에 캡시드 이름 목록이 있고 두 번째 열에는 풀링된 라이브러리의 각 캡시드에 대한 정규화된 읽기 횟수 값이 있습니다. 모든 추가 파일의 전체 경로를 지정하여 구성 파일을 편집하고 이 특정 명령을 사용하여 바코드 분석 스크립트를 실행합니다. 바코드 분석 스크립트는 앞서 설명한 여러 정규화 단계를 기반으로 서로 다른 조직 내에서 캡시드 분포의 상대 농도 또는 RC 값을 갖는 텍스트 파일과 텍스트 파일 데이터를 병합된 매트릭스 데이터로 결합하는 스프레드시트 파일과 같은 여러 파일을 출력합니다.
데이터를 시각화하고 텍스트 원고에 설명된 대로 행렬 데이터의 군집 분석을 수행합니다. 스크립트는 relativeconcentration을 입력합니다. XLS 파일을 생성하고 계층적 클러스터 히트 맵과 주성분 분석의 두 플롯을 생성합니다.
플롯 또는 PNG 매개 변수를 수정하려면 R 스크립트를 열고 주석 섹션의 지침을 따릅니다. AAV2 rep 유전자의 정량화된 영역은 99.2%가 ITR에 대해 양성임을 보여주었으며, 이는 AAV 캡시드가 전체 바이러스 게놈을 함유하고 있음을 시사합니다. 세 세트 모두에서 라이브러리와 관련된 서명 시퀀스를 기반으로 추출된 읽기는 전체 읽기의 약 94%를 차지하여 좋은 품질을 나타냅니다.
이 중 99% 이상이 유효한 PV 읽기였고 99% 이상이 유효한 PV 읽기가 고유하여 라이브러리가 높은 내부 다양성과 균형을 이루고 있음을 시사합니다. 히트 맵 계층의 두 가지 주요 분기는 캡시드 변이체의 형질도입 효율의 차이를 반영했습니다. 캡시드 변이체의 대다수를 갖는 왼쪽 가지에는 대부분의 조직에서 높은 상대 농도 값을 나타내는 모든 캡시드가 포함되었습니다.
현저하게 높은 간 특이성 외에도 3개의 다른 캡시드는 횡격막, 골격근, 이두근 및 뇌에서 특이성을 나타냈습니다. 계층적 클러스터링의 오른쪽 지점에는 십이지장과 췌장에서 가장 분명하게 나타나는 전반적으로 낮은 형질도입 효율을 가진 캡시드 변이체가 포함되었습니다. 원래 하위 집합에 대한 주성분 분석은 높은 간 특이성을 가진 캡시드 변이체의 클러스터를 형성하고 VAR60 캡시드 뛰어난 근육 친화성을 설명합니다.
이 프로토콜을 시도할 때 입력 오류에 주의해야 합니다. Windows 명령 프롬프트를 사용하는 경우와 Linux를 사용하는 경우 구문도 다릅니다. 새로운 AAV 변이체를 식별한 후 사망하거나 더 큰 동물 모델에서 치료 및 번역 가능성을 확인해야 합니다.
이 기술은 동일한 조건에서 AAV 변이체를 직접 나란히 비교할 수 있으며 매우 다재다능하여 대형 동물 또는 인간에서도 번역할 수 있는 길을 열어줍니다.