Este protocolo fecha uma lacuna significativa entre a evolução natural dos vírus e seu uso como vetores recombinantes para a terapia gênica humana, permitindo sua engenharia, diversificação e estratificação. Essa técnica permite a triagem paralela de alto rendimento para vírus novos, isolados ou projetados associados a adenovírus, em curto AAV, variantes, economizando assim em números de animais, trabalho, custo e tempo. As variantes do capsídeo AVV identificadas podem aumentar a eficácia e a especificidade da administração de transgenes terapêuticos baseada em AAV, reduzindo assim a dose viral necessária.
Isso poderia melhorar a segurança e a aplicabilidade da terapia gênica. A mesma abordagem também poderia ser usada para a engenharia de capsídeos ou promotores de outros veículos de entrega de genes, o que melhora nossa compreensão de sua biologia e seu uso em terapia gênica. Ajudando a demonstrar o procedimento estarão os estudantes de doutorado Jonas Becker e Jixin Liu, as pós-docs Joanna Szumska e Margarita Zayas, bem como as assistentes de pesquisa Emma Gerstmann e Ellen Widtke do meu laboratório.
Comece analisando os dados de sequenciamento NGS com Python 3 e Biopython. A análise da NGS é composta por duas etapas. Para a primeira etapa, pesquise os arquivos de sequência em busca de sequências que satisfaçam critérios específicos, como sequências de flanco, comprimento e localização usando o script um e um arquivo de configuração que forneça as informações necessárias.
Para a segunda etapa, traduza as sequências extraídas começando na sequência AGWGGC usando o script número dois e a configuração e zuordnung. txt que fornece as informações necessárias. Prepare duas pastas:script e dados.
Copie os arquivos compactados Gzip resultantes do sequenciamento para a pasta de dados. Em seguida, copie o Python e os arquivos de configuração para a pasta de script, conforme descrito no manuscrito de texto. Antes de executar os scripts, abra o zuordnung.
txt e adicione duas colunas separadas por tabulação. Digite os nomes dos arquivos Gzip na coluna um e o nome final desejado na coluna dois. Altere as variáveis no arquivo de configuração conforme descrito no manuscrito de texto.
Usando o comando específico, inicie a detecção e extração da sequência variante. A saída serão arquivos TXT com as sequências de DNA extraídas e seus números de leituras. O cabeçalho deste arquivo contém dados estatísticos e esses dados serão transferidos para os seguintes arquivos.
Esses dados TXT serão o arquivo de entrada para o script número dois no qual as sequências de DNA são traduzidas, classificadas e analisadas. Usando o comando específico, inicie a tradução PV e análise dos arquivos de saída de texto do script um, conforme descrito no manuscrito de texto. Os arquivos de saída do script número dois serão nomeados usando a segunda coluna da tabela de pesquisa em zuordnung.
txt com extensões baseadas no tipo de análise. Certifique-se de que os três arquivos de saída contenham dados estatísticos nas primeiras linhas e uma primeira coluna com o índice de cada sequência de DNA dos arquivos de texto de entrada. As colunas restantes devem consistir na sequência de DNA, número de leituras, leitura direta ou reversa e sequência peptídica traduzida.
As sequências inválidas devem ter NA e não são válidas nas duas últimas colunas. Visualize os arquivos de saída usando o software disponível com base nas necessidades do usuário. Para realizar a análise dos dados de sequenciamento NGS usando código personalizado em Python 3, o fluxo de trabalho compreende a detecção de sequências de código de barras guiadas por sequências de flanco, seu comprimento e localização, bem como a análise de enriquecimento e distribuição de código de barras sobre o conjunto de tecidos.
Prepare duas pastas:script e dados. Copie os arquivos compactados Gzip resultantes do sequenciamento para a pasta de dados. Em seguida, copie o python e os arquivos de configuração para a pasta de script, conforme descrito no manuscrito de texto.
Antes de executar o script, crie dois arquivos de texto delimitados por tabulação:o capsidvariance. txt com as sequências de código de barras atribuídas a nomes de variantes de capsídeo AAV e a contaminação. TXT com sequências de código de barras que vêm de possível contaminação.
Finalmente, edite o arquivo de configuração para incluir as informações do caminho para a pasta com dados de sequenciamento, sequência de regiões de flanco dos códigos de barras, sua posição e tamanho da janela para detecção de código de barras. Execute o script de detecção de código de barras com os caminhos e arquivos de configuração fornecidos usando o respectivo comando. A saída da execução deste comando serão arquivos TXT com recontagens por variante do capsid e o número total de leituras recuperadas dos dados brutos.
Avaliar a distribuição do capsídeo AAV com código de barras entre tecidos ou órgãos, na zuordnung. txt, atribua o nome de cada arquivo de texto obtido da execução de detecção de código de barras a um nome de tecido ou órgão. Adicione os nomes dos arquivos de texto na primeira coluna e os nomes de tecidos ou órgãos correspondentes na atribuição delimitada pela guia.
Crie um órgão. TXT com a lista de nomes para órgãos dentro e fora do alvo, que correspondem aos nomes dados na atribuição zuordnung. arquivo txt.
Em seguida, crie normalization_organ. txt e normalization_variant. Arquivos de texto delimitados pela guia TXT com valores normalizados para todas as variantes do Capsid e todos os órgãos e tecidos.
Na primeira coluna com o normalization_organ. txt, escreva os nomes dados para cada órgão, e a segunda coluna com valores de normalização para o tecido correspondente. Preencha a primeira coluna do normalization_variant.
TXT com a lista de nomes de capsid e a segunda coluna com os valores normalizados das contagens de leitura para cada capsid na biblioteca em pool. Edite o arquivo de configuração especificando os caminhos completos para todos os arquivos adicionais e execute o script de análise de código de barras usando esse comando específico. O script de análise de código de barras produz vários arquivos, como os arquivos de texto com concentração relativa ou valores RC de distribuição de capsídeo dentro de diferentes tecidos com base em várias etapas de normalização descritas anteriormente, e o arquivo de planilha que combina dados de arquivo de texto em dados de matriz mesclada.
Visualize os dados e realize a análise de agrupamento dos dados matriciais conforme descrito no manuscrito do texto. O script irá inserir a concentração relativa. xls e gerar dois gráficos de mapa de calor de cluster hierárquico e análise de componentes principais.
Para modificar gráficos ou parâmetros PNG, abra o script R e siga as instruções na seção de comentários. As regiões quantificadas do gene AAV2 rep mostraram que 99,2% foram positivas para ITR, sugerindo que os capsídeos AAV continham todo o genoma viral. Nos três conjuntos, as leituras extraídas com base em sequências de assinaturas específicas da biblioteca representaram cerca de 94% do total de leituras, indicando boa qualidade.
Destes, mais de 99% eram leituras PV válidas e mais de 99% das leituras PV válidas eram únicas, sugerindo que a biblioteca estava equilibrada com alta diversidade interna. Os dois principais ramos da hierarquia do mapa de calor refletiram a diferença na eficiência de transdução das variantes do capsídeo. O ramo esquerdo com a maioria das variantes do capsídeo incluiu todos os capsídeos que mostraram um alto valor de concentração relativa na maioria dos tecidos.
Além da especificidade hepática surpreendentemente alta, três outros capsídeos exibiram especificidade no diafragma, músculo esquelético, bíceps e cérebro. O ramo direito do agrupamento hierárquico incluiu as variantes do capsídeo com menor eficiência de transdução mais evidente no duodeno e pâncreas. A análise de componentes principais para o subgrupo original forma o grupo de variantes do capsídeo com alta especificidade hepática e descreve o tropismo muscular excepcional do capsídeo VAR60.
Ao tentar este protocolo, você precisa prestar atenção aos erros de digitação. A sintaxe também é diferente se você estiver usando o prompt de comando do Windows em comparação com o Linux. Após a identificação de novas variantes do AAV, o potencial terapêutico e translacional precisa ser verificado em um modelo animal falecido ou maior.
Essa técnica permite uma comparação direta lado a lado de variantes do AAV em condições idênticas e é extremamente versátil, abrindo caminho para sua tradução em animais de grande porte, ou mesmo em humanos.