JoVE Journal

Immunology and Infection

Un abonnement à JoVE est nécessaire pour voir ce contenu.

Un flux de travail de métaprotéomique clinique mis en œuvre au sein de la plateforme bioinformatique Galaxy pour analyser les interactions hôte-microbiome sous-jacentes aux maladies humaines

Transcription

Nos recherches ont porté sur la détection et la quantification des protéines microbiennes et sur la compréhension de leur rôle dans les maladies cliniques. Ce domaine de recherche s’appelle la métaprotéomique clinique. Dans cette étude, nous avons développé un flux de travail bio-informatique qui permettra aux chercheurs de comprendre comment l’activité bactérienne peut influencer la progression de la maladie.

L’analyse métaprotéomique d’échantillons cliniques présente de nombreux défis, notamment la gestion de très grandes bases de données de séquences protéiques pour l’identification sensible et précise des peptides et des protéines microbiennes à partir de données de spectrométrie de masse, en plus d’effectuer des annotations taxonomiques et fonctionnelles de peptides et de protéines quantifiés pour permettre l’interprétation biologique des résultats. Le flux de travail offre de multiples avantages, notamment la réduction de base de données à l’aide de notre flux de réduction de base de données, la possibilité de rechercher des peptides microbiens à l’aide de plusieurs algorithmes de recherche, la possibilité de vérifier les peptides microbiens détectés dans les données de spectrométrie de masse, la capacité de quantifier les protéines microbiennes ainsi que les protéines de l’hôte, et l’interprétation biologique des données à l’aide d’une analyse statistique et visuelle. Nous avons utilisé le flux de travail de métaprotéomique clinique pour identifier un panel de peptides microbiens pour les études de progression de la maladie de la fibrose kystique afin d’étudier le statut de co-infection pendant les vagues de la pandémie de COVID-19.

Ces études ont été publiées dans des revues universitaires à comité de lecture. Nous utilisons actuellement ce flux de travail dans le cadre d’une étude en cours visant à développer un panel de peptides cibles prédictifs pour le cancer de l’ovaire. L’équipe Galaxy P est impliquée dans la recherche multiomique, et nous développons plusieurs flux de travail avancés pour l’analyse protéogénomique et métaprotéomique.

Nous travaillons également à l’élaboration de flux de travail pour l’immunopeptidomique, qui permettront aux chercheurs de détecter et de caractériser les peptides présentés au système immunitaire, certains au cours de la progression du cancer qui sont appelés néoantigènes, ainsi que d’autres maladies où il pourrait également s’agir de peptides microbiens. Pour commencer, obtenez une liste d’espèces liées à la maladie ou à la condition d’intérêt. Utilisez le fichier de liste d’espèces intitulé Espèces.

tabulaire" en tant qu’entrée pour UniProt. Téléchargez le protéome au format FASTA pour générer une base de données de séquences de protéines. Exécutez le téléchargeur de bases de données de protéines pour générer deux bases de données de séquences de protéines supplémentaires, une base de données Swiss-Prot humaine contenant uniquement les entrées examinées et une base de données de protéines contaminantes contenant un référentiel commun de protéines adventives, ou cRAP.

Utilisez les trois bases de données de protéines comme entrées pour les fichiers de fusion FASTA et filtrez les séquences uniques pour exclure les doublons. À l’aide de la grande base de données générée et de l’ensemble de données de spectrométrie de masse comme entrées, exécutez MetaNovo pour générer une base de données de séquences de protéines réduites, puis exécutez les fichiers de fusion FASTA et filtrez les séquences uniques sur la base de données générée par MetaNovo, les bases de données humaines Swiss-Prot et cRAP pour créer une base de données cible réduite contenant des séquences de protéines microbiennes, humaines et contaminantes pour la détection des peptides. Exécuter l’interface graphique de recherche" pour générer un fichier d’archive contenant des correspondances de spectre peptidique, ou PSM.

Utilisez le fichier d’archive de l’interface graphique de recherche comme entrée pour Peptide-Shaker"pour générer les rapports PSM, peptides et protéines. Exécutez MaxQuant" pour produire des fichiers de groupes de protéines et de peptides. À l’aide d’outils de manipulation de texte, organisez les sorties obtenues à partir de l’interface graphique de recherche, de Peptide-Shaker et de MaxQuant.

Concaténez les deux listes de peptides en un seul ensemble de données intitulé SGPS-MQ-Peptides.tabular. Regroupez la liste de peptides concaténés pour éliminer les séquences de peptides en double et obtenir la liste finale des peptides microbiens uniques. Pour la vérification PepQuery2, saisissez la liste des peptides microbiens distincts, les ensembles de données spectrales MS, la base de données de référence humaine UniProt avec les isoformes et la base de données de séquences de protéines contaminantes.

Exécutez Cut » sur les rapports de peptides à partir de l’interface graphique de recherche, Peptide-Shaker » et MaxQuant » pour extraire les séquences peptidiques et les entrées de protéines associées. Concaténez les séquences peptidiques et les entrées de protéines des deux programmes pour créer un nouvel ensemble de données de protéines peptidiques combinées, puis exécutez le tableau de requête sur l’ensemble de données de protéines peptidiques combinées et les peptides vérifiés pour attribuer chaque peptide vérifié à son entrée de protéine associée. Regroupez pour conserver les peptides vérifiés uniques et leurs identifiants UniProt associés.

Ensuite, exécutez Query Tabular" pour extraire les ID UniProt, en générant une liste intitulée Uniprot-ID à partir de Peptides.tabular vérifié. Téléchargez les identifiants UniProt sur UniProt pour récupérer les séquences de protéines associées et les enregistrer dans un nouveau fichier FASTA UniProt. Exécutez des fichiers de fusion FASTA et filtrez des séquences uniques sur le FASTA UniProt nouvellement généré, la base de données humaine UniProt avec des isoformes et la base de données de contaminants cRAP pour créer une base de données vérifiée pour la quantification des peptides.

Utilisez la base de données de séquences de protéines vérifiée et l’ensemble de données MS comme entrées pour MaxQuant. Dans le fichier MaxQuant"peptides), sélectionnez uniquement les peptides microbiens et exécutez la commande Cut » pour extraire uniquement les séquences de peptides microbiens du fichier de sélection. Regroupez le fichier « Cut » pour compiler une liste de peptides microbiens quantifiés.

Utilisez le fichier list-of-quantified-microbial-peptides comme entrée pour Unipept afin d’effectuer des annotations taxonomiques et fonctionnelles. Extrayez les résultats de l’Unipept, en particulier l’arbre de taxonomie microbienne et l’arbre des protéines de la commission des enzymes microbiennes. Pour afficher la taxonomie microbienne et les arbres de protéines EC, sélectionnez l’ensemble de données et ouvrez les options.

Cliquez sur Visualiser, puis sur Unipept Taxonomy Viewer. Pour les annotations taxonomiques et fonctionnelles sous forme de tableau, cliquez sur l’icône en forme d’œil de l’ensemble de données tabulaires nommé Unipept_peptinfo. Faites défiler la page pour examiner chaque peptide sur sa propre ligne et ses colonnes d’informations correspondantes.

Avant d’effectuer une analyse statistique avec MSstatsTMT, exécutez Select" sur le fichier de groupes de protéines MaxQuant pour créer des ensembles de données distincts pour les protéines microbiennes et humaines. Ces protéines contiennent des étiquettes de taxonomie qui indiquent leur source. Exclure toute protéine contaminante étiquetée avec l’étiquette con_.

Ne conservez que les protéines microbiennes avec des balises telles que _9laco » et les protéines humaines avec l’étiquette _human » dans le Microbial_Proteins » tabulaire et Human_Proteins » tabulaire respectivement. Enfin, à l’aide de MSstatsTMT, effectuez une analyse statistique avec le fichier de preuves MaxQuant et les protéines microbiennes ou humaines sélectionnées. Cliquez sur l’icône en forme d’œil pour afficher les graphiques résultants.

Au total, 2 595 745 séquences protéiques ont été compilées dans une base de données complète, qui a ensuite été réduite à une base de données plus ciblée contenant 21 289 séquences protéiques pour une identification efficace des peptides. À l’aide de l’interface graphique de recherche, de Peptide-Shaker et de MaxQuant, 196 peptides microbiens distincts ont été identifiés. PepQuery2 a confirmé 134 peptides microbiens liés à 73 séquences protéiques, formant ainsi une base de données vérifiée pour la quantification.

L’analyse MaxQuant a fourni un fichier de peptides contenant 3 203 peptides, avec 155 peptides microbiens quantifiés. L’analyse Unipept a révélé que les lactobacilles étaient le genre le plus abondant et que les transférases de classe 2 étaient la catégorie d’enzymes la plus répandue parmi 155 peptides microbiens quantifiés. L’analyse MSstatsTMT a produit des graphiques volcaniques et comparatifs illustrant les protéines exprimées de manière différentielle, montrant que trois protéines de lactobacilles étaient régulées à la baisse dans les cas de cancer de l’ovaire par rapport aux cas bénins.

La métaprotéomique clinique offre un aperçu du microbiome humain et de ses contributions à la maladie. Nous avons exploité la puissance de calcul de la plateforme Galaxy pour développer un flux de travail bioinformatique modulaire qui facilite l’analyse métaprotéomique complexe basée sur la spectrométrie de masse et la caractérisation de divers types d’échantillons cliniques pertinents pour les études de maladies.

Nous utilisons des cookies afin d'améliorer votre expérience sur notre site web.

En continuant à utiliser notre site ou en cliquant sur le bouton ''continuer'', vous acceptez l'utilisation de cookies.