L’analyse d’une seule particule en cryo-microscopie électronique est l’une des principales techniques utilisées pour déterminer la structure des ensembles biologiques à haute résolution. Scipion fournit les outils pour créer l’ensemble du pipeline afin de traiter les informations acquises par le microscope et de réaliser une reconstruction 3D du spécimen biologique.
La cryo-microscopie électronique est devenue l’un des outils les plus importants de la recherche biologique pour révéler l’information structurelle des macromolécules à une résolution quasi atomique. Dans l’analyse d’une seule particule, l’échantillon vitrifié est imagé par un faisceau d’électrons et les détecteurs à l’extrémité de la colonne du microscope produisent des films de cet échantillon. Ces films contiennent des milliers d’images de particules identiques dans des orientations aléatoires. Les données doivent passer par un flux de travail de traitement d’image avec plusieurs étapes pour obtenir le volume final reconstruit en 3D. L’objectif du flux de travail de traitement d’images est d’identifier les paramètres d’acquisition pour pouvoir reconstruire le spécimen à l’étude. Scipion fournit tous les outils pour créer ce workflow en utilisant plusieurs packages de traitement d’image dans un cadre intégratif, permettant également la traçabilité des résultats. Dans cet article, l’ensemble du flux de travail de traitement d’image dans Scipion est présenté et discuté avec des données provenant d’un cas de test réel, donnant tous les détails nécessaires pour passer des films obtenus par le microscope à une reconstruction 3D finale haute résolution. En outre, la puissance de l’utilisation d’outils de consensus qui permettent de combiner des méthodes et de confirmer les résultats à chaque étape du flux de travail, améliorant ainsi la précision des résultats obtenus, est discutée.
En cryo-microscopie électronique (cryo-EM), l’analyse de particules uniques (SPA) d’échantillons vitrifiés congelés-hydratés est l’une des variantes d’imagerie les plus largement utilisées et les plus réussies pour les macromolécules biologiques, car elle permet de comprendre les interactions moléculaires et la fonction des ensembles biologiques1. C’est grâce aux progrès récents de cette technique d’imagerie qui ont donné lieu à la « révolution de la résolution »2 et ont permis la détermination réussie de structures 3D biologiques avec une résolution quasi atomique. Actuellement, la résolution la plus élevée atteinte dans SPA cryo-EM était de 1,15 Å pour l’apoferritine3 (entrée EMDB: 11668). Ces avancées technologiques comprennent des améliorations dans la préparation des échantillons4, l’acquisition d’images5 et les méthodes de traitement des images6. Cet article est axé sur ce dernier point.
En bref, l’objectif des méthodes de traitement d’image est d’identifier tous les paramètres d’acquisition pour inverser le processus d’imagerie du microscope et récupérer la structure 3D du spécimen biologique étudié. Ces paramètres sont le gain de la caméra, le mouvement induit par le faisceau, les aberrations du microscope (principalement la mise au point), l’orientation angulaire 3D et la translation de chaque particule, et l’état conformationnel en cas d’avoir un échantillon avec des changements conformationnels. Cependant, le nombre de paramètres est très élevé et cryo-EM nécessite l’utilisation d’images à faible dose pour éviter les dommages causés par les radiations, ce qui réduit considérablement le rapport signal/bruit (SNR) des images acquises. Ainsi, le problème ne peut pas être résolu sans équivoque et tous les paramètres à calculer uniquement peuvent être des estimations. Tout au long du flux de travail de traitement d’image, les paramètres corrects doivent être identifiés, en éliminant les paramètres restants pour finalement obtenir une reconstruction 3D haute résolution.
Les données générées par le microscope sont rassemblées dans des images. En simplifiant, une image contient le nombre d’électrons qui sont arrivés à une position particulière (pixel) dans l’image, chaque fois que des détecteurs de comptage d’électrons sont utilisés. Dans un champ de vision particulier, plusieurs images sont collectées et c’est ce qu’on appelle un film. Comme de faibles doses d’électrons sont utilisées pour éviter les dommages causés par le rayonnement qui pourraient détruire l’échantillon, le SNR est très faible et les images correspondant au même film doivent être moyennées pour obtenir une image révélant des informations structurelles sur l’échantillon. Cependant, non seulement une moyenne simple est appliquée, mais l’échantillon peut subir des décalages et d’autres types de mouvements pendant le temps d’imagerie en raison du mouvement induit par le faisceau qui doit être compensé. Les cadres compensés par décalage et moyennés sont à l’origine d’une micrographie.
Une fois les micrographies obtenues, nous devons estimer les aberrations introduites par le microscope pour chacune d’elles, appelées fonction de transfert de contraste (CTF), qui représente les changements de contraste de la micrographie en fonction de la fréquence. Ensuite, les particules peuvent être sélectionnées et extraites, ce qui s’appelle la cueillette de particules. Chaque particule doit être une petite image contenant une seule copie du spécimen étudié. Il existe trois familles d’algorithmes pour la sélection de particules: 1) ceux qui n’utilisent qu’un certain paramétrage de base de l’apparence de la particule pour les trouver dans l’ensemble des micrographies (par exemple, la taille des particules), 2) ceux qui apprennent à quoi ressemblent les particules de l’utilisateur ou d’un ensemble préentraîné, et 3) ceux qui utilisent des modèles d’image. Chaque famille a des propriétés différentes qui seront montrées plus tard.
L’ensemble extrait de particules trouvées dans les micrographies sera utilisé dans un processus de classification 2D qui a deux objectifs: 1) nettoyer l’ensemble de particules en éliminant le sous-ensemble contenant des images de bruit pur, des particules qui se chevauchent ou d’autres artefacts, et 2) les particules moyennes représentant chaque classe pourraient être utilisées comme informations initiales pour calculer un volume initial 3D.
Le calcul du volume initial 3D est la prochaine étape cruciale. Le problème de l’obtention de la structure 3D peut être considéré comme un problème d’optimisation dans un paysage de solutions multidimensionnelles, où le minimum global est le meilleur volume 3D qui représente la structure d’origine, mais plusieurs minima locaux représentant des solutions sous-optimales peuvent être trouvés, et où il est très facile de se faire piéger. Le volume initial représente le point de départ du processus de recherche, de sorte qu’une mauvaise estimation initiale du volume pourrait nous empêcher de trouver le minimum global. Dès le volume initial, une étape de classification 3D permettra de découvrir différents états conformationnels et de nettoyer à nouveau l’ensemble des particules ; l’objectif est d’obtenir une population structurellement homogène de particules. Après cela, une étape de raffinement 3D sera chargée d’affiner les paramètres angulaires et de traduction de chaque particule afin d’obtenir le meilleur volume 3D possible.
Enfin, dans les dernières étapes, la reconstruction 3D obtenue peut être affûtée et polie. L’affûtage est un processus d’augmentation des hautes fréquences du volume reconstruit, et le polissage est une étape pour affiner davantage certains paramètres, comme le CTF ou la compensation de mouvement induit par le faisceau, au niveau des particules. En outre, certaines procédures de validation pourraient être utilisées pour mieux comprendre la résolution obtenue à la fin du flux de travail.
Après toutes ces étapes, les processus de traçage et d’amarrage7 contribueront à donner un sens biologique à la reconstruction 3D obtenue, en construisant des modèles atomiques de novo ou en adaptant des modèles existants. Si une haute résolution est atteinte, ces processus nous indiqueront les positions des structures biologiques, même des différents atomes, dans notre structure.
Scipion8 permet de créer l’ensemble du flux de travail en combinant les packages de traitement d’image les plus pertinents de manière intégrative. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 et bien d’autres packages peuvent être inclus dans Scipion. En outre, il intègre tous les outils nécessaires pour bénéficier de l’intégration, de l’interopérabilité, de la traçabilité et de la reproductibilité afin de faire un suivi complet de l’ensemble du flux de travail de traitement d’image8.
L’un des outils les plus puissants que Scipion nous permet d’utiliser est le consensus, qui signifie comparer les résultats obtenus avec plusieurs méthodes en une seule étape du traitement, en combinant les informations véhiculées par différentes méthodes pour générer une sortie plus précise. Cela pourrait aider à augmenter les performances et à améliorer la qualité obtenue dans les paramètres estimés. Notez qu’un flux de travail plus simple peut être construit sans l’utilisation de méthodes consensuelles; cependant, nous avons vu la puissance de cet outil22,25 et le flux de travail présenté dans ce manuscrit l’utilisera en plusieurs étapes.
Toutes les étapes qui ont été résumées dans les paragraphes précédents seront expliquées en détail dans la section suivante et combinées dans un flux de travail complet à l’aide de Scipion. En outre, la façon d’utiliser les outils de consensus pour parvenir à un accord plus élevé dans les résultats générés sera montrée. À cette fin, l’exemple de jeu de données du ribosome Plasmodium falciparum 80S a été choisi (entrée EMPIAR: 10028, entrée EMDB: 2660). L’ensemble de données est formé par 600 films de 16 images de taille 4096x4096 pixels à une taille de pixel de 1,34Å prises à un FEI POLARA 300 avec une caméra FEI FALCON II, avec une résolution signalée à EMDB est de 3,2Å18 .
1. Création d’un projet dans Scipion et importation des données
2. Alignement des films : des films aux micrographies
3. Estimation CTF : calcul des aberrations du microscope
4. Prélèvement de particules : trouver des particules dans les micrographies
5. Classification 2D: regroupement de particules similaires
6. Estimation initiale du volume : construire la première estimation du volume 3D
7.3D classification : découverte des états conformationnels
8.3D raffinement : affiner les affectations angulaires d’une population homogène
9. Évaluation et post-traitement
Nous avons utilisé l’ensemble de données du Plasmodium falciparum 80S Ribosome (entrée EMPIAR: 10028, entrée EMDB: 2660) pour effectuer le test et, avec le protocole Scipion présenté dans la section précédente, un volume reconstruit en 3D haute résolution de la macromolécule dans cet exemple particulier a été atteint, en commençant par les informations recueillies par le microscope qui consistent en des images très bruyantes contenant des projections 2D dans n’importe quelle orientation du spécimen.
Les principaux résultats obtenus après l’exécution de l’ensemble du protocole sont présentés à la Figure 10, à la Figure 11 et à la Figure 12. La figure 10 représente le volume 3D obtenu avant post-traitement. Dans la figure 10a, on peut voir un FSC de 3 Å, qu’il est très proche de la limite de Nyquist (avec des données avec une taille de pixel de 1,34 Å, la limite de Nyquist est de 2,6 Å). La figure 10b montre quelques tranches du volume 3D reconstruit avec des niveaux élevés de détails et des structures bien définies. Dans la figure 11, les résultats après analyse locale de la résolution du volume 3D obtenu sont présentés. On peut voir que la plupart des voxels de la structure atteignent une résolution inférieure à 3 Å, principalement ceux situés dans la partie centrale de la structure. Cependant, la partie extérieure affiche des résolutions pires, ce qui est cohérent avec le flou apparaissant dans ces zones dans les tranches de la figure 10b. La figure 12 montre la même carte 3D après post-traitement qui est capable de mettre en évidence les fréquences plus élevées du volume, révélant plus de détails et améliorant la représentation, ce qui peut être vu en particulier dans la présentation 3D de la figure 12c.
Dans la figure 14, Chimera26 a été utilisé pour voir une représentation 3D du volume obtenu (figure 14a), du post-traitement (figure 14b) et de la carte de résolution (figure 14c), colorée avec le code couleur des résolutions locales. Cela peut donner encore plus d’informations sur la structure obtenue. Cet outil est très utile pour avoir un aperçu de la qualité du volume obtenu, car de très petits détails dans l’ensemble du contexte 3D de la structure peuvent être vus. Lorsque la résolution obtenue est suffisante, même certaines parties biochimiques de la structure peuvent être trouvées (par exemple, les hélices alpha dans la figure 14d. Dans cette figure, il faut souligner la haute résolution obtenue dans toutes les parties centrales de la structure 3D, qui peuvent être vues comme les zones bleu foncé de la figure 14c.
Tous les résultats précédents ont été obtenus grâce à une bonne performance de l’ensemble du protocole, mais ce n’est peut-être pas le cas. Il existe plusieurs façons d’identifier un mauvais comportement. Dans le cas le plus général, cela se produit lorsque la structure obtenue a une faible résolution et qu’elle n’est pas en mesure d’évoluer vers une meilleure. La figure 15 en est un exemple. Un volume flou (Figure 15c) entraîne un faible FSC, ce qui peut être vu dans la courbe FSC (Figure 15a) et l’histogramme de l’estimation locale (Figure 15b). Cet exemple a été généré à l’aide d’une méthode d’affinement 3D avec des données d’entrée incorrectes, car il s’attendait à ce que certaines propriétés spécifiques dans l’ensemble d’entrée de particules ne remplissent pas. Comme on peut le voir, il est toujours très important de savoir comment les différentes méthodes s’attendent à recevoir les données et à les préparer correctement. En général, lorsqu’une sortie comme celle de la figure 15 est obtenue, il peut y avoir un problème dans le flux de travail de traitement ou les données sous-jacentes.
Il existe plusieurs points de contrôle le long du flux de travail qui peuvent être analysés pour savoir si le protocole évolue correctement ou non. Par exemple, juste après la cueillette, plusieurs des méthodes discutées précédemment peuvent classer les particules et donner un score pour chacune d’elles. Dans le cas d’avoir de mauvaises particules, ces méthodes permettent de les identifier et de les éliminer. En outre, la classification 2D peut être un bon indicateur d’avoir un mauvais ensemble de particules. La figure 16 montre un exemple d’un si mauvais ensemble. Dans la figure 16a, les bonnes classes contenant certains détails de la structure sont montrées, tandis que la figure 16b montre les mauvaises classes, qui sont bruyantes ou non centrées, dans ce dernier cas, on peut voir que le prélèvement était incorrect et que deux particules semblent apparaître ensemble. Un autre point de contrôle est l’estimation initiale du volume, la figure 17 montre un exemple de bonnes (figure 17a) et de mauvaises (figure 17b) estimations initiales. La mauvaise estimation a été créée à l’aide d’une configuration incorrecte pour la méthode. Il faut tenir compte du fait que toutes les configurations doivent être effectuées avec soin, en choisissant de manière appropriée chaque paramètre en fonction des données analysées. En cas de ne pas avoir de carte avec quelques informations structurelles minimales, le raffinement suivant ne sera pas en mesure d’obtenir une bonne reconstruction.
Lorsque le problème est une mauvaise acquisition, dans laquelle les films ne préservent pas les informations structurelles, il sera impossible d’en extraire de bonnes particules et d’obtenir un traitement réussi. Dans ce cas, plus de films devraient être collectés pour obtenir une reconstruction 3D haute résolution. Mais, si ce n’est pas le cas, il existe plusieurs façons de gérer les problèmes tout au long du flux de travail de traitement. Si la cueillette n’est pas assez bonne, il existe plusieurs façons d’essayer de la réparer, par exemple, répéter la cueillette, utiliser différentes méthodes ou essayer de choisir manuellement plus de particules pour aider les méthodes à en tirer des leçons. Pendant la classification 2D, si seulement quelques classes sont bonnes, pensez également à répéter le processus de prélèvement. Dans l’estimation initiale du volume, essayez d’utiliser plusieurs méthodes si certaines d’entre elles donnent des résultats inexacts. Il en va de même pour le raffinement 3D. Suivant ce raisonnement, dans ce manuscrit, plusieurs outils de consensus ont été présentés, ce qui pourrait être très utile pour éviter les problèmes et poursuivre le traitement avec des données précises. Grâce à l’utilisation d’un consensus entre plusieurs méthodes, nous pouvons éliminer les données difficiles à sélectionner, classer, aligner, etc., ce qui est probablement un indicateur de données médiocres. Cependant, si plusieurs méthodes sont en mesure de s’accorder dans la sortie générée, ces données contiennent probablement des informations précieuses avec lesquelles poursuivre le traitement.
Nous encourageons le lecteur à télécharger plus d’ensembles de données et à essayer de les traiter en suivant les recommandations présentées dans ce manuscrit et à créer un flux de travail similaire combinant des packages de traitement à l’aide de Scipion. Essayer de traiter un ensemble de données est le meilleur moyen d’apprendre la puissance des outils de traitement disponibles dans l’état de l’art dans Cryo-EM, de connaître les meilleures règles pour surmonter les inconvénients possibles apparaissant pendant le traitement et d’améliorer les performances des méthodes disponibles dans chaque cas de test spécifique.
Graphique 1. Résultat de l’alignement du film. (a) La fenêtre principale des résultats, avec une liste de toutes les micrographies générées et des informations supplémentaires: la densité spectrale de puissance, la trajectoire de l’alignement estimé en coordonnées polaires, la même en coordonnées cartésiennes, le nom de fichier de la micrographie générée. b) La trajectoire d’alignement représentée en coordonnées cartésiennes. c) La micrographie générée. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 2. Estimation CTF avec résultat Ctffind. La fenêtre principale avec les résultats comprend un chiffre avec le PSD estimé (dans un coin) avec le PSD provenant des données, et plusieurs paramètres de défocalisation. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 3. Fenêtres de prélèvement manuel avec Xmipp. a) La fenêtre principale avec la liste des micrographies à traiter et d’autres paramètres. b) Prélèvement manuel de particules à l’intérieur d’une région d’une micrographie. (c) et (d) Particules prélevées automatiquement à superviser pour créer un ensemble de particules d’entraînement pour la méthode de prélèvement automatique Xmipp. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 4. Sélection consensuelle profonde avec le résultat Xmipp. Le paramètre zScoreDeepLearning donne du poids à la bonté d’une particule et il est la clé pour découvrir les mauvaises particules. (a) Les valeurs zScores les plus basses sont associées à des artefacts. b) Les zScores les plus élevés sont associés à des particules contenant la macromolécule. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 5. Classification 2D avec résultat Cryosparc. Les classes générées (moyennes de sous-ensembles de particules provenant de la même orientation) sont affichées. Plusieurs bonnes classes sélectionnées en rouge (avec un certain niveau de détail) et quelques mauvaises classes non sélectionnées (classes bruyantes et non centrées). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 6. Volume initial 3D avec résultat consensuel en essaim. Vue du volume initial 3D obtenu après l’exécution de l’outil de consensus xmipp3 - swarm consensus, en utilisant les estimations de volume initiales 3D précédentes de Xmipp et Relion. a) Le volume est représenté par des tranches. b) Visualisation 3D du volume. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 7. Raffinement d’un volume initial 3D avec résultat Relion. a) Courbe FSC obtenue, franchissant le seuil à 4,5Å, approximativement. b) Couverture angulaire représentée sous forme de vue supérieure de la sphère 3D. Dans ce cas, comme il n’y a pas de symétrie, les particules assignées doivent couvrir toute la sphère. c) Volume raffiné représenté par des tranches. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 8. Alignement 3D basé sur le deep learning avec résultat Xmipp. Les résultats générés par xmipp3 - méthode d’alignement profond pour l’alignement 3D. a) L’affectation angulaire de chaque particule sous forme de matrice de transformation. b) La couverture angulaire. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 9. Résultat du consensus sur l’alignement 3D. a) Liste des particules présentant les différences obtenues dans les paramètres de décalage et d’angle. b) Graphique des différences angulaires par particule. c) Graphique de la différence de décalage par particule. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 10. Itération finale du résultat du raffinement 3D. a) Courbe FSC. b) Volume obtenu en pleine résolution par tranches. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 11. Analyse de résolution locale avec résultat Xmipp. Résultats de la méthode xmipp3 - MonoRes local. (a) Certaines tranches représentatives colorées avec la valeur de résolution par voxel, comme indiqué dans le code couleur. b) Histogramme de résolution locale. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 12. Affûtage avec résultat Xmipp. Résultats de xmipp3 - méthode d’affûtage localdeblur. a) Liste des volumes obtenus par itération. b) Volume 3D obtenu après la dernière itération représenté par des tranches. c) Une représentation 3D du volume final. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 13. Valider l’outil de surajustement dans le résultat Xmipp. Résultats de xmipp3 - validation du surajustement. La ligne verte correspond à la reconstruction à partir des données, la ligne rouge au bruit. a) Inverse de la résolution au carré avec le logarithme du nombre de particules. b) Résolution avec le nombre de particules. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 14. Plusieurs représentations 3D du volume obtenu. a) Volume prétraité. b) Volume post-traité. (c) Résolution locale, les voxels bleu foncé sont ceux avec une résolution plus élevée (2,75Å) et les voxels rouge foncé sont ceux avec une résolution inférieure (10,05Å). d) Zoomez sur le volume post-traité où l’on peut voir une hélice alpha (ovale rouge). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 15. Exemple d’une mauvaise reconstruction 3D. a) Courbe FSC avec une chute brutale et franchissant le seuil à basse résolution. b) Histogramme de résolution locale. c) Volume 3D par tranches. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 16. Exemple de classes 2D. a) Bonnes classes montrant un certain niveau de détail. (b) Mauvaises classes contenant du bruit et des artefacts (partie supérieure obtenue avec Xmipp, partie inférieure avec CryoSparc). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 17. Exemple de volume initial 3D avec différentes qualités. a) Bon volume initial où la forme de la macromolécule peut être observée. b) Mauvais volume initial lorsque la forme obtenue est complètement différente de celle attendue. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure supplémentaire 1. Création d’un projet Scipion. Fenêtre affichée par Scipion où un ancien projet peut être sélectionné ou un nouveau peut être créé en donnant un nom et un emplacement pour ce projet. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 2. Méthode d’importation de films. Fenêtre affichée par Scipion lorsque pwem - importer des films est ouvert. Ici, les principaux paramètres d’acquisition doivent être inclus pour permettre aux films disponibles d’être traités dans Scipion. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 3. Méthode d’alignement de film. Fenêtre affichée par Scipion lorsque xmipp3 - alignement optique est utilisé. Les films d’entrée, la plage d’images considérées pour l’alignement et certains autres paramètres pour traiter les films doivent être remplis. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 4. Méthode d’estimation CTF avec Ctffind. Le formulaire dans Scipion avec tous les champs nécessaires pour exécuter le programme Ctffind. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 5. Assistant dans Scipion. Un assistant pour aider l’utilisateur à remplir certains paramètres du formulaire. Dans ce cas, l’assistant doit remplir le champ de résolution dans la méthode grigoriefflab - ctffind . Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 6. Méthode de raffinement CTF avec Xmipp. La forme de xmipp3 - estimation ctf avec tous les paramètres pour faire un raffinement d’un CTF précédemment estimé. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 7. Méthode de micrographies préprocessus. La forme de xmipp3 - micrographies de prétraitement qui permet d’effectuer certaines opérations sur eux. Dans cet exemple, Supprimer les pixels défectueux et échantillonner les micrographies est utile. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 8. Méthode de cueillette avec Cryolo. Formulaire permettant d’exécuter la méthode de prélèvement Cryolo à l’aide d’un réseau préentraîné. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 9. Méthode de sélection de consensus avec Xmipp. La forme de xmipp3 - deep consensus picking basé sur le deep learning pour calculer un consensus de coordonnées, en utilisant un réseau préentraîné sur plusieurs ensembles de coordonnées obtenues avec différentes méthodes de picking. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 10. Méthode d’extraction de particules. Onglets d’entrée et de prétraitement de xmipp3 - particules d’extraction. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 11 .3D méthode du volume initial avec Xmipp. La forme de la méthode xmipp3 - reconstruire significatif pour obtenir une carte 3D initiale. Les onglets Entrée et Critères s’affichent. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 12. Méthode de redimensionnement du volume. Forme permettant de recadrer ou de redimensionner un volume. Dans cet exemple, cette méthode est utilisée pour générer un volume en taille réelle après xmipp3 - reconstruire significatif. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 13 .3D volume initial avec le résultat de Relion. Une vue du volume initial 3D obtenu avec relion - méthode de modèle initial 3D par tranches. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 14. Raffinement du volume initial avec Relion. La forme de la méthode relion - 3D auto-refine. Dans cet exemple, il a été utilisé pour affiner un volume initial estimé après consensus. Les onglets Carte 3D Entrée et Référence s’affichent. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 15 .3D méthode de classification. Forme de relion - classification 3D. Les onglets Entrée, Carte 3D de référence et Optimisation sont affichés. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 16 .3D alignement basé sur une méthode d’apprentissage profond. Formulaire ouvert pour la méthode xmipp3 - alignement profond. Ici, il est nécessaire d’entraîner un réseau avec un ensemble d’entraînement, puis ce réseau prédira l’affectation angulaire par particule. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 17 .3D méthode de raffinement. Forme de la méthode xmipp3 - highres . Onglets Entrée et Affectation angulaire sont affichés. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 18. Première itération du résultat du raffinement 3D. a) Courbe FSC. b) Volume obtenu (d’une taille inférieure à la résolution totale) représenté sous forme de tranches. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 19. Première itération de l’analyse de corrélation de raffinement 3D. Une nouvelle fenêtre apparaît en cliquant sur l’icône de la barre dans la partie supérieure de la fenêtre avec la liste des particules. Dans la fenêtre Colonnes du tracé , un histogramme du paramètre estimé souhaité peut être créé. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 20. Outil de surajustement de validation. Forme de xmipp3 - valider la méthode de surajustement . Veuillez cliquer ici pour télécharger ce fichier.
Actuellement, cryo-EM est un outil clé pour révéler la structure 3D des échantillons biologiques. Lorsque de bonnes données sont collectées au microscope, les outils de traitement disponibles nous permettront d’obtenir une reconstruction 3D de la macromolécule étudiée. Le traitement des données Cryo-EM est capable d’atteindre une résolution quasi atomique, ce qui est essentiel pour comprendre le comportement fonctionnel d’une macromolécule et est également crucial dans la découverte de médicaments.
Scipion est un logiciel qui permet de créer l’ensemble du flux de travail en combinant les packages de traitement d’image les plus pertinents de manière intégrative, ce qui contribue à la traçabilité et à la reproductibilité de l’ensemble du flux de travail de traitement d’image. Scipion fournit un ensemble très complet d’outils pour effectuer le traitement; cependant, l’obtention de reconstructions à haute résolution dépend entièrement de la qualité des données acquises et de la manière dont ces données sont traitées.
Pour obtenir une reconstruction 3D haute résolution, la première exigence est d’obtenir de bons films à partir du microscope, qui préservent les informations structurelles à haute résolution. Si ce n’est pas le cas, le workflow ne sera pas en mesure d’extraire des informations haute définition des données. Ensuite, un flux de travail de traitement réussi devrait être capable d’extraire des particules qui correspondent vraiment à la structure et de trouver les orientations de ces particules dans l’espace 3D. Si l’une des étapes du flux de travail échoue, la qualité du volume reconstruit sera dégradée. Scipion permet d’utiliser différents packages dans n’importe quelle étape de traitement, ce qui aide à trouver l’approche la plus adéquate pour traiter les données. De plus, grâce à la disponibilité de nombreux packages, des outils de consensus, qui augmentent la précision en trouvant un accord dans les résultats estimés de différentes méthodes, peuvent être utilisés. En outre, il a été discuté en détail dans la section Résultats représentatifs plusieurs outils de validation et comment identifier des résultats précis et inexacts à chaque étape du flux de travail, pour détecter les problèmes potentiels et comment essayer de les résoudre. Il existe plusieurs points de contrôle le long du protocole qui pourraient aider à réaliser si le protocole fonctionne correctement ou non. Certains des plus pertinents sont: le picking, la classification 2D, l’estimation initiale du volume et l’alignement 3D. La vérification des entrées, la répétition de l’étape avec une méthode différente ou l’utilisation du consensus sont des options disponibles dans Scipion que l’utilisateur peut utiliser pour trouver des solutions lorsque des problèmes apparaissent.
En ce qui concerne les approches précédentes de l’intégration de paquets dans le domaine Cryo-EM, Appion31 est le seul qui permet une intégration réelle de différents progiciels. Cependant, Appion est étroitement lié à Leginon32, un système de collecte automatisée d’images à partir de microscopes électroniques. La principale différence avec Scipion est que le modèle de données et le stockage sont moins couplés. De cette façon, pour créer un nouveau protocole dans Scipion, seul un script Python doit être développé. Toutefois, dans Appion, le développeur doit écrire le script et modifier la base de données sous-jacente. En résumé, Scipion a été développé pour simplifier la maintenance et l’extensibilité.
Nous avons présenté dans ce manuscrit un flux de travail complet pour le traitement Cryo-EM, en utilisant l’ensemble de données de cas réels du ribosome Plasmodium falciparum 80S (entrée EMPIAR: 10028, entrée EMDB: 2660). Les étapes couvertes et discutées ici peuvent être résumées comme l’alignement du film, l’estimation CTF, la sélection des particules, la classification 2D, l’estimation initiale de la carte, la classification 3D, le raffinement 3D, l’évaluation et le post-traitement. Différents packages ont été utilisés et des outils de consensus ont été appliqués dans plusieurs de ces étapes. Le volume final reconstruit en 3D a atteint une résolution de 3 Å et, dans le volume post-traité, certaines structures secondaires peuvent être distinguées, comme les hélices alpha, ce qui aide à décrire comment les atomes sont disposés dans l’espace.
Le flux de travail présenté dans ce manuscrit montre comment Scipion peut être utilisé pour combiner différents packages Cryo-EM de manière simple et intégrative afin de simplifier le traitement et d’obtenir des résultats plus fiables en même temps.
À l’avenir, le développement de nouvelles méthodes et de nouveaux packages continuera de croître et des logiciels comme Scipion pour les intégrer facilement seront encore plus importants pour les chercheurs. Les approches consensuelles seront plus pertinentes même dans ce cas, lorsque de nombreuses méthodes avec des bases différentes seront disponibles, ce qui aidera à obtenir des estimations plus précises de tous les paramètres impliqués dans le processus de reconstruction dans Cryo-EM. Le suivi et la reproductibilité sont essentiels dans le processus de recherche et plus faciles à réaliser avec Scipion grâce à un cadre commun pour l’exécution de flux de travail complets.
Les auteurs n’ont rien à divulguer.
Les auteurs souhaitent reconnaître le soutien économique du ministère espagnol de la Science et de l’Innovation par le biais de subventions: PID2019-104757RB-I00/AEI/10.13039/501100011033, de la « Comunidad Autónoma de Madrid » par le biais d’une subvention: S2017/BMD-3817, Instituto de Salud Carlos III, PT17/0009/0010 (ISCIII-SGEFI/ERDF), de l’Union européenne (UE) et d’Horizon 2020 par le biais d’une subvention: INSTRUCT - ULTRA (INFRADEV-03-2016-2017, Proposition: 731005), EOSC Life (INFRAEOSC-04-2018, Proposition: 824087), iNEXT - Discovery (Proposition : 871037) et HighResCells (ERC - 2018 - SyG, Proposition : 810057). Le projet qui a donné lieu à ces résultats a reçu le soutien d’une bourse de la Fondation « la Caixa » (ID 100010434). Le code de bourse est LCF/BQ/DI18/11660021. Ce projet a reçu un financement du programme de recherche et d’innovation Horizon 2020 de l’Union européenne dans le cadre de la convention de subvention Marie Skłodowska-Curie n° 713673. Les auteurs reconnaissent le soutien et l’utilisation des ressources d’Instruct, un projet Landmark ESFRI.
Name | Company | Catalog Number | Comments |
no material is used in this article | - | - | - |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon