* Ces auteurs ont contribué à parts égales
Une méthode avancée de sélection de particules pour la cryo-EM, à savoir CryoSieve, améliore la résolution de la carte de densité en supprimant la majorité des particules dans les piles finales, comme le démontre son application sur un ensemble de données du monde réel.
Au cours de la dernière décennie, les progrès technologiques et méthodologiques dans le domaine de la microscopie électronique cryogénique (cryo-EM) et de l’analyse de particules uniques (SPA) ont considérablement amélioré notre capacité d’examen structurel à haute résolution des macromolécules biologiques. Cette avancée a inauguré une nouvelle ère de connaissances moléculaires, remplaçant la cristallographie aux rayons X comme méthode dominante et fournissant des réponses à des questions de longue date en biologie. Étant donné que la cryo-EM ne dépend pas de la cristallisation, ce qui est une limitation importante de la cristallographie aux rayons X, elle capture des particules de qualité variable. Par conséquent, la sélection des particules est cruciale, car la qualité des particules sélectionnées influence directement la résolution de la carte de densité reconstruite. Une approche itérative innovante pour la sélection des particules, appelée CryoSieve, améliore considérablement la qualité des cartes de densité reconstruites en réduisant efficacement le nombre de particules dans la pile finale. Des preuves expérimentales montrent que cette méthode peut éliminer la majorité des particules dans les piles finales, ce qui entraîne une amélioration notable de la qualité des cartes de densité. Cet article décrit le flux de travail détaillé de cette approche et présente son application sur un ensemble de données du monde réel.
L’analyse de particules uniques (SPA) par microscopie électronique cryogénique (cryo-EM) est devenue une méthode dominante pour déterminer des cartes de densité tridimensionnelles à haute résolution de macromolécules biologiques. Grâce à une série d’innovations technologiques 1,2,3,4,5,6, appelées révolution de résolution 7, la cryo-EM a la capacité de déterminer les structures de macromolécules biologiques avec une résolution atomique allant jusqu’à un rythme sans précédent. Cette percée marque le début d’une nouvelle ère dans les connaissances moléculaires, dépassant la cristallographie aux rayons X en tant que technique prédominante et répondant à des questions biologiques de longue date.
La Cryo-EM SPA s’écarte de la cristallographie aux rayons X en ne nécessitant pas la cristallisation de macromolécules biologiques. Au lieu de cela, une solution contenant les macromolécules biologiques cibles est rapidement congelée dans de la glace vitrée. Il est ensuite imagé à l’aide d’un faisceau d’électrons pour produire une série de micrographies, en contournant le besoin de cristallisation8. Par la suite, des algorithmes de sélection de particules sont utilisés pour extraire des particules brutes individuelles de ces micrographies 4,9,10,11,12. Comme la cryo-EM ne dépend pas de la cristallisation, il est naturel que les particules extraites soient principalement endommagées ou dans des états conformationnels indésirables, ce qui nécessite plusieurs cycles de sélection de particules pour obtenir une carte de densité à haute résolution. Dans le traitement d’images cryo-EM SPA, la sélection des particules est donc cruciale pour obtenir des cartes de densité à haute résolution13.
Dans la cryo-EM SPA, les méthodes standard de sélection des particules comprennent la classification bidimensionnelle (2D) et tridimensionnelle (3D)14. La classification 2D catégorise les particules en un nombre prédéfini de groupes, ce qui permet d’obtenir une image moyenne et une résolution 2D estimée pour chaque classe. Les chercheurs peuvent ensuite inspecter visuellement ces classes, en supprimant les particules des groupes à faible résolution pour utiliser les autres dans des reconstructions visant à atteindre une résolution plus élevée. Une fois que les poses des particules auront été établies à l’aide d’algorithmes de raffinement, les chercheurs procéderont à la classification 3D, en regroupant les particules en plusieurs classes. Cela permet une inspection visuelle de la carte de densité reconstruite pour chaque classe, ce qui permet d’exclure les particules indésirables, telles que celles provenant de conformations indésirables. Après plusieurs cycles de classification, on obtient un dernier empilement comprenant des particules de qualité relativement élevée. Ces empilements finaux jouent un rôle déterminant dans la production de cartes de densité à résolution atomique ou quasi atomique.
Zhu et ses collègues ont démontré qu’une sélection supplémentaire de particules peut être effectuée sur ces empilements finaux15. CryoSieve15, une méthode itérative innovante pour la sélection des particules, peut être appliquée pour améliorer la qualité de la carte de densité finale en réduisant considérablement le nombre de particules. Bien que d’autres critères et logiciels de tri des particules, tels que la méthode de corrélation croisée normalisée (NCC)16, l’approche de cohérence de graphe angulaire (AGC)17 et la classification de non-alignement5, soient actuellement utilisés sur le terrain, il a été démontré que cette méthode surpasse ces algorithmes en termes d’efficacité.
Dans cette étude, nous présentons un guide détaillé de l’ensemble du processus. À titre d’étude de cas, nous avons appliqué cette nouvelle méthode à l’ensemble de données du trimère d’hémagglutinine de la grippe (entrée EMPIAR : 10097)18, qui comprend 130 000 particules dans sa pile finale. Notre procédure a réussi à éliminer environ 73,8 % des particules de la dernière pile de cet ensemble de données, améliorant ainsi la résolution de la carte de densité reconstruite de 4,11 Å à 3,62 Å. En plus du trimère de l’hémagglutinine de la grippe, les résultats de plusieurs ensembles de données sont présentés dans une publication antérieure15, mettant en évidence une variété de résolutions et de poids moléculaires de biomolécules.
1. L’installation
2. Tamis des particules
3. Trouver l’itération optimale
Dans ce protocole, nous avons utilisé l’ensemble de données sur le trimère de l’hémagglutinine de la grippe (entrée EMPIAR : 10097) comme démonstration de l’efficacité de ce processus. En raison de l’orientation préférée de l’échantillon, l’acquisition des données a nécessité une inclinaison à 40°. La protéine présente une symétrie C3 et a un poids moléculaire de 150 kDa.
Nous avons mis en œuvre le protocole décrit précédemment pour traiter l’empilement final de particules. Il a progressivement éliminé 20 % des particules à chaque itération, ce qui a donné un taux de rétention de 80,0 %, 64,0 %, 51,2 %, etc. Comme le montrent les figures 1 et 2, la résolution des particules retenues s’est initialement améliorée, mais a finalement diminué. Parmi les itérations, la 6e itération a été identifiée comme le sous-ensemble le plus optimal, contenant le moins de particules tout en atteignant la résolution la plus élevée. Notre algorithme a réussi à identifier un sous-ensemble de particules ne représentant que 26,2 % de l’empilement d’origine, ce qui a permis d’améliorer la résolution de 4,19 Å à 3,62 Å (réestimée par CryoSPARC), comme le montre la figure 2. De plus, les cartes de densité avant et après l’utilisation de CryoSieve ont été comparées dans la figure 3. La courbe de corrélation de l’enveloppe de Fourier (FSC) et les demi-cartes de la courbe FSC des cartes de densité reconstruites avant et après la méthode sont également illustrées (figure 3A-B). Les cartes de densité brutes et les cartes de densité nettes obtenues ont également été comparées, avec le niveau de contour équivalent appliqué (figure 3C). Les chaînes latérales de cartes de densité nettes ont été comparées, montrant l’amélioration des cartes de densité reconstruites. Le facteur B de Rosenthal-Henderson estimé a également été adopté pour le critère de la qualité des particules19. Après avoir éliminé la majorité des particules de la pile finale, le facteur B de Rosenthal-Henderson est passé de 226,9 Å2 à 146,2 Å2 (Figure 3D). La résolution locale, le facteur Blocal 20 et le ResLog21 ont également été utilisés pour la comparaison, indiquant que CryoSieve améliore effectivement à la fois la qualité des cartes de densité et des particules (Figure 4).
Figure 1 : Résolutions de chaque itération. Les résolutions qui ont été signalées sont mises en évidence dans des encadrés rouges. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 2 : Résolutions de chaque itération. Les résolutions identifiées par des tâches d’affinement homogènes sont mises en évidence dans des cases rouges. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 3 : Cartes de densité. (A) Comparaison de la courbe FSC modèle-carte des cartes de densité reconstruites avant et après l’utilisation de CryoSieve. L’axe des y représente le FSC, tandis que l’axe des x représente la résolution. La ligne pointillée rouge marque le seuil de 0,5 pour le FSC. La ligne pointillée verticale illustre la résolution des cartes de densité obtenues sous un seuil de 0,5. (B) Des demi-cartes de la courbe FSC ont été obtenues à partir de cartes de densité reconstruites avant et après l’utilisation de CryoSieve via CryoSPARC. L’axe des y représente le FSC, tandis que l’axe des x représente la résolution. (C) Des cartes de densité brutes et des cartes de densité nettes ont été présentées à la fois pour les particules retenues par CryoSieve et pour l’ensemble complet des particules dans les piles finales. Le niveau de contour équivalent de 0,65 a été appliqué pour les cartes de densité brutes. Le niveau de contour équivalent de 0,84 a été appliqué pour les cartes de densité nettes. Des cartes de densité précises ont été obtenues directement par CryoSPARC. Les cartes de densité nettes ont été post-traitées automatiquement, d’abord pondérées par FSC (sur la base des FSC fournies par CryoSPARC). Ensuite, le facteur B a été affûté à l’aide des facteurs B auto-déterminés (232,0 Å2 pour toutes les particules de la pile finale et 160,8 Å2 pour CryoSieve). Les chaînes latérales des cartes de densité nettes ont été comparées, en incorporant des modèles atomiques comme référence. Les flèches rouges mettent en évidence les régions améliorées. (D) Le facteur B de Rosenthal-Henderson estimé a été montré à la fois pour les particules retenues par CryoSieve et pour l’ensemble complet des particules dans les cheminées finales. L’axe des y représente le nombre de particules utilisées, et l’axe des x représente l’inverse du carré de la résolution. En se déplaçant de haut en bas, chaque point représente la moitié des particules du précédent. Les résolutions ont été déterminées par le raffinement. Les facteurs B ont été déterminés à l’aide d’une approximation des points mesurés par les moindres carrés, comme le montrent les courbes d’ajustement. Les facteurs B estimés de Rosenthal et Henderson sont indiqués dans les légendes : l’orange représente les particules retenues par CryoSieve, tandis que le bleu désigne toutes les particules de la pile finale. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 4 : Comparaison de diverses mesures de cartes de densité. (A) Comparaison de cartes de résolution locale avant et après l’utilisation de CryoSieve obtenues par CryoSPARC. La résolution locale varie entre 7 Å (rouge) et 3,5 Å (bleu). (B) Comparaison des cartes de densité avant et après l’utilisation de CryoSieve, colorées avec la carte locale du facteur B obtenue par LocBFactor en utilisant une plage de résolution de [20-3,5] Å. (C), Comparaison des parcelles ResLog avant et après l’utilisation de CryoSieve obtenue par CryoSPARC. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure supplémentaire 1 : Utilisation des commandes nvidia-smi et conda -V pour vérifier les conditions préalables. Si les conditions préalables sont remplies, la saisie de la commande nvidia-smi affichera la version du pilote GPU, la version CUDA et l’état des cartes GPU. De même, la saisie de la commande conda -V devrait afficher correctement la version installée de Conda. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 2 : Le processus de création de nouveaux environnements d’accélération GPU. L’écran affiche la sortie générée par la commande utilisée pour créer l’environnement Conda. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 3 : Installation de CryoSieve dans l’environnement d’accélération GPU. Après avoir activé l’environnement Conda nouvellement créé, l’écran affiche le résultat de l’exécution de la commande d’installation de CryoSieve à l’aide de Pip. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 4 : Informations d’aide. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 5 : Processus en cours. Lors de l’exécution de CryoSieve via la ligne de commande, l’écran affiche alors des informations concernant le processus en cours. Veuillez cliquer ici pour télécharger ce fichier.
Figure supplémentaire 6 : La configuration des tâches de CryoSPARC. (A) Importer la pile de particules. (B) Importer des volumes 3D. (C-D) Raffinement homogène. Veuillez cliquer ici pour télécharger ce fichier.
Dossier supplémentaire 1 : Options de CryoSieve. Veuillez cliquer ici pour télécharger ce fichier.
Dossier supplémentaire 2 : Temps de traitement et exigence minimale pour faire fonctionner Cryosieve. Veuillez cliquer ici pour télécharger ce fichier.
Dossier supplémentaire 3 : Génération du modèle initial par CryoSPARC. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 4 : Justification de l’inactivation de la réactivation de la réactivation de la division GS. Veuillez cliquer ici pour télécharger ce fichier.
Dossier supplémentaire 5 : Options de cryosieve-csrefine. Veuillez cliquer ici pour télécharger ce fichier.
Dossier supplémentaire 6 : Options du cryotamiseur-csrhbfactor. Veuillez cliquer ici pour télécharger ce fichier.
La cryo-EM est une technique essentielle pour élucider les structures des molécules biologiques. Dans ce processus, après la collecte des données par microscopie, l’extraction des particules à partir des micrographies est essentielle, suivie de leur classification en plusieurs étapes pour compiler la pile finale. Un défi courant est la prédominance de particules endommagées ou non conformées de manière indésirable, ce qui souligne la nécessité d’une sélection répétée des particules pour obtenir des cartes de densité à haute résolution. La sélection des particules est donc une étape critique de la cryo-EM SPA pour obtenir des cartes de densité de haute qualité. Les techniques de sélection de particules existantes comprennent l’algorithme de validation statistique sans inclinaison22, l’approche basée sur le score z23 et la méthode d’estimation de la précision angulaire24.
CryoSieve apparaît comme un outil précieux dans ce contexte, capable d’éliminer un nombre important de particules étrangères de la pile finale. Cette réduction améliore non seulement l’efficacité de calcul de la reconstruction, mais rationalise également le processus. Il offre une suite complète pour la sélection des particules, où l’ampleur des rejets de particules et l’amélioration conséquente de la résolution dépendent en grande partie de la qualité initiale des données et des méthodologies employées dans le traitement des données.
Dans ce manuscrit, nous avons présenté un flux complet de criblage de particules à l’aide de l’ensemble de données de cas réels de trimère d’hémagglutinine de grippe (entrée EMPIAR : 10097). Les étapes couvertes et discutées ici peuvent être résumées comme le tamisage des particules et la réestimation de la pose. Le volume final reconstruit en 3D a atteint une résolution de 3,62 Å, et les chaînes latérales en hélices alpha étaient plus claires dans le volume post-traité par rapport à la carte de densité publiée.
CryoSieve est une méthode open-source qui est disponible sur GitHub (https://github.com/mxhulab/cryosieve). Un tutoriel détaillé peut également être trouvé sur sa page d’accueil. Les utilisateurs peuvent l’installer et l’utiliser en suivant le tutoriel. De plus, deux modules, cryosieve-csrefine et cryosieve-csrhbfactor, sont fournis. Le module cryosieve-csrefine est spécialement conçu pour automatiser l’exécution séquentielle de diverses opérations au sein de CryoSPARC (Fichier supplémentaire 5). Ces opérations comprennent l’importation d’empilements de particules et la réalisation de travaux de raffinement ab initio, homogènes ou non uniformes. D’autre part, le module cryosieve-csrhbfactor est conçu pour automatiser la détermination du facteur B de Rosenthal-Henderson en exploitant les capacités de cryosieve-csrefine (Fichier supplémentaire 6).
À l’heure actuelle, l’application de cette méthode est limitée aux scénarios de conformation unique. Par conséquent, dans les cas où les particules représentent plusieurs conformations, leurs capacités sont limitées. Il est conseillé aux utilisateurs de s’engager d’abord dans la classification 3D pour séparer les particules de conformations disparates avant de l’utiliser pour une sélection raffinée des particules. De plus, bien que la méthode démontre sa capacité à filtrer plus de 50 % des particules de la pile finale, l’origine de ces particules rejetées et les raisons sous-jacentes de leur contribution négligeable à la qualité de la reconstruction restent incertaines. Cette lacune dans la compréhension nécessite des recherches supplémentaires pour aborder de manière exhaustive et éventuellement rectifier cette limitation.
Il existe trois méthodes possibles de tri ou de tamisage des particules. Tout d’abord, cisTEM4 peut rapporter un score pour chaque image de particule après raffinement 3D. Les utilisateurs pouvaient trier les particules à l’aide du score cisTEM pour éliminer les particules. L’approche AGC (Angular Graph Consistency)17 est également une méthode pour éliminer les particules mal alignées. De plus, la classification de non-alignement5 est une méthode traditionnelle d’élimination des particules à l’aide de la classification 3D. Nous avons comparé la qualité des particules retenues par ces méthodes avec CryoSieve et avons constaté que les particules retenues de CryoSieve sont de meilleure qualité15. La méthode présentée ici surpasse considérablement les méthodes alternatives et permet d’obtenir le plus petit nombre de particules à la même résolution.
Comme le démontre le résultat, la majorité des particules d’une pile finale cryo-EM ne contribuent pas à la reconstruction de la carte de densité. En d’autres termes, parmi toutes les particules recueillies lors de l’acquisition de l’image, seules quelques-unes, à savoir le sous-ensemble le plus fin, contribuent réellement à la reconstruction finale. Par conséquent, le rapport entre ce dernier sous-ensemble et le nombre total de particules collectées pourrait servir de mesure quantitative pour évaluer la qualité de l’échantillon. Plus ce rapport est élevé, meilleure est la qualité de l’échantillon. Malgré les progrès techniques qui ont rendu la cryo-EM plus accessible aux biologistes structurels, la préparation des échantillons reste un goulot d’étranglement majeur dans le flux de travail. Les scientifiques et les ingénieurs concentrent donc leurs efforts sur ce défi25. Dans l’analyse des particules uniques (SPA), la préparation des échantillons se compose de deux étapes cruciales : l’optimisation des échantillons et la préparation de la grille. La première consiste à purifier l’échantillon tout en maintenant son état biochimique optimal. Ce dernier implique la préparation de l’échantillon pour l’analyse au microscope, y compris le traitement chimique ou plasma de la grille, le dépôt de l’échantillon et la vitrification. De nombreuses techniques ont été proposées pour traiter l’instabilité macromoléculaire, mais l’efficacité d’une approche par rapport à une autre dépend des caractéristiques de l’échantillon25,26. À l’heure actuelle, les résultats de la préparation du réseau sont fortement influencés par l’expertise et l’expérience de l’utilisateur, ce qui peut rendre le processus long et difficile27,28. Les nombreuses variables rencontrées dans la préparation de l’échantillon et de la grille posent des défis pour établir des relations de cause à effet, car les chercheurs ne peuvent évaluer l’échantillon au niveau moléculaire qu’à l’aide du microscope. En conséquence, les statistiques quantitatives provenant de comparaisons de différents protocoles de préparation d’échantillons et de grilles font toujours défaut, et une approche systématique est nécessaire pour étudier les tendances et comprendre les mécanismes fondamentaux du comportement de l’échantillon29.
Tous les autres auteurs ne déclarent aucun intérêt concurrent.
Ce travail a été soutenu par l’Académie de recherche et de traduction de Shenzhen (à M.H.), le Centre d’innovation avancée pour la biologie structurale (à M.H.), le Beijing Frontier Research Center for Biological Structure (à M.H.), le National Key R&D Program of China (n° 2021YFA1001300) (à C.B.), la National Natural Science Foundation of China (n° 12271291) (à C.B.), et la Fondation nationale des sciences naturelles de Chine (n° 12071244) (à Z.S.).
Name | Company | Catalog Number | Comments |
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon