Method Article
Segmentation des données tridimensionnelles de nombreuses techniques d’imagerie est un goulot d’étranglement majeur dans l’analyse des systèmes biologiques complexes. Nous décrivons ici l’utilisation de SuRVoS établi à semi-automatiquement segment volumétrique des données diverses échelles de longueur à l’aide d’ensembles de données exemple de tomographie cryo-électronique, cryo tomographie à rayons x mou et techniques de tomographie aux rayons x phase contraste.
La segmentation est le processus consistant à isoler des régions ou des objets dans un volume imagé, afin qu’une étude plus approfondie peut être pratiquée que sur ces domaines d’intérêt. Lors de l’examen de l’analyse des systèmes biologiques complexes, la segmentation des données d’image en trois dimensions est une étape intensive de votre temps et du travail. Avec l’augmentation de la disponibilité de nombreuses modalités d’imagerie et systèmes de collecte de données automatisée, cela représente un défi accru pour le biologiste expérimental modern déplacer des données à la connaissance. Cette publication décrit l’utilisation de SuRVoS Workbench, un programme visant à résoudre ces problèmes en fournissant des méthodes pour semi-automatiquement segment complexe biologique données volumétriques. Trois ensembles de données de différant de grossissement et de modalités d’imagerie sont présentés ici, chacune mettant en évidence les différentes stratégies de segmentation avec SuRVoS. Phase contraste aux rayons x tomographie (microCT) de l’organe de fructification d’une plante est utilisée pour démontrer à l’aide de la formation de modèle de segmentation, tomographie cryo d’électrons (cryoET) des plaquettes humaines sert à démontrer la segmentation en utilisant super - et megavoxels et cryo doux Tomographie à rayons x (cryoSXT) d’une lignée de cellules de mammifères est utilisée pour démontrer l’étiquette fractionnement des outils. Stratégies et paramètres pour chaque type de données sont également présentées. En mélangeant une sélection des processus semi automatiques en un seul outil interactif, SuRVoS offre plusieurs avantages. Dans l’ensemble temps de données volumétriques de segment est réduit par un facteur de cinq par rapport à la segmentation manuelle, un pilier dans de nombreux domaines de traitement d’image. Il s’agit d’une économie importante quand segmentation manuelle complète peut prendre des semaines d’efforts. En outre, subjectivité est adressée par l’utilisation de limites identifiées par le calcul et fendage complexes collections d’objets par leurs propriétés calculées, plutôt que sur une base de cas-par-cas.
Le SuRVoS Workbench est un logiciel conçu pour permettre aux chercheurs d’extraire des informations scientifiquement pertinentes de données volumétriques de divers échantillons, indépendamment de la structure d’intérêt, de résolution ou de l' imagerie de la modalité1, 2. Données volumétriques tels que ceux-ci sont souvent recueillies à l’aide de systèmes de tomographie aux rayons x ou électrons, systématiquement basé au grand laboratoires ou installations centralisées en raison de leur complexité. Tous deux de ces méthodes et autres techniques, produits grand, ensembles de données riche d’informations qui s’avèrent difficiles à segment avec deux méthodes semi-automatique ou manuelle. En particulier, état quasi native cryo-immobilisé datasets exigent des conditions d’imagerie faible dose, ce qui entraîne un faible rapport signal-bruit et un faible contraste, en particulier en cryo electron tomography (cryoET)3,4,5 . Un autre facteur dans certains ensembles de données 3D est la présence d’artefacts introduits par les difficiles conditions expérimentales impliquées, par exemple des artefacts coin manquant en raison de la collecte de données sur un nombre limité inclinaison gamme, ayant pour résultat les informations manquantes et allongement dans la direction du faisceau3,4,5. Même si bas signal sur bruit ou manquant cale artefacts ne sont pas problématiques (par exemple concentré de faisceau d’ions SEM6 ou bloc serial face SEM7), la complexité et la nature en trois dimensions de l’échantillon et la grande quantité de données signifient analyse serait bénéficier d’un processus automatisé pour la segmentation des données.
Actuellement, lorsqu’on considère les volumes biologiques des cellules, il y a beaucoup d’options pour automatiquement ou semi-automatiquement identifiant cellulaires très caractéristiques, telles que l’actine, microtubules ou complexes de protéines spécifiques, à l’aide d’une recherche basée sur des modèles, ou pour identifier les caractéristiques de certains types d’ensembles de données (par exemple un contraste élevé, Taché, échantillons enrobées dans la résine)8,9,10,11,12. Toutefois, dans ces cas a priori informations ou protocoles de préparation témoin spécifiques sont nécessaires, limite l’application large de ces stratégies de segmentation. Il existe également des outils disponibles qui effectuent une formation au niveau voxel pour apprendre l’apparition de diverses structures d’intérêt lorsqu’il est administré d’entrée utilisateur13modèle. Toutefois, à ce niveau la complexité de la formation et les tests des modèles peut être sujettes à erreur et coûteuse. Compte tenu des conditions difficiles d’image et l’absence de stratégies de segmentation largement applicable, semi-automatique, segmentation manuelle est commune, même lorsque vous travaillez avec des matériaux biologiques complexes14,15, 16 , 17. Toutefois, il est généralement admis que le processus de segmentation manuelle n’est pas seulement beaucoup de temps, mais aussi sujette aux erreurs, subjectives et variables4,5,18,19 ,,20. Certains programmes de segmentation offrent des outils pour faciliter le processus de segmentation manuelle (c'est-à-dire l’interpolation, lasso ou outils de coup)21,22, toutefois, en cas de datasets bruyants, ils sont difficiles à appliquer avec succès, et même quand ils sont utilisés avec succès, le processus est toujours subjective et variable.
Traditionnellement, les segmentations ont été utilisées de deux manières distinctes : qualitativement ou quantitativement. Amélioreront les stratégies de segmentation et de technologies d’imagerie, il est devenu plus courant d’utiliser la segmentation comme un outil quantitatif pour répondre à des questions biologiques et comme une « vérité au sol » pour l’algorithme développement8,12, 15,23,24,25. Pour ce faire, que des mesures détaillées sont nécessaires pour diminuer la variabilité et la subjectivité dans le processus de26. Toutefois, ces précautions supplémentaires augmentent le caractère fastidieux de la segmentation. Pour cette raison, il est essentiel de fournir une stratégie de segmentation plus rapide et moins variable.
Le SuRVoS Workbench commence à régler ces questions en fournissant à l’utilisateur un choix de l’apprentissage automatique et les outils qui aident l’utilisateur dans le processus de segmentation, tout en également guider l’utilisateur à travers les étapes de traitement d’image. Pour ce faire, deux innovations clés sont mises en œuvre ensemble dans SuRVoS. Tout d’abord, il utilise une hiérarchie de Super-région au groupe semblable, les régions voisines des données basé sur leurs propriétés intrinsèques. Chacune des régions dans la hiérarchie représente le même volume en utilisant moins d’éléments, tout en assurant l’adhérence forte limite. Ainsi, Super-régions réduisent la complexité de la segmentation d’un volume de plusieurs ordres de grandeur mais représentent encore les données sans perte significative d’informations27. Deuxièmement, SuRVoS fournit une stratégie de segmentation semi-automatique qui utilise des entrées de segmentation manuelle minimale pour former les classificateurs, qui sont ensuite utilisés pour segmenter les restants du28,volume29. Cette stratégie réduit la segmentation manuelle, réduit considérablement le temps utilisateur segmenter d’et, lorsque vous utilisez des super-régions, retire manuelle délimitation des frontières, qui pourrait réduire la variabilité et la subjectivité.
Une autre caractéristique clé de SuRVoS est l’outil séparateur Label, par lequel un utilisateur peut classer une série d’objets déjà segmentés selon leurs propriétés inhérentes. Après la segmentation des différentes curiosités, cet outil peut servir à diviser l’ensemble en sous-classes basés sur des mesures telles que l’intensité de l’objet moyenne, variance, taille, emplacement, etc. c’est utile lors du classement des grands groupes d’objets avec grande complexité. Par exemple, un groupe d’organites cellulaires peut être divisé en vésicules vides, des gouttelettes lipidiques, mitochondries, etc.. ; ou un ensemble de matériel des inclusions peuvent être séparées basés sur la taille ou la forme. Une fois segmenté les étiquettes individuelles peut être divisée en groupes à l’aide de n’importe quel nombre de classificateurs, réduire les biais de l’identification.
Le SuRVoS Workbench a été utilisé avec succès à des données de segment de plusieurs techniques d’imagerie. Ici, synchrotron radiographie phase contraste la tomographie (microCT) de l’organe de fructification d’une plante est utilisée pour démontrer segmentatisur l’utilisation de formation modèle, tomographie cryo d’électrons (cryoET) des plaquettes humaines sert à démontrer la segmentation en utilisant super - et megavoxels et cryo douce tomographie à rayons x (cryoSXT) d’une lignée de cellules de mammifères est utilisée pour illustrer l’étiquette fractionnement des outils
Remarque : en général les gammes utiles des paramètres pour chaque étape du traitement et les paramètres spécifiques pour chaque type de données indiqué ici sont fournies dans le tableau 1.
1. préparer un espace de travail et le chargement des données
2. Prétraitement et représentation des données
3. Générant des super-régions
4. Introduction à l’Annotation
5. Formation de modèle à l’aide de segmentation a démontré un DataSet microCT.
Remarque : la première segmentation pour plusieurs ensembles de données consiste à différencier plusieurs grandes régions les uns des autres. Par exemple, séparer le noyau de cytoplasme, ou de la cellule de la structure extérieure de la glace et le soutien. Pour ce type de segmentation, avec des limites claires délimitées et grandes régions, la formation de modèle est utile. Pour illustrer cela, serviront données tomographiques de contraste phase à rayons x du Goosegrass.
6. Segmentation à l’aide des super-régions, a démontré un DataSet CryoET.
Remarque : puisque Super-région segmentation est utile pour les zones plus petites, discrètement liés, l’accent ici sera mis sur la segmentation des organites et des microtubules au sein de cet ensemble de données. Formation de modèle a été utilisée pour segmenter rapidement les plaquettes de la glace de fond et du carbone ; ces paramètres ne sont pas discutés plus loin, mais sont présentées au tableau 1.
7. Classification et analyse des données objets basés sur des caractéristiques inhérentes, ont démontré un DataSet CryoSXT
Remarque : en général, la prochaine étape après la segmentation est l’analyse des données. L’outil de séparateur d’étiquette dans SuRVoS permet la classification des objets segmentés à l’aide de règles fondées sur des caractéristiques intrinsèques des objets tels que l’intensité de l’objet moyenne, variance, volume ou position. L’outil de statistiques d’étiquette permet la visualisation des rapports entre ces mesures pour chaque nouvelle classe d’objet. Ce sont de nouveaux outils puissants pour l’analyse des ensembles de données 3D complexes après segmentation.
8. Exportation de données et segmentation
Trois ensembles de volume prélevé trois techniques différentes (microCT, cryoET et cryoSXT) ont été utilisés pour démontrer les trois caractéristiques importantes de SuRVoS Workbench : formation, segmentation Super-région et séparation d’étiquette de modèle. Les ensembles de données représentent un groupe diversifié de résultats expérimentaux, dont chacun des paramètres de traitement complet sont fournis (tableau 1).
Pour justifier d’une formation modèle aide SuRVoS Workbench, un dataset relativement contrastées avec définition des limites de la région a été choisi. Cet ensemble de données du fruit de Galium aparine, ou goosegrass, ont été recueillie à l’aide de la tomographie aux rayons x de contraste phase sur le I13-2 Diamond-Manchester Imaging Beamline au Diamond Light Source, Chilton, Oxfordshire, Royaume-Uni. Le nouvel échantillon a été monté en l’air sur un goniomètre base sur le dessus de la platine de rotation, à une échantillon-détecteur distance de 30 mm. exposition temps étaient 0,10 s avec le spectre de la rose de faisceau qui possède une énergie moyenne d’environ 22 keV. Les projections ont été recueillies par 180° avec une taille d’étape de 0,1 °. Reconstruction tomographique ont été effectuées à l’aide de Savu30,,31 , avec le filtre de Paganin pour contraste de phase axée sur la propagation des images32 suivie de reconstruction de projection arrière filtrés dans la boîte à outils ASTRA33 , 34. ces données fut ensuite réduites à 2 x 2 x 2 binning afin de réduire la taille du fichier avant d’être entrés dans le SuRVoS Workbench.
Tout d’abord, les données d’entrée (Figure 3 a) a été filtrées et serrées (pour supprimer les valeurs d’intensité supérieure et inférieure dans les données) (Figure 3 b). De cette façon, l’arrière-plan et premier plan ont été faites plus faciles à distinguer, et la texture de la structure interne du fruit s’est accentuée. Ensuite, les supervoxels ont été construits sur le dessus de l’ensemble de données filtré (Figure 3). Pour évaluer la qualité de le supervoxels, ils ont été affichés sans les données afin de vérifier que les détails pertinents de l’objet dataset sont bien représentées par le supervoxels (Figure 3D). Ensuite, manuelles des annotations à l’aide de supervoxels ont été fournies comme données d’entraînement sur trois tranches du volume (Figure 3E, les couleurs foncées). Ces données d’entraînement étaient suffisantes pour former le classificateur à prévoir (couleurs claires) les zones correspondant au fond (vert), les soies de fruits (rouge), les semences (violet) et qui entoure la chair (bleu). Raffinements morphologiques ont été utilisés pour nettoyer les segmentations par trous de remplissage, augmente ou diminue comme nécessaire (Figure 3F). Le temps total passé pour déterminer les paramètres appropriés et des segments de cet ensemble de données était de 2 h.
Pour démontrer la segmentation Super-région aide SuRVoS Workbench, un ensemble de données complexe et bruyant a choisi15. Cet ensemble de données ont été recueillie à l’aide de cryoET au Centre National d’imagerie macromoléculaires au Baylor College of Medicine, Houston, TX, USA. Brièvement, les plaquettes étaient plongeante figée à la lueur déchargé et les grilles TEM or carbone holey imprégnées d’alignement. Série d’inclinaison provenaient de ±65 ° avec un incrément de 2°. La série tilt a été reconstruite puis à l’aide de projection arrière pondérée l’IMOD35.
Après le chargement des données dans SuRVoS (Figure 4 a), une région d’intérêt a été sélectionnée et un ensemble de filtre approprié a été appliqué. Dans ce cas, un filtre gaussien lissage, suivi d’un filtre de la variation totale du contraste serré a été utilisé pour accentuer les bords et les textures des données (Figure 4 b). Ensuite, formation de modèle avec la participation minimale de l’utilisateur basée sur supervoxel a été utilisée pour segmenter les plaquettes de la glace de fond et de carbone. Puis, segmentation semi-manuel avec megavoxels et supervoxels a été utilisée pour segmenter les organites. Enfin, le paramètre source de supervoxel a été changé pour un filtre de débruitage plus faible, et le supervoxel forme a été effectuée plus petit (voir tableau 1) afin de mieux préserver les limites de microtubules de segmentation (Figure 4). Pour les organites et les microtubules, rapides annotations manuelles ont été utilisées chaque tranches de 5-10 pour sélectionner le supervoxels qui décrivent la fonction de l’intérêt (Figure 4 & 4E). Le temps total passé à déterminer les paramètres appropriés et des segments de la région d’intérêt présenté était de 6 h.
Pour illustrer l’étiquette fractionnement à l’aide de SuRVoS Workbench, un dataset à l’aide de nombreuses et variées des organites a été choisi. Cet ensemble de données ont été recueillie à l’aide de cryoSXT sur beamline B24 à Diamond Light Source, Chilton, Oxfordshire, Royaume-Uni36. Brièvement, cellules HEK293 ont été cultivés sur des grilles or finder, Fluxsol fiducials or ajoutés, et la grille était plongée gelée à l’aide d’un EM avec face arrière buvard. Inclinaison série a ensuite recueilli un microscope de ±65 ° avec un incrément de 0,5 °. La série tilt a été reconstruite puis à l’aide de projection arrière pondérée l’IMOD35.
Après le chargement des données dans SuRVoS (Figure 5 a), une région d’intérêt a été sélectionnée et un filtre approprié variation totale a été utilisé pour renforcer les frontières des organites dans toute la masse (Figure 5 b). Ensuite, les organites sont semi manually segmenté à l’aide de megavoxels et supervoxels et puis affiné avec trous de remplissage, de fermeture et de dilatation pour lisser les bords (Figure 5). Le temps total pour déterminer les paramètres appropriés et des segments de la région d’intérêt présenté était de 4 h. Une fois que la segmentation a été finalisée, le séparateur d’étiquette a été employé pour visualiser chaque organite comme un objet dans l’objet dataset (Figure 5) et diverses caractéristiques relatives à chaque objet dans le graphique de données (Figure 5E). L’interface de séparateur d’étiquette est mise à jour de la couleur associée à chaque nouvelle classe d’étiquette dans la visualisation et l’intrigue de données, interactive. Cela permet la création de diverses règles basées sur les caractéristiques inhérentes dans les données qui peuvent servir à séparer les objets en classes utiles (Figure 5F).
La figure 1. La mise en page et les caractéristiques générales de SuRVoS Workbench.
L’interface utilisateur graphique est sur la gauche, tandis que le volet de visualisation est sur la droite. Ces deux zones sont séparées par une colonne d’outils et les raccourcis. Le GUI est disposé à marcher l’utilisateur à travers les principales étapes de prétraitement des données, choisir les paramètres supervoxel et megavoxel, à segmenter les données et si nécessaire à l’aide de la formation de modèle, avant d’exporter les segmentations. Le volet de visualisation peut être utilisé dans trois modes : visualisation de base et de la segmentation pour afficher les donnéeset toute appliqué des filtres et pour segmenter les données, séparateur pour classer des objets dans les nouvelles étiquettes issus des aspects inhérents aux données de l’étiquette et enfin l’étiquette statistiques pour mesurer et visualiser les caractéristiques des objets segmentés. Pour chacun de ces modes, le menu déroulant en haut à gauche coin commandes de données qui sont, et le curseur en haut contrôle l’axe z. Les raccourcis de l’outil fournit un accès facile contrôle sur contraste, transparence des couches, zoom, panoramique et son retour à la « maison » dans le volet de visualisation et d’outils d’ouverture pour l’annotation comme décrit dans le protocole. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
La figure 2. Super-région hiérarchie réduit la complexité de la Segmentation de l’Image.
Une image du Berkeley Segmentation Dataset (BSDS50037) a été utilisée pour démontrer les propriétés et les effets des super-régions. L’image originale (gauche) est composé de milliers de voxels, qui sont ensuite réunis en groupes adjacents, semblables à créer quelques centaines supervoxels (Centre). Supervoxels peuvent aussi être rassemblés en groupes adjacents, semblables à créer quelques dizaines de megavoxels (à droite). Avec chaque regroupement, la complexité de la tâche de segmentation est réduite, pour les ressources informatiques et manuels. Ce qui est important, un exemple 2D est montré ici, cependant, les supervoxels et les megavoxels sont en 3D. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
La figure 3. Traitement d’une gamme de Dataset à l’aide d’une stratégie de Segmentation de formation de modèle.
A. une seule tranche 2D des données brutes. B. application d’un filtre de variation totale fixée aux données brutes amélioré les frontières entre les différents aspects de la fructification. C. paramètres de supervoxel appropriées ont été choisis. D. une région d’intérêt (boîte rouge en ut) est montrée pour démontrer que les limites des données sont présentes dans les supervoxels eux-mêmes. E. trois tranches du volume avec des annotations manuelles de diverses régions du dataset affichent dans des couleurs sombres (verts, rouges, bleus et violets) et prédictions après l’exécution de formation modèle affichent dans les mêmes couleurs de lumière. F. les mêmes trois tranches avec la segmentation finale après que les prédictions de formation du modèle ont été acceptées. Barreaux de l’échelle est mm 1. s’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
La figure 4. Traitement d’un Dataset à l’aide d’une stratégie de Segmentation Super-région de cryoET.
A. une seule tranche 2D des données brutes. B. une région d’intérêt (zone rouge à A) avec un ensemble de couches filtre appliqué pour accentuer les limites des organites. C. exemple d’annoter un organite utilisant des super-régions. Un organite unique est montré avec supervoxels recouvert de l’annotation de manuel utilisateur affichée en noir (à gauche) et le supervoxels choisis avec cette annotation en bleu (à droite). D. exemple d’annoter un microtubule en utilisant des super-régions. Une seule région du microtubule est montrée avec l’annotation de manuel utilisateur affichée en noir (à gauche) et le supervoxels choisis avec cette annotation en vert (à droite). E. la segmentation finale mettant en vedette les plaquettes segmentées de l’arrière-plan à l’aide du modèle de formation (pour plus de détails, voir tableau 1) et divers organites et les microtubules segmentés en utilisant une stratégie de segmentation Super-région. Couleurs n’indiquent pas les types d’organites spécifiques tel qu’ils apparaissent ici avant de classification. Bars à l’échelle A, B et E sont 1 μm et en C et D sont 0,5 μm. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
La figure 5. Analyse d’un Dataset à l’aide de l’outil de séparateur d’étiquette de cryoSXT.
A. une seule tranche 2D des données brutes. B. une région d’intérêt (zone rouge à A) avec un variation totale filtre appliqué pour accentuer les organites. C. la segmentation finale avec supervoxels superposées. D. La partie visualisation du séparateur d’étiquette avec les organites classés en utilisant les règles affichées dans F. E. la partie de terrain entre le séparateur d’étiquette affichant l’intensité moyenne à l’intérieur de chaque objet, avec les règles affichées dans F appliquée. Chaque ligne verticale le long de l’axe x représente un objet unique et est codé par couleur pour correspondre à la classe, à qu'il a été affecté. F. exemple des règles de classification pour séparer les divers objets selon leurs propriétés inhérentes. Barreaux de l’échelle est de 1 μm. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Nom / Dataset | Source | P1 | P2 | P3 | P4 |
Filtre gaussien | Sigma | ||||
Gamme / par défaut | - | [0.5, 10] / 1 | |||
CryoET (G1) | Données brutes | 1 | |||
CryoET (G2) | Données brutes | 2 | |||
Variation totale | Lambda | Espacement des | # Iter | Pince | |
Gamme / par défaut | - | [0.1, 30] / 10 | [0.1, 10] / 1 | [50, 500] / 100 | - |
MicroCT (TV1) | Données brutes | 10 | 1 | 100 | (1,-) |
CryoET (TV2) | G1 | 7 | 1 | 200 | - |
CryoET (TV3) | G2 | 10 | 1 | 100 | - |
CryoSXR (TV4) | Données brutes | 7 | 1 | 100 | - |
Seuillage | Vmin | Vmax | |||
Gamme / par défaut |
Le tableau 1. Paramètres optimisés permettant de traiter chacun des trois ensembles de données (microCT, cryoET et cryoSXT).>
Pour chaque paramètre, une gamme polyvalente et par défaut sont donnés. Dans de nombreux cas, les données filtrées sont utilisées comme source pour le traitement en aval. Dans ces cas, une abréviation est utilisée pour désigner le nouveau dataset source. Par exemple, G1 (données brutes cryoET filtré gaussien) a été utilisées comme entrée au cours d’un filtre de variation totale pour créer TV2. Informations sont présentées uniquement pour les aspects de l’établi qui servaient à traiter chaque dataset. Par exemple, modèle de formation n’était pas utilisée lors du traitement du dataset cryoSXT présenté ici, donc aucuns paramètres ne sont donnés pour cela.
SuRVoS Workbench diffère des autres programmes de segmentation optimisation de paramètres est une étape nécessaire et importante avant de commencer la segmentation réelle. Dans certains programmes de segmentation manuelle ou semi-manuel, l’utilisateur commence à segmenter en quelques instants d’ouvrir un nouveau projet. Avec SuRVoS, parce que de grandes quantités du volume vont être segmentées avec l’entrée d’utilisateur très peu et les frontières sont délimitées par le programme, optimisant les paramètres est essentielle à une segmentation réussie. En particulier, offrent des voies et bâtiment Super-région sont deux domaines où une attention particulière devrait être accordée.
Offrent des voies et la formation de modèle
Outre les données brutes, SuRVoS permet à l’utilisateur de créer des datasets supplémentaires ou des chaînes provenant d’un dataset existant. Ces canaux peut être créés à l’aide d’une sélection de méthodes de calculs ou extracteurs de fonctionnalité. Chacune des représentations de données existent en parallèle et peuvent être affichés individuellement afin d’évaluer les résultats de l’application de fonction ou de filtre. En raison de ces caractéristiques, ils sont appelés offrent des voies en SuRVoS. Il existe de nombreuses options de canal de fonctionnalité fournies dans SuRVoS. Pour plus d’informations sur les options et les paramètres utilisés ici, voir tableau 1pour une liste complète et la description des chaînes de fonctionnalité disponible Visitez https://diamondlightsource.github.io/SuRVoS/ 2. Tout d’abord, bruyant des ensembles de données bénéficieront de débruitage avec la gaussienne ou total filtre de variation. Il est recommandé que plus caractéristique des calculs channel et supervoxel/megavoxel être effectués à l’aide de l’un de ces ensembles de données debruites comme source de données. En règle générale, la variation totale débruitée dataset est utilisé comme les données source pour les calculs de fonction canal et supervoxel/megavoxel. Il est suggéré de courir avec les valeurs par défaut, tout d’abord, évaluer le résultat en 3D et enfin, itérativement optimiser les paramètres pour le dataset. En outre, fonctionnalité de canaux peut être construit dans « Jeux de filtres » à spécifiquement isoler des aspects de l’objet dataset et ceux-ci peuvent alors être utilisés comme sources de données pour créer supervoxels et megavoxels. Bien que cette stratégie est fortement dépendante de dataset, il peut être bénéfique.
Offrent des voies sont également utilisés comme sources pour former le classifieur dans la formation de modèle. Moment de décider sur quels canaux de fonction à utiliser, il est recommandé que quelques robustes offrent des voies (p. ex., de détection de blob, texture et structure ou catégories de fonctionnalités robustes) sont utilisés lorsque vous travaillez avec une petite quantité d’annotations pour former le classifieur. Lorsque vous travaillez avec une grande quantité de données d’apprentissage, il est recommandé d’utiliser plus de chaînes de fonctionnalité dans l’ensemble, parmi les catégories tant qu’ils fournissent des informations variées au classifieur (p. ex., les canaux de fonctionnalité liste ci-dessus s’ajoute du local caractéristiques et les catégories de fonctions gaussiennes).
Il y a trois parties principales de modéliser la formation : fournir des sources de données d’entrée qui décrivent les données, utiliser ces entrées pour former un classifieur et enfin affiner les prédictions de sortie. En règle générale, plus petites régions de données nécessitera plusieurs annotations utilisateur pour former avec précision le classificateur, tandis que des régions plus vastes des données exigera moins annotations utilisateur. Formation de modèle tout d’abord sans sélectionner un raffinement peut être utilisée pour trouver les meilleures prédictions. Alors inclure le raffinement et optimiser le paramètre lambda que nécessaires pour résoudre les problèmes avec les prédictions comme les trous ou les bords découpés.
Supervoxels et megavoxels
Supervoxels sont des regroupements de plusieurs voisins, semblable voxels38,39. Supervoxels commencent par une grille 3D standard superposée sur les données qui sont déformées ensuite par itération afin de respecter les limites sous-jacentes et ainsi mieux représenter les données. Création de Supervoxel et de la déformation est contrôlée par quatre entrées de l’utilisateur : source de données, la forme superpixel, espacement et compacité. La source de données fournit les entrées de données qui sont interrogées lors de la création de supervoxel. N’importe quelle source peut être utilisée, y compris les sources de données filtrées. Les paramètres de forme superpixel déterminent la grille de départ 3D et la forme approximative souhaitée de la supervoxels qui en résulte. Changer ces paramètres, vous pouvez augmenter ou diminuer la taille de le supervoxels avant la déformation. Les paramètres d’espacement définissent l’importance des limites dans chaque direction. Modification de ces paramètres peut souligner limites dans une ou deux directions au détriment de l’autre (s), ce qui signifie que les supervoxels qui en résulte seront déformera pour mieux suivre les limites données dans l’ou les directions donnée. Le dernier paramètre, compacité, contrôle combien le supervoxels peut se déformer. Un nombre faible compacité permet la supervoxels à se déformer de plus. Ces paramètres doivent être optimisés pour offrir des supervoxels qui représentent les limites des données d’intérêt. Remarque : Actuellement, les paramètres de forme supervoxel doivent être égale à 1024 ou moins en multipliés ensemble.
À certains égards, supervoxel paramètres peuvent compenser pour l’autre, ce qui signifie il n’y a nul « bonne réponse » en décidant des paramètres. Par exemple, une grande grille de départ (par exemple les forme superpixel : 10 x 10 x 10) et un nombre faible compacité (ex 20) peut donner des supervoxels avec la même adhérence limite par rapport à une petite grille de départ (par exemple forme de superpixel 5 x 5 x 5) et une plus grande nombre de compacité (p. ex. 50). Parce qu’il n’y a plus, petits supervoxels dans le second scénario, ils n’ont pas à se déformer autant pour représenter les limites. Les deux ensembles de paramètres pourraient être appropriées pour la segmentation de l’objet dataset.
L’examen plus important lors du choix des paramètres de supervoxel est bien les supervoxels représentent les données. Afficher les supervoxels seul, sans données sous eux, comme dans la Figure 2D, est un bon moyen d’évaluer les paramètres de supervoxel. Lors de l’affiche de cette façon, les bords et les contours des formes trouvées dans les données soit encore visibles dans le supervoxels.
Megavoxels sont des conglomérats de plusieurs voisins, semblable supervoxels38,39. Ils sont à nouveau contrôlés par quatre entrées de l’utilisateur : source de données, lambda, numbins et gamma. Comme pour supervoxels, la source de données fournit les entrées de données qui sont interrogées lors de la création de megavoxel. Les lambda et numbins impact sur l’adhérence de taille et de la limite de la megavoxels. Les megavoxels développer plus grand (lambda élevé, faible numbins), leur adhérence limite décroît. L’inverse est également vrai, adhérence limite augmentera avec petits megavoxels (faible lambda, numbins élevé), cependant que la taille de megavoxel diminue, fait leur utilité dans la segmentation rapidement de grandes quantités de voxels. Le paramètre facultatif gamma contrôle le facteur de souplesse par rapport au coût de la fusion de deux supervoxels ensemble. Petites valeurs de gamma peuvent améliorer la similitude entre deux supervoxels, au prix d’avoir globales moins megavoxels.
Comme pour supervoxels, l’examen plus grand quand choisissant et en optimisant les paramètres megavoxel est comment bien les megavoxels représentent les données. Affichant les megavoxels seul comme pour le supervoxels encore une fois peut être utilisé pour évaluer les paramètres. Cependant, parce que megavoxels sera généralement beaucoup plus grandes et sont en trois dimensions, à l’aide de l’annotation outils to choisir megavoxels unique pour la limite entre les régions d’intérêt soit serrée est également recommandée.
Stratégie d’annotation
Deux stratégies d’annotation générales ont été décrits : une approche de formation de modèle est utile pour séparer les grandes régions d’un dataset, alors qu’une approche de segmentation Super-région est utile pour les plus petits et plus diversifiés caractéristiques tels que les différents organites. Les annotations peuvent être organisées de façon hiérarchique afin qu’il est possible d’annoter les grandes régions d’abord, puis de les subdiviser en régions plus spécifiques à l’aide d’une relation parent-enfant. L’étiquette de parent pour un label peut être attribué en cliquant sur la zone à droite de la sélection de couleur d’étiquette et en choisissant une étiquette appropriée parent dans un niveau précédent. Dans la pratique, la plupart des ensembles de données utilisent les stratégies de segmentation Super-région et la formation de modèle permet de segmenter les régions/caractéristiques d’intérêt.
Dans l’exemple de formation modèle ici, quelques entrées de formation (sous la forme d’annotations de manuel utilisateur axée sur les supervoxel) ont été utilisées sur trois tranches équidistants des données. De cette façon, l’aspect formation de modèle de SuRVoS augmente considérablement la vitesse avec laquelle la segmentation est possible surtout quand travaillant avec grand, différenciés des régions telles que le fossé entre les régions dans la fructification goosegrass comme le souligne Figure 3.
Lorsque modèle dressage, si les prédictions sont invisibles, il peut être nécessaire d’aller à l’onglet visualisation et assurez-vous que la couche de prédictions est activée et mis à une quantité appropriée de la transparence. Aussi, une confiance 0 assignera chaque supervoxel sans étiquette à l’étiquette, selon quelle que soit la correspondance la plus proche est. Confiance de 100 sera uniquement assigner une étiquette si seulement une seule catégorie d’étiquette a n’importe quel match proportionnels. Tout le reste est un compromis de ces deux extrêmes. Lorsque vous sélectionnez un niveau de confiance, qu'il est suggéré de vérifier quelques tranches d’inspecter visuellement qu’il ne sont a pas mal prédites voxels avant d’enregistrer la prédiction sur une étiquette.
Une bonne stratégie d’annoter à l’aide des super-régions consiste à utiliser l’outil de grossissement pour effectuer un zoom avant sur les données, annoter quelques organites à la fois sur une tranche, en utilisant une approche « rapide, malpropre » tout d’abord (Figure 4). Ensuite, monter ou descendre quelques tranches dans Z et répéter ce processus. Parce que les supervoxels sont en trois dimensions, beaucoup des défauts de l’approche « désordonné » sont fixés par les annotations requises ci-dessus ou ci-dessous tranches. De cette façon, la segmentation est accélérée et les limites sont fournis par le supervoxels plutôt que manuellement.
Pour nettoyer une étiquette, options d’affinement de segmentation standard ont été fournies. L’étiquette sélectionnée segmentation de croître par le rayon donné provoque la dilatation, l’érosion provoque la rétrécir. Ouverture et fermeture sont l’application de la première érosion puis dilatation ou vice versa, respectivement. Et trous de remplissage fait exactement cela. L’ordre de ces opérations importe. Généralement, l’artiste trous de remplissage, puis l’ouverture, puis une dilatation fonctionne bien. Chaque méthode de raffinement peut être appliqué sur une seule tranche (« cette tranche »), sur toutes les tranches en 2D (« toutes les tranches (2D) ») ou en 3D (« volume entier (3D) »). Toutes les tranches (2D) est recommandé.
Signification et orientations futures
Segmentation précise et efficace est le prochain goulot d’étranglement dans le traitement des ensembles de données 3D, surtout avec la collecte automatisée courante de téraoctets de données d’image au cours de séances de long terme. SuRVoS Workbench peut accélérer le processus de segmentation par un facteur 5 par rapport à la segmentation manuelle. En outre, parce que les frontières sont délimitées par la supervoxels, la variabilité de la segmentation qui en résultent devrait s’améliorer. Nous espérons à l’avenir, d’étudier les moyens d’utiliser la segmentation d’une région 3D représentante des intérêts comme données d’entraînement à appliquer au reste du volume, ou même un volume distinct, avec une confiance élevée. Cette avance serait diminuent encore la quantité de temps de l’utilisateur et l’entrée nécessaire aux volumes de biologiques complexes même segment, contribue à alléger l’engorgement de traitement et segmentation d’image. Ceci, à son tour, permettra la comparaison quantitative des données biologiques dans différents États (p. ex. non-maladie, maladie, traitée) avec numéros expérimentales robustes.
Les auteurs déclarent qu’ils n’ont aucun intérêt financier concurrentes.
Nous tenons à remercier Rui Wang et Wah Chiu de Baylor College of Medicine pour fournir l’ensemble de données cryoET et Andrew Bodey de Diamond Light Source d’aide à la beamtime I13. Pièces de cette recherche étaient soutenus par la subvention du National Institutes of Health (NIH) no (P41GM103832) nous reconnaissons Diamond Light Source de financement conjointement Imanol Luengo sous STU0079 de doctorat.
Name | Company | Catalog Number | Comments |
computer | n/a | n/a | Must be running Linux operating system and have an NVidia GPU with at least 4 GB of memory |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon