Method Article
Segmentación de datos tridimensionales de muchas técnicas de imagen es un cuello de botella importante en análisis de sistemas biológicos complejos. Aquí, describimos el uso de SuRVoS Workbench datos volumétricos de segmento semi-automáticamente en varias escalas de longitud utilizando conjuntos de datos de ejemplo de tomography del cryo-electrón, cryo suave tomografía de rayos x y técnicas de tomografía de rayos x de contraste de fase.
Segmentación es el proceso de aislar regiones específicas u objetos dentro de un volumen de imagen, para que puedan llevar a cabo un estudio más profundo en estas áreas de interés. Cuando se considera el análisis de sistemas biológicos complejos, la segmentación de los datos de la imagen tridimensional es un paso mucho tiempo y mano de obra intensiva. Con la mayor disponibilidad de muchas modalidades de imágenes y esquemas de colección de datos automatizada, esto plantea un mayor reto para el biólogo experimental moderno pasar de datos a conocimiento. Esta publicación describe el uso de SuRVoS Workbench, un programa diseñado para resolver estos problemas al proporcionar métodos para semiautomática segmento complejo volumétrico datos biológicos. Tres conjuntos de datos de diferentes aumentos y modalidades de la proyección de imagen se presentan aquí, cada uno destaca diferentes estrategias de segmentación con SuRVoS. Tomografía de rayos x de contraste fase (microCT) del cuerpo fructífero de una planta se utiliza para demostrar usando entrenamiento de modelo de segmentación, cryo tomografía de electrones (cryoET) de plaquetas humanas se utiliza para demostrar la segmentación utilizando super - megavoxels y crio suave Tomografía de rayos x (cryoSXT) de una línea de células de mamífero se utiliza para demostrar la etiqueta división herramientas. También se presentan estrategias y parámetros para cada tipo de datos. Por la mezcla de una selección de los procesos semiautomáticos en una sola herramienta interactiva, SuRVoS proporciona varios beneficios. En general se reduce el tiempo a los datos volumétricos de segmento por un factor de cinco en comparación con segmentación manual, uno de los pilares en muchos campos de procesamiento de imagen. Esto es un ahorro significativo al segmentación manual completo puede tomar semanas de esfuerzo. Además, se dirige subjetividad mediante el uso de cómputo identificados límites y división colecciones complejas de objetos por sus propiedades calculadas, en lugar de una base de caso por caso.
El SuRVoS Workbench es un software diseñado para permitir a los investigadores extraer información científica relevante de los datos volumétricos de diferentes muestras, independientemente de la estructura de interés, la resolución o la proyección de imagen de modalidad1, 2. Datos volumétricos como estas se recogen a menudo usando sistemas de tomografía de rayos x o electrones, habitualmente basan en grandes laboratorios o instalaciones centralizadas debido a su complejidad. Ambos de estos métodos y otras técnicas, producen grandes, información ricos conjuntos de datos que prueban desafiante segmento con cualquiera de los dos métodos semi-automáticos o manualmente. Particularmente, casi nativo estado inmovilizado cryo datasets requieren condiciones de dosis baja, resultando en una baja relación de señal a ruido y poco contraste, especialmente en cryo electron tomography (cryoET)3,4,5 . Un factor adicional en algunos conjuntos de datos 3D es la presencia de artefactos introducidos por las difíciles condiciones experimentales implicadas, por ejemplo faltan artefactos de cuña debido a la recopilación de datos sobre una limitada inclinación gama, dando por resultado la falta de información y elongación en la dirección de la viga3,4,5. Incluso cuando baja señal a ruido o artefactos de cuña que falta no son problemáticos (por ejemplo enfocado viga de ion SEM6 o serie bloque cara SEM7), la complejidad y la naturaleza tridimensional de la muestra y la gran cantidad de datos significan análisis sería todavía se benefician de un proceso automatizado para la segmentación de datos.
En la actualidad, al considerar volúmenes biológicos de las células, hay muchas opciones para la identificación de forma automática o semiautomática características celulares muy específicas, como la actina, microtúbulos o complejos de proteínas específicos, utilizando una búsqueda basada en plantilla, o identificación de características de determinados tipos de conjuntos de datos (por ejemplo, alto contraste, teñido, embebido en resina muestras)8,9,10,11,12. Sin embargo, en estos casos a priori información o protocolos de preparación de muestra específico están necesarios, limitar la amplia aplicabilidad de estas estrategias de segmentación. También hay herramientas disponibles que realizan entrenamiento de modelo en el nivel de voxel para conocer la aparición de diversas estructuras de interés cuando dado el usuario entrada13. Sin embargo, en este nivel la complejidad de la formación y pruebas de los modelos puede ser computacionalmente costoso y propenso a errores. Segmentación manual, dadas las difíciles condiciones de imagen y la falta de estrategias de segmentación semiautomática, ampliamente aplicable, es común, incluso cuando se trabaja con materiales biológicos complejos14,15, 16 , 17. sin embargo, está generalmente aceptado que el proceso de la segmentación manual no es sólo desperdiciador de tiempo, pero también errores, subjetiva y variable4,5,18,19 ,20. Algunos programas de segmentación ofrecen herramientas para facilitar el proceso de segmentación manual (es decir, interpolación, lasso o herramientas de golpe)21,22, sin embargo, en los casos de conjuntos de datos ruidosos, son difíciles de aplicar con éxito, y incluso cuando se utilizan con éxito, el proceso es todavía subjetiva y variable.
Tradicionalmente, se han utilizado segmentaciones de dos distintas maneras: cualitativa o cuantitativamente. Como mejoran la imagen de tecnologías y estrategias de segmentación, se ha vuelto más habitual utilizar la segmentación como una herramienta para responder a cuestiones biológicas y como una "verdad de la tierra" para el algoritmo desarrollo8,12, 15,23,24,25. Para ello, equilibrios y controles detallados se requieren para disminuir la variabilidad y subjetividad en el proceso26. Sin embargo, estas precauciones más aumentan la naturaleza desperdiciadora de tiempo de la segmentación. Debido a esto, es fundamental para proporcionar una estrategia de segmentación más rápida y menos variable.
Banco de trabajo SuRVoS comienza a abordar estas cuestiones proporcionando al usuario una selección del aprender de máquina y herramientas que ayudan al usuario en el proceso de segmentación, al tiempo que también guía al usuario a través de los pasos requeridos de procesamiento de imágenes. Para lograr esto, dos innovaciones claves se aplican juntos en SuRVoS. En primer lugar, utiliza una jerarquía de súper región al grupo similar, regiones cercanas de los datos basan en sus propiedades inherentes. Cada una de las regiones en la jerarquía representa el mismo volumen utilizando menos elementos, mientras que todavía proporciona adherencia límite fuerte. Así, las regiones súper reducen la complejidad de la segmentación de un volumen por varios órdenes de magnitud todavía siguen representan los datos sin pérdida significativa de información27. En segundo lugar, SuRVoS proporciona una estrategia de segmentación semiautomática que usa entradas de segmentación manual mínima para entrenar clasificadores, que se utilizan para segmentar el restante volumen28,29. Esta estrategia reduce la segmentación manual, grandemente disminuyendo la cantidad de tiempo de usuario en segmentación y, al usar las Super regiones, elimina manual delineación de límites, potencialmente reduciendo la variabilidad y subjetividad.
Otra característica clave de SuRVoS es la herramienta del separador etiqueta, por el que un usuario puede clasificar una serie de objetos ya segmentadas basada en sus propiedades inherentes. Después de la segmentación de diversos objetos de interés, esta herramienta puede utilizarse para dividir el conjunto en subclases basadas en medidas tales como la intensidad del objeto media, varianza, tamaño, ubicación, etc. resulta útil para clasificar a grupos grandes de objetos con alta complejidad. Por ejemplo, se puede dividir un grupo de organelos celulares en las mitocondrias, vesículas vacías, gotas lipídicas, etcetera.; o un conjunto de inclusiones pueden ser separadas del material basado en el tamaño o forma. Una vez segmentadas las etiquetas individuales puede ser dividida en grupos usando cualquier número de clasificadores, reduciendo el sesgo de identificación.
El SuRVoS Workbench se ha utilizado con éxito a los datos de segmento de varias técnicas de imagen. Aquí, el sincrotrón radiografía fase contraste tomografía (microCT) del cuerpo fructífero de una planta se utiliza para demostrar segmentatisobre el uso de entrenamiento modelo, cryo tomografía de electrones (cryoET) de plaquetas humanas se utiliza para demostrar la segmentación utilizando super y megavoxels y tomografía de rayos x suave cryo (cryoSXT) de una línea de células de mamífero se utiliza para demostrar la etiqueta división herramientas
Nota: generalmente las gamas útiles de parámetros para cada paso de proceso y los parámetros específicos para cada tipo de datos se muestra a continuación se proporcionan en la tabla 1.
1. preparar un espacio de trabajo y los datos de carga
2. Preprocesamiento y representación de datos
3. Generar regiones súper apropiadas
ficha4. Introducción a la anotación
5. Segmentación utilizando modelo formación demostró con un dataset microCT.
Nota: la primera segmentación para muchos conjuntos de datos es a distinguir varias regiones grandes de uno a. Por ejemplo, separando el núcleo del citoplasma y la célula de la estructura externa del hielo y el apoyo. Para este tipo de segmentación, con límites delineados claros y grandes regiones, la formación de modelo es útil. Para demostrar esto, se utilizarán datos tomográficos de contraste de fase de rayos x de pasto pata de ganso.
6. Segmentación utilizando las Super regiones, demostró con un CryoET Dataset.
Nota: desde Super-región segmentación es útil para áreas más pequeñas, discretamente consolidadas, aquí se centrará en la segmentación de los organelos y microtúbulos dentro de este conjunto de datos. Formación modelo fue utilizado para segmentar rápidamente las plaquetas desde el fondo hielo y carbón; Estos parámetros no se discuten más lejos, pero se presentan en la tabla 1.
7. Clasificación y análisis de objetos de datos basado en características inherentes, demostró con un CryoSXT Dataset
Nota: generalmente, el siguiente paso después de la segmentación es el análisis de los datos. La herramienta del separador etiqueta en SuRVoS permite la clasificación de los objetos segmentados utilizando reglas basadas en características intrínsecas de los objetos tales como intensidad del objeto media, varianza, volumen o posición. La herramienta de estadísticas de etiqueta permite la visualización de las relaciones entre estas medidas para cada nueva clase de objeto. Estos son potentes nuevas herramientas para el análisis de complejos conjuntos de datos 3D tras segmentación.
8. Exportación de datos y segmentación
Tres conjuntos de volumen datos recopilados de tres distintas técnicas (microCT, cryoET y cryoSXT) fueron utilizados para demostrar tres características importantes de SuRVoS Workbench: modelo de formación, Super-región segmentación y división de etiqueta. Los conjuntos de datos representan un grupo diverso de resultados experimentales, para cada uno de los cuales parámetros de procesamiento se proporcionan (tabla 1).
Para demostrar la formación de modelo con SuRVoS Workbench, fue elegido un conjunto de datos relativamente alto contraste con definición de límites de la región. Este conjunto de datos de la fruta de Galium aparine, o pasto pata de ganso, se recopiló utilizando tomografía de contraste de fase de rayos x en la línea de proyección de imagen de diamante-Manchester y I13-2 en fuente de luz diamante, Chilton, Oxfordshire, Reino Unido. La muestra fresca se montó en el aire sobre un goniómetro base encima de la fase de rotación, a una distancia del detector de la muestra de 30 mm. exposición tiempos eran 0.10 s con el espectro del rayo rosa que tiene una energía media de alrededor de 22 keV. Las proyecciones fueron recogidas a través de 180° con un tamaño de paso de 0,1 °. Reconstrucciones tomográficas fueron realizadas usando Savu30,31 con el filtro de Paganin para contraste de fases basadas en la propagación de imágenes32 seguido por la reconstrucción de la retroproyección filtrada en el kit de herramientas ASTRA del33 , 34. esta información fue luego reducida con 2 x 2 x 2 binning para reducir el tamaño del archivo antes de que ingresa en el Banco de trabajo SuRVoS.
En primer lugar, los datos de entrada (Figura 3A) fue filtrados y afianzado con abrazadera (para quitar valores de intensidad superior e inferior de los datos) (figura 3B). De esta manera, el fondo y primer plano hicieron más fácilmente distinguibles y se acentuó la textura de la estructura interna de la fruta. A continuación, supervoxels fueron construidos sobre la base de datos filtrada (figura 3). Para evaluar la calidad de la supervoxels, mostraban sin los datos para verificar que los datos pertinentes del conjunto de datos estaban bien representados por el supervoxels (figura 3D). Siguientes, manual anotaciones usando supervoxels fueron proporcionadas como datos de entrenamiento en tres rebanadas del volumen (figura 3E, colores oscuros). Estos datos de entrenamiento fueron suficientes para entrenar el clasificador para predecir (colores luz) las áreas que correspondían al fondo (verde), cerda (rojo) de la fruta, material de semilla (púrpura) y carne (azul). Ajustes morfológicos fueron utilizados para limpiar las segmentaciones por los orificios de llenado, crecimiento o encogimiento como sea necesario (figura 3F). El tiempo total empleado para determinar los parámetros adecuados y este conjunto de datos del segmento fue de 2 h.
Para demostrar la segmentación de la súper-región con SuRVoS Workbench, un conjunto de datos ruidoso y complejo fue elegido15. Este conjunto de datos se recopiló utilizando cryoET en el centro nacional para la proyección de imagen Macromolecular en el Baylor College of Medicine, Houston, TX USA. Brevemente, las plaquetas fueron penetración congelado en resplandor descargada y rejillas de carbón perforado oro Fiduciario tratados TEM. Serie de inclinación se recolectaron de ±65 ° con un incremento de 2°. La serie de inclinación entonces fue reconstruida usando proyección ponderada en IMOD35.
Después de cargar los datos en SuRVoS (Figura 4A), una región de interés se seleccionó y aplicó un sistema de filtro apropiado. En este caso, un filtro gaussiano suavizado, seguido por un filtro de la variación total del contraste con abrazadera se utiliza para acentuar los bordes y texturas de los datos (Figura 4B). A continuación, formación de modelo con la entrada mínima del usuario basada en supervoxel fue utilizado para segmentar las plaquetas desde el fondo hielo y carbón. Entonces, segmentación semi-manual con megavoxels y supervoxels fue utilizado para segmentar las organelas. Por último, el parámetro de la fuente de supervoxel fue cambiado a un filtro de eliminación de ruido débil y forma supervoxel fue hecho más pequeño (véase tabla 1) con el fin de conservar mejor los límites de los microtúbulos para segmentación (figura 4). Para los orgánulos y los microtúbulos, se utilizaron rápidas anotaciones manual cada 5-10 rebanadas para seleccionar el supervoxels que describen la característica de interés (figura 4 & 4E). El tiempo total empleado para determinar los parámetros adecuados y segmento de la región de interés presentado fue de 6 h.
Para demostrar la etiqueta División con SuRVoS Workbench, eligió un conjunto de datos con muchos, variados orgánulos. Este conjunto de datos se recopiló utilizando cryoSXT en la línea B24 fuente de luz diamante, Chilton, Oxfordshire, Reino Unido36. Brevemente, las células HEK293 fueron cultivadas en rejillas de buscador de oro, fiduciales oro tamaños adecuado fueron agregados y la red estaba caída congelada con una EM con cara espalda borrar. Serie de inclinación entonces recolectaron en un microscopio de ±65 ° con un incremento de 0,5 °. La serie de inclinación entonces fue reconstruida usando proyección ponderada en IMOD35.
Después de cargar los datos en SuRVoS (figura 5A), se seleccionó un área de interés y un filtro apropiado variación total fue utilizado para mejorar los límites de los organelos a lo largo del volumen (figura 5B). A continuación, organelos fueron semi-manually segmentado usando megavoxels y supervoxels y luego refinado con orificios de llenado, de cierre y dilatación para suavizar bordes (figura 5). El tiempo total para determinar parámetros adecuados y segmento de la región de interés presentado fue de 4 h. Una vez que finalizó la segmentación, la cortadora de la etiqueta fue utilizada para visualizar cada organelo como un objeto en el conjunto de datos (figura 5) y diversas características sobre cada objeto en la trama de datos (figura 5E). La interfaz del sello separador es interactiva, actualizando el color asociado a cada nueva clase de etiqueta en la visualización y la trama de datos. Esto permite la creación de varias reglas basadas en las características inherentes en los datos que pueden utilizarse para separar los objetos en clases útiles (figura 5F).
Figura 1. El diseño y características generales de SuRVoS Workbench.
La interfaz gráfica de usuario está a la izquierda, mientras que el panel de visualización está a la derecha. Estas dos áreas están separadas por una columna de herramientas y accesos directos. La GUI es dispuesta a caminar el usuario a través de los principales pasos de preprocesamiento de los datos, elegir los parámetros supervoxel o megavoxel, segmentación de los datos y si es necesario usando modelo de entrenamiento, antes de la exportación de las segmentaciones. El panel de visualización se puede utilizar en tres modos: visualización básica y segmentación para ver los datosy aplicar filtros y segmentar los datos, splitter para categorizar objetos en nuevas etiquetas basadas en aspectos inherentes a los datos de la etiqueta y etiqueta finalmente estadísticas para medir y visualizar las características de los objetos segmentados. Para cada uno de estos modos, el menú desplegable en la parte superior izquierda esquina mandos datos que es, y el control deslizante en la parte superior controla el eje z. Los accesos directos de herramienta proporciona control de fácil acceso sobre contraste, transparencia de capas, zoom, panorámica y regresar a "home" en el panel de visualización y herramientas de apertura para anotación como se describe en el protocolo. Haga clic aquí para ver una versión más grande de esta figura.
Figura 2. Súper región jerarquía reduce la complejidad de la segmentación de la imagen.
Una imagen de la base de datos de segmentación de Berkeley (BSDS50037) fue utilizada para demostrar las propiedades y efectos de Super-regiones. La imagen original (izquierda) se compone de miles de voxels, que son luego reunidos en agrupaciones adyacentes, similares a crear unos cien supervoxels (centro). Supervoxels se puede obtener también en las agrupaciones adyacentes, de manera similares para crear unas decenas de megavoxels (derecha). Con cada grupo, se disminuye la complejidad de la tarea de segmentación, recursos computacionales y manuales. Lo importante, aquí se muestra un ejemplo 2D, sin embargo, supervoxels y megavoxels 3D. Haga clic aquí para ver una versión más grande de esta figura.
Figura 3. Procesamiento de un microCT Dataset mediante una estrategia de segmentación del modelo formación.
A. una sola rebanada 2D de los datos en bruto. B. aplicar un filtro de variación total sujeta a los datos crudos mejora los límites entre los diversos aspectos del cuerpo fructífero. C. supervoxel apropiado parámetros fueron escogidos. D. se muestra una región de interés (caja roja en C) para demostrar que los límites de los datos están presentes en el supervoxels ellos mismos. E. tres rebanadas del volumen con anotaciones manuales de diversas áreas del conjunto de datos muestran en colores oscuros (verdes, rojos, azul y púrpura) y predicciones después de ejecutar la formación de modelo en los colores de luz. F. las tres rebanadas mismo la segmentación final después de las predicciones del modelo formación han sido aceptadas. Barras de escala son 1 mm. haga clic aquí para ver una versión más grande de esta figura.
Figura 4. Procesamiento de un conjunto de datos utilizando una estrategia de segmentación de la súper-región de cryoET.
A. una sola rebanada 2D de los datos en bruto. B. una región de interés (caja roja en A) con un sistema de filtro de capas para acentuar los límites de los organelos. C. ejemplo de anotar un organelo con súper-regiones. Un orgánulo único aparece con supervoxels con la anotación de usuario aparece en negro (izquierda) y el supervoxels elegido con esa anotación que se muestra en azul (derecha). D. ejemplo de anotar un microtúbulo con súper-regiones. Se muestra una sola región de microtúbulos con la anotación de usuario aparece en negro (izquierda) y el supervoxels elegido con esa anotación que se muestra en verde (derecha). E. la segmentación final con la plaqueta segmentada del fondo utilizando el modelo de formación (ver tabla 1 para más detalles) y diversos orgánulos y microtúbulos segmentados mediante una estrategia de segmentación de la Super región. Colores no indican tipos de organelas específicas como aparecen aquí antes de clasificación. Bares en la escala A, B y E son 1 μm y en C y D son 0,5 μm. Haga clic aquí para ver una versión más grande de esta figura.
Figura 5. Análisis de un conjunto de datos utilizando la herramienta de sello separador de cryoSXT.
A. una sola rebanada 2D de los datos en bruto. B. una región de interés (cuadro rojo en la A) con un variación total del filtro aplicado para acentuar los organelos. C. la segmentación final con supervoxels superpuestas. D. La parte de visualización del separador de la etiqueta con los organelos clasificado utilizando las reglas que se muestran en F. E. la porción de la parcela del separador etiqueta mostrando la intensidad promedio dentro de cada objeto, con la normativa que aparece en F aplicada. Cada línea vertical a lo largo del eje x representa un solo objeto y codificada por colores para que coincida con la clase que ha sido asignado. F. reglas de clasificación del ejemplo para separar varios objetos basados en sus propiedades inherentes. Barras de escala son 1 μm. Haga clic aquí para ver una versión más grande de esta figura.
Nombre / conjunto de datos | Fuente | P1 | P2 | P3 | P4 |
Filtro gaussiano | Sigma | ||||
Por defecto / gama | - | [0,5, 10] / 1 | |||
CryoET (G1) | Datos en bruto | 1 | |||
CryoET (G2) | Datos en bruto | 2 | |||
Variación total | Lambda | Espaciamiento de | # Iter | Abrazadera | |
Por defecto / gama | - | [0.1, 30] / 10 | [0.1, 10] / 1 | [50, 500] / 100 | - |
MicroCT (TV1) | Datos en bruto | 10 | 1 | 100 | (1,-) |
CryoET (TV2) | G1 | 7 | 1 | 200 | - |
CryoET (TV3) | G2 | 10 | 1 | 100 | - |
CryoSXR (TV4) | Datos en bruto | 7 | 1 | 100 | - |
Umbralización | Vmin | Vmax | |||
Por defecto / gama |
Tabla 1. Parámetros optimizados para procesar cada uno de los tres conjuntos de datos (microCT, cryoET y cryoSXT).>
Para cada parámetro, se dan una gama de propósito general y por defecto. En muchos casos, datos filtrados se utilizan como una fuente para el procesamiento de aguas abajo. En estos casos, una abreviatura se utiliza para denotar el nuevo conjunto de datos fuente. Por ejemplo, G1 (los datos en bruto cryoET filtrado gaussiano) fue usados como entrada en un filtro de variación total para crear TV2. Información se presenta sólo en los aspectos de la mesa de trabajo que se utilizaron para procesar cada conjunto de datos. Por ejemplo, modelo de formación no fue utilizada durante el procesamiento del conjunto de datos cryoSXT presentado aquí, por lo tanto parámetros no se dan para esto.
SuRVoS Workbench difiere de otros programas de segmentación en que optimización de parámetros es un paso importante y necesario antes de comenzar la actual segmentación. En algunos programas de segmentación manual o semi manual, el usuario comienza a segmentar en momentos de la apertura de un nuevo proyecto. Con SuRVoS, porque grandes cantidades del volumen serán segmentados con usuario muy poco y límites están delineados por el programa, optimización de los parámetros es fundamental para una segmentación exitosa. En concreto, canales de función y Super-región edificio son dos áreas donde se debe prestar atención.
Canales de función y formación del modelo
Además de los datos crudos, SuRVoS permite crear conjuntos de datos adicionales o canales derivados de un conjunto de datos existente. Estos canales se pueden crear usando una selección de metodologías computacionales o extractores de característica. Cada una de las representaciones de datos están disponible en paralelo y pueden mostrarse individualmente para evaluar los resultados de filtro o función de aplicación. Debido a estas características, denominan canales de función en SuRVoS. Hay muchas opciones de canal característica en SuRVoS. Para obtener información sobre las opciones y parámetros que se utilizan aquí, ver tabla 1, para una lista completa y descripción de los canales disponibles de la función visita https://diamondlightsource.github.io/SuRVoS/ 2. Conjuntos de datos en primer lugar, ruidoso se beneficiarán de la eliminación de ruido Gaussiano o total filtro de variación. Se recomienda que más lejos característica canal y supervoxel/megavoxel cómputos realizarse utilizando uno de estos conjuntos de datos denoised como origen de datos. Generalmente, se utiliza el conjunto de datos de la variación total denoised como los datos de origen para los cómputos de canal y supervoxel/megavoxel función. Se recomienda correr con los valores por defecto en primer lugar, evaluar el resultado en 3D y finalmente, optimizar iterativamente los parámetros del conjunto de datos. Además, función canales pueden construirse en "conjuntos de filtro" que específicamente aislar aspectos de conjunto de datos y estos pueden luego utilizarse como fuentes de datos para crear supervoxels y megavoxels. Aunque esta estrategia es altamente dependiente del conjunto de datos, puede ser beneficioso.
Canales de función también se utilizan como fuentes para entrenar el clasificador en la formación de modelo. Al momento de decidir en qué canales de función a utilizar, se recomienda que algunos canales de característica sólida (p. ej., de detección de blob, textura y estructura o categorías de características robustas) se utilizan cuando se trabaja con una pequeña cantidad de anotaciones para capacitar a los clasificador. Cuando se trabaja con una gran cantidad de datos de entrenamiento, es aconsejable utilizar canales de función más generales, de cualquiera de las categorías como proporcionan información variada al clasificador (p. ej., añadir a los anteriores canales de función lista de locales características y categorías de funciones Gaussian).
Hay tres partes principales al modelo de formación: proporcionar fuentes de entrada de datos que describen los datos, usando estas entradas a un clasificador de tren y finalmente refinar las predicciones de salida. Generalmente, las regiones más pequeñas de los datos requerirá más anotaciones de usuario exactamente entrenar el clasificador, mientras que las regiones más grandes de los datos requerirá de menos anotaciones de usuario. Modelo formación primero sin seleccionar un refinamiento puede utilizarse para encontrar las mejores predicciones. A continuación incluyen el refinamiento y optimizar el parámetro lambda según sea necesario para solucionar problemas con las predicciones tales como agujeros o bordes irregulares.
Supervoxels y megavoxels
Supervoxels son agrupaciones de varios lugares similares vóxeles38,39. Supervoxels comienza como una rejilla 3D estándar superpuesta en los datos que luego se deforma iterativamente con el fin de cumplir con los límites subyacentes y así representar mejor los datos. Supervoxel creación y deformación es controlada por cuatro entradas del usuario: origen de datos, superpixel forma, espacio y compacidad. El origen de datos proporciona las entradas de datos que se consultan durante la creación de supervoxel. Cualquier fuente se puede utilizar como fuentes de datos filtrados. Los parámetros de forma superpixel determinan la parrilla de salida 3D y la forma aproximada de la supervoxels resultante. Cambiar estos parámetros puede aumentar o disminuir el tamaño de la supervoxels antes de deformación. Los parámetros de espaciado definen la importancia de los límites en cada dirección. Cambiar estos parámetros puede enfatizar los límites en una o dos direcciones a expensas de otro (s), lo que significa el supervoxels resultante se deforman para seguir mejor los límites de datos en las direcciones dadas. El último parámetro, compacidad, controla cuánto la supervoxels pueden deformarse. Un número de baja compacidad permite el supervoxels a deformar más. Estos parámetros deben optimizarse para proporcionar supervoxels que representan los límites de los datos de interés. Nota: Actualmente, los parámetros de forma de supervoxel deben ser igual a 1024 o menos al multiplicar juntos.
De alguna manera, supervoxel parámetros pueden compensar entre sí, significa que existe una "respuesta correcta" al decidir sobre los parámetros. Por ejemplo, una gran parrilla de salida (por ejemplo forma de superpixel: 10 x 10 x 10) y un número de baja compacidad (ej. 20) puede dar supervoxels con similar adherencia límite en comparación con una pequeña parrilla de salida (por ejemplo forma de superpixel 5 x 5 x 5) y una mayor número de compacidad (p. ej. 50). Porque hay más, supervoxels más pequeños en el segundo escenario, no tienen a deformar tanto para representar límites. Ambos conjuntos de parámetros podrían ser apropiados para la segmentación de la base de datos.
La consideración más importante al elegir parámetros supervoxel es qué tan bien las supervoxels representan los datos. El supervoxels solo, sin datos por debajo de ellos, como en la Figura 2D, es una buena manera de evaluar los parámetros supervoxel. Cuando aparezca de esta forma, los bordes y contornos de formas encontradas en los datos deben estar visibles en el supervoxels.
Megavoxels son conglomerados de varios vecinos, similar supervoxels38,39. Otra vez son controlados por cuatro entradas del usuario: origen de datos, lambda, numbins y gamma. Como con supervoxels, el origen de datos proporciona las entradas de datos que se consultan durante la creación de megavoxel. Lambda y numbins influyen en el tamaño y límite de adherencia de la megavoxels. Las megavoxels el crecimiento más grande (lambda alto, bajo numbins), disminuye su adherencia límite. Lo contrario también es cierto, adherencia límite aumentará con más pequeño megavoxels (lambda baja, alta numbins), sin embargo a medida que disminuye el tamaño de la megavoxel, también lo hace su utilidad en la segmentación rápidamente grandes cantidades de voxels. El parámetro opcional gamma controla el factor de suavidad versus el costo de la fusión de dos supervoxels juntos. Valores pequeños de gamma pueden mejorar la semejanza entre dos supervoxels, a costa de tener menos megavoxels general.
Como supervoxels, la más grande consideración al elegir y optimizar los parámetros de megavoxel es así el megavoxels representar los datos. Mostrando el megavoxels solamente como se describe para supervoxels otra vez puede utilizarse para evaluar los parámetros. Sin embargo, porque megavoxels será generalmente mucho más grandes y son tridimensionales, usando la anotación herramientas to elegir solo megavoxels para el límite entre las regiones de interés esté apretado también es recomendable.
Estrategia de anotación
Se han descrito dos estrategias de anotación general: un enfoque de formación de modelo es útil para separar las regiones grandes de un conjunto de datos, mientras que un enfoque de segmentación de la Super-región es útil para funciones más pequeñas, más diversos como organelos individuales. Las anotaciones pueden ser organizadas de manera jerárquica para que sea posible anotar grandes regiones primero, luego subdividir en regiones más específicas usando una relación de padre-hijo. Puede asignar la etiqueta de los padres para una etiqueta haciendo clic en el área a la derecha de la selección de color de la etiqueta y escoger una etiqueta apropiada de padres de un nivel anterior. En la práctica, más conjuntos de datos utilizan la formación del modelo y estrategias de segmentación de la súper-región para segmentar regiones particularidades de interés.
En el ejemplo de entrenamiento modelo aquí, unas entradas de entrenamiento (en forma de anotaciones de usuario basado en supervoxel) fueron utilizados en tres cortes equidistantes de los datos. De esta manera, el aspecto de capacitación modelo de SuRVoS enormemente aumenta la velocidad con la que segmentación es posible especialmente cuando trabajan con grandes, diferenciadas regiones tales como la división entre las regiones en el cuerpo fructífero de pasto pata de ganso como se destaca en Figura 3.
Cuando el modelo formación, si las predicciones no se puede ver, puede ser necesario ir a la pestaña de visualización y asegúrese de que esté activada la capa de predicciones y establece en una cantidad apropiada de transparencia. También, una confianza de 0 asignará cada supervoxel sin etiqueta a una etiqueta, basada en cualquiera que sea el partido más cercano. Confianza de 100 sólo asignará una etiqueta si sólo cuenta con una categoría de etiqueta cualquier partido proporcional. Todo lo demás es un equilibrio de estos dos extremos. Al seleccionar un nivel de confianza se sugiere para comprobar unas lonchas para inspeccionar visualmente que no hay vóxeles incorrectamente predichos antes de guardar la predicción en una etiqueta.
Una buena estrategia para anotar con regiones súper es utilizar la herramienta de aumento para ampliar los datos, anotar algunos orgánulos a la vez en un segmento, usando un enfoque de "rápido y sucio" primero (figura 4). A continuación, mueva hacia arriba o hacia abajo unas lonchas en Z y repita este proceso. Porque supervoxels son tridimensionales, muchas de las fallas del enfoque "desordenado" se fijan por anotaciones hechas arriba o debajo de rebanadas. De esta manera, se acelera la segmentación y los límites son proporcionados por la supervoxels en lugar de manualmente.
Para limpiar una etiqueta, se proporcionan opciones de refinamiento de segmentación estándar. Dilatación hace que la etiqueta de segmentación seleccionados para crecer por el radio dado, erosión causa el encogimiento. Apertura y cierre son la aplicación de la primera erosión y dilatación o viceversa, respectivamente. Y relleno agujeros hace exactamente eso. Importa el orden de estas operaciones. En general, realizar los orificios de llenado, luego apertura y dilatación funciona bien. Cada método de refinamiento puede ser aplicado en una sola rebanada ("esta rebanada"), en todos los sectores en 2D ("todos los sectores (2D)") o en 3D ("todo volumen (3D)"). Se recomienda a todos los sectores (2D).
Importancia y futuro
Segmentación eficiente y precisa es el siguiente cuello de botella en el procesamiento de conjuntos de datos 3D, especialmente con la colección automatizada rutina de terabytes de datos de imagen durante las sesiones de largo plazo. SuRVoS Workbench puede acelerar el proceso de segmentación por un factor de 5 con respecto a la segmentación manual. También, porque los límites son delineados por la supervoxels, la variabilidad de la segmentación resultante debe mejorar. En el futuro, pretendemos explorar las maneras de utilizar la segmentación de una representación 3D región de interés como datos de entrenamiento para aplicar al resto del volumen, o incluso un volumen separado, con alta confianza. Este avance podría disminuir aún más la cantidad de tiempo del usuario y entrada necesario volúmenes biológicos complejos de segmento, ayudando a aliviar el embotellamiento de procesamiento y segmentación de imagen. Esto, a su vez, permitirá la comparación cuantitativa de los datos biológicos en varios Estados (por ejemplo, no enfermedad, enfermedad, tratada) con sólidos números experimentales.
Los autores declaran que no tienen intereses financieros que compiten.
Nos gustaría reconocer y agradecer a Rui Wang y Wah Chiu de Baylor College of Medicine para proveer el conjunto de datos cryoET y Andrew Bodey de fuente de luz diamante para ayudar con la beamtime I13. Partes de esta investigación fueron apoyadas por la subvención de los institutos nacionales de salud (NIH) nº (P41GM103832), reconocer la fuente de luz diamante para la financiación conjunta Imanol Luengo bajo STU0079 de doctorado.
Name | Company | Catalog Number | Comments |
computer | n/a | n/a | Must be running Linux operating system and have an NVidia GPU with at least 4 GB of memory |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados