Method Article
Segmentação de dados tridimensionais de muitas técnicas de imagem é um grande gargalo em análise de sistemas biológicos complexos. Aqui, descrevemos o uso de SuRVoS Workbench para semi automaticamente dados de volumétrica do segmento em diversas escalas de comprimento usando conjuntos de dados de exemplo de técnicas de tomografia computadorizada de raios-x de contraste fase, cryo macio tomography do raio x e tomografia computadorizada do cryo-elétron.
Segmentação é o processo de isolar regiões específicas ou objetos dentro de um volume de imagem, para que um estudo mais aprofundado pode ser realizado nestas áreas de interesse. Ao considerar a análise de sistemas biológicos complexos, a segmentação de dados de imagem tridimensional é uma etapa intensiva demorada e trabalhista. Com o aumento da disponibilidade de diversas modalidades de imagem e com sistemas de recolha de dados automatizada, isto coloca um desafio crescente para o biólogo experimental moderno mover dados para o conhecimento. Esta publicação descreve o uso da bancada de SuRVoS, um programa desenhado para resolver esses problemas, fornecendo métodos para semi-automaticamente segmento complexo volumétrico dados biológicos. Três conjuntos de dados de diferentes ampliação e as modalidades de imagem são apresentados aqui, cada um destacando diferentes estratégias de segmentação com SuRVoS. Tomografia de raio-x de contraste fase (microCT) do corpo frutífero de uma planta é usada para demonstrar utilizando treinamento de modelo de segmentação, tomografia computadorizada de elétron de cryo (cryoET) de plaquetas humanas é usada para demonstrar a segmentação usando supere megavoxels e crio macio Tomografia computadorizada de raios-x (cryoSXT) de uma linhagem de células de mamíferos é usada para demonstrar o rótulo dividindo ferramentas. Estratégias e parâmetros para cada tipo de dados também são apresentados. Misturando uma seleção de processos semiautomáticas em uma única ferramenta interativa, o SuRVoS oferece vários benefícios. Geral, hora de dados volumétricos de segmento é reduzida por um fator de cinco quando comparado a segmentação manual, dos pilares em muitos campos de processamento de imagem. Esta é uma economia significativa quando segmentação manual completo pode demorar semanas de esforço. Além disso, subjetividade é abordada através da utilização de limites computacionalmente identificados e divisão complexas coleções de objetos por suas propriedades calculadas em vez de em uma base caso-a-caso.
A bancada de SuRVoS é um pedaço de software projetado para permitir que os pesquisadores extrair informações cientificamente relevantes de dados volumétricos de várias amostras, independentemente da estrutura de interesse, a resolução ou a modalidade de imagem1, 2. Dados volumétricos como estas muitas vezes são coletadas usando sistemas de tomografia computadorizada de raios-x ou elétrons, rotineiramente com base em grandes laboratórios ou instalações centralizadas, devido à sua complexidade. Ambos esses métodos e outras técnicas, produzir grande, informações ricas datasets que constituir um desafio para o segmento com qualquer um dos métodos semiautomático ou manualmente. Particularmente, estado quase nativo cryo-imobilizado datasets requerem condições de imagem de baixa dose, resultando em uma baixa relação sinal-ruído e contraste pobre, especialmente em criogenia elétron tomography (cryoET)3,4,5 . Um fator adicional em alguns conjuntos de dados 3D é a presença de artefatos introduzido pelas condições desafiadoras experimentais envolvidas, por exemplo artefatos de cunha desaparecido devido a coleta de dados sobre um limitado inclinação gama, resultando em falta de informação e alongamento na direção do feixe,4,3,5. Mesmo quando baixo sinal-ruído ou faltando cunha de artefatos não é problemáticas (por exemplo, focado SEM6 de feixes de iões ou bloco serial enfrentar SEM7), a complexidade e a natureza tridimensional da amostra e a grande quantidade de dados significam análise seria ainda beneficie de um processo automatizado de segmentação de dados.
Atualmente, quando se considera volumes biológicos das células, existem muitas opções para automaticamente ou semi-automaticamente identificando características celulares muito específicas, tais como a actina, microtúbulos ou complexos de proteínas específicas, usando uma pesquisa baseada em modelo, ou identificando recursos em determinados tipos de conjuntos de dados (por exemplo, alto contraste, manchado, amostras de resina-incorporado)8,9,10,11,12. No entanto, nestes casos apriorísticas informações ou protocolos de preparação de amostra específico são necessários, limitando a ampla aplicabilidade destas estratégias de segmentação. Também existem ferramentas disponíveis que executam o modelo de formação a nível de voxel para aprender o aparecimento de várias estruturas de interesse quando dado de entrada de usuário13. No entanto, a este nível a complexidade da formação e os modelos de teste pode ser computacionalmente caro e sujeito a erros. Dadas as difíceis condições de imagem e a falta de estratégias de segmentação amplamente aplicável, semi automática, manual segmentação é comum, mesmo quando trabalhando com materiais biológicos complexos14,15, 16 , 17. no entanto, é geralmente aceite que o processo de segmentação manual não é apenas demorado, mas também propenso, subjetiva e variável4,5,18,19 ,20. Alguns programas de segmentação oferecem ferramentas para facilitar o processo de segmentação manual (ou seja, interpolação, laço ou ferramentas de golpe)21,22, no entanto, em casos de datasets barulhento, eles são difíceis de aplicar com sucesso, e mesmo quando eles são usados com sucesso, o processo ainda é subjetiva e variável.
Tradicionalmente, as segmentações têm sido utilizadas de duas maneiras distintas: qualitativa ou quantitativamente. Como melhoram a imagem de tecnologias e estratégias de segmentação, tornou-se mais comum para usar a segmentação como uma ferramenta quantitativa para responder a questões biológicas e como uma "verdade de chão" para algoritmo desenvolvimento8,12, 15,23,24,25. Para isso, saldos e verificações detalhadas são necessários para diminuir a variabilidade e subjetividade em todo o processo de26. No entanto, estas precauções ainda mais aumentam a natureza demorada de segmentação. Por isso, é fundamental para fornecer uma estratégia de segmentação mais rápida e menos variável.
A bancada de trabalho de SuRVoS começa a abordar estas questões, fornecendo o usuário com uma seleção de aprendizado de máquina e ferramentas que auxiliam o usuário no processo de segmentação, enquanto também orientando o usuário pelas etapas necessárias de processamento de imagem. Para conseguir isso, duas inovações principais são implementadas juntos no SuRVoS. Primeiro, ele usa uma hierarquia de supraregião de grupo similar, regiões próximas dos dados com base em suas propriedades inerentes. Cada uma das regiões na hierarquia representa o mesmo volume usando menos elementos, enquanto continua a fornecer a aderência forte limite. Assim, supraregiões reduzem a complexidade de segmentar um volume por várias ordens de magnitude, ainda continuam a representar os dados sem perda significativa de informação27. Em segundo lugar, o SuRVoS fornece uma estratégia de segmentação semi-automático que utiliza o mínimo de segmentação manual entradas para treinar os classificadores, que são então utilizados para segmentar o restante volume28,29. Esta estratégia reduz a segmentação manual, grandemente, diminuindo a quantidade de usuário tempo gasto na segmentação e, quando usando supraregiões, remove manual delimitação de fronteiras, potencialmente reduzindo a variabilidade e subjetividade.
Uma outra característica fundamental do SuRVoS é a ferramenta de divisor de rótulo, segundo o qual um usuário pode classificar uma série de objetos já segmentados com base em suas propriedades inerentes. Após a segmentação de vários objetos de interesse, esta ferramenta pode ser usada para dividir o conjunto em subclasses, com base em medidas como objeto de média intensidade, variância, tamanho, localização, etc. isto é útil quando a classificação dos grandes grupos de objetos com alta complexidade. Por exemplo, um grupo de organelas celulares pode ser dividido em mitocôndrias, vesículas vazias, gotículas lipídicas, etc.; ou um conjunto de material inclusões podem ser separados com base no tamanho ou forma. Uma vez segmentado os rótulos individuais pode ser dividida em grupos usando qualquer número de classificadores, reduzir o viés de identificação.
A bancada de trabalho de SuRVoS com sucesso serviu para dados do segmento de várias técnicas de imagem. Aqui, o síncrotron raio x fase contraste tomografia computadorizada (microCT) do corpo frutífero de uma planta é usada para demonstrar segmentatiusando o modelo formação, tomografia computadorizada de elétron de cryo (cryoET) de plaquetas humanas é usada para demonstrar a segmentação usando supere megavoxels, e crio suave raio x tomografia computadorizada (cryoSXT) de uma linhagem de células de mamíferos é usada para demonstrar o rótulo divisão ferramentas
Nota: geralmente útil escalas de parâmetros para cada etapa de processamento e os parâmetros específicos para cada tipo de dados mostrados aqui são fornecidas na tabela 1.
1. preparar um espaço de trabalho e carregando dados
2. Pré-processamento e representação de dados
3. Gerando regiões super apropriado
4. Introdução à anotação
5. Treinamento de modelo de segmentação usando demonstrado com um dataset microCT.
Nota: A primeira segmentação para muitos conjuntos de dados é para diferenciar várias grandes regiões do outro. Por exemplo, separando o núcleo do citoplasma, ou a célula de estrutura de gelo e apoio externa. Para este tipo de segmentação, com limites claros delineados e grandes regiões, formação de modelo é útil. Para demonstrar isso, raio-x fase contraste tomográficos dados de Goosegrass serão usados.
6. Segmentação usando supraregiões, demonstrado com um CryoET Dataset.
Nota: segmentação supraregião desde que é útil para áreas menores, discretamente ligadas, o foco aqui será na segmentação das organelas e microtúbulos dentro deste conjunto de dados. Modelo de formação foi usada para segmentar rapidamente a plaqueta do gelo do fundo e do carbono; Estes parâmetros não são discutidos, mas são apresentados na tabela 1.
7. Classificação e análise de dados objetos com base em características intrínsecas, demonstrado com um CryoSXT Dataset
Nota: geralmente, o próximo passo após a segmentação é a análise dos dados. A ferramenta de divisor de rótulo em SuRVoS permite a classificação de objetos segmentadas usando regras baseadas em características intrínsecas dos objetos tais como a intensidade do objeto média, variância, volume ou posição. A ferramenta de estatísticas de rótulo permite a visualização das relações entre estas medidas para cada nova classe de objeto. Estas são as novas ferramentas poderosas para a análise de conjuntos de dados complexos e 3D após a segmentação.
8. Exportação de dados e segmentações
Três conjuntos de dados volume, coletados a partir de três diferentes técnicas (microCT, cryoET e cryoSXT) foram usados para demonstrar três características importantes da bancada SuRVoS: modelo de formação, segmentação supraregião e divisão de rótulo. Os conjuntos de dados representam um grupo diverso de resultados experimentais, para cada um dos quais parâmetros de processamento completo são fornecidos (tabela 1).
Para demonstrar a formação de modelo usando a bancada de SuRVoS, foi escolhido um conjunto de dados relativamente alto contraste com a região, definição de limites. Este dataset do fruto de Galium aparine, ou goosegrass, foi coletado usando tomografia de contraste de fase de raio-x sobre a trajetória de Imaging I13-2 diamante-Manchester na Diamond Light Source, Chilton, Oxfordshire, Reino Unido. A nova amostra foi montada no ar para um goniômetro base em cima do palco de rotação, a uma distância de amostra-detector de 30 mm. exposição tempos eram 0,10 s com o espectro de raio-de-rosa, que possui uma energia média de cerca de 22 keV. As projeções foram coletadas por meio de 180° com um tamanho de passo de 0,1 °. Reconstruções tomográficas foram realizadas usando Savu30,31 , com o filtro de Paganin para contraste de fase baseada em propagação de imagens32 seguido de reconstrução de projeção traseira filtrada no ASTRA toolkit33 , 34. esses dados foi então reduzidos com 2 x 2 x 2 binning para reduzir o tamanho do arquivo antes de ser inseridos a bancada de trabalho de SuRVoS.
Primeiro, os dados de entrada (Figura 3A) foi filtrados e aperta (para remover valores superior e inferior de intensidade nos dados) (Figura 3B). Desta forma, o plano de fundo e primeiro plano foram feitas mais facilmente distinguíveis e acentuou-se a textura da estrutura interna do fruto. Em seguida, supervoxels foram construídos em cima do conjunto de dados filtrado (Figura 3). Para avaliar a qualidade da supervoxels, eles foram exibidos sem os dados para verificar que detalhes pertinentes do dataset foram bem representados pelo supervoxels (Figura 3D). Manuais, próximo as anotações usando supervoxels foram fornecidas como dados de treinamento em três fatias do volume (Figura 3E, cores escuras). Este dados de treinamento foram suficientes para treinar o classificador para prever (cores claras), as áreas correspondentes ao fundo (verde), fruto da cerda (vermelho), material de semente (roxo) e em torno de carne (azul). Morfológicos refinamentos foram usados para limpar as segmentações pelos furos do enchimento, crescendo ou encolhendo como necessário (Figura 3F). O tempo total gasto para determinar parâmetros adequados e segmentar Este dataset foi 2 h.
Para demonstrar a segmentação supraregião usando SuRVoS Workbench, um dataset barulhento e complexo foi escolhido15. Este conjunto de dados foi coletado usando cryoET no centro nacional para Imaging Macromolecular no Baylor College of Medicine, Houston, TX, Estados Unidos. Brevemente, as plaquetas estavam mergulho congelada no brilho descarregado e ouro fiducial tratada holey carbono TEM grades. Série de inclinação foram coletado de ±65 ° com um incremento de 2°. A série de inclinação depois foi reconstruída usando projeção traseira ponderada no IMOD35.
Depois de carregar os dados em SuRVoS (Figura 4A), uma região de interesse foi Selecionadoda e aplicou-se um conjunto de filtro apropriado. Neste caso, um filtro Gaussian suavização, seguido por um filtro de variação total com o contraste pinçado foi usado para acentuar as bordas e texturas dos dados (Figura 4B). Em seguida, formação de modelo com entrada mínima do usuário baseada em supervoxel foi usada para segmentar a plaqueta do gelo de fundo e carbono. Em seguida, segmentação semi manual com megavoxels e supervoxels foi usada para segmentar as organelas. Por último, o parâmetro de fonte de supervoxel foi mudado para um filtro mais fraco denoising e supervoxel forma tornou-se menor (ver tabela 1) para melhor preservar os limites de microtúbulos para segmentação (Figura 4). Para as organelas e os microtúbulos, utilizaram-se anotações manuais rápidas cada 5-10 fatias para selecionar o supervoxels que descrevem a característica de interesse (Figura 4 & 4E). O tempo total gasto para determinar parâmetros adequados e a região de interesse apresentado do segmento era 6h.
Para demonstrar rótulo dividindo usando a bancada de SuRVoS, foi escolhido um conjunto de dados com muitos, variados organelas. Este conjunto de dados foi coletado usando cryoSXT na trajetória B24 no Diamond Light Source, Chilton, Oxfordshire, UK36. Brevemente, células HEK293 foram cultivadas nas grades de ouro finder, tamanhos fiducials de ouro foram adicionados e a grade foi congelado usando um EM com faces traseiras mancha de mergulho. Série de inclinação então foram coletado em um microscópio de ±65 ° com um incremento de 0,5 °. A série de inclinação depois foi reconstruída usando projeção traseira ponderada no IMOD35.
Depois de carregar os dados em SuRVoS (Figura 5A), uma região de interesse foi Selecionadoda e um filtro apropriado variação total foi usado para aumentar os limites das organelas em todo o volume (Figura 5B). Em seguida, organelas foram semi manually segmentados usando megavoxels e supervoxels e em seguida, refinado com orifícios de enchimento, fechamento e dilatação para suavizar as bordas (Figura 5). O tempo total para determinar parâmetros adequados e a região de interesse apresentado do segmento era 4h. Uma vez que a segmentação foi finalizada, o divisor de etiqueta foi usado para visualizar cada organela como um objeto no conjunto de dados (Figura 5) e várias características sobre cada objeto na trama de dados (Figura 5E). A interface de rótulo divisor é interativa, atualizando a cor associada com cada nova classe de rótulo em ambos a visualização e a trama de dados. Isto permite a criação de várias regras com base nas características inerentes nos dados que podem ser usados para separar os objetos em classes útil (Figura 5F).
Figura 1. O Layout e características gerais da bancada SuRVoS.
A interface GUI está à esquerda, enquanto o painel de visualização é à direita. Estas duas áreas são separadas por uma coluna de ferramentas e atalhos. O GUI é arranjado para orientam o usuário através das etapas principais no pré-processamento dos dados, escolhendo parâmetros supervoxel e/ou megavoxel, segmentando os dados e se necessário usando o modelo de formação, antes de exportar as segmentações. O painel de visualização pode ser usado em três modos: segmentação para exibir os dados e visualização básicae qualquer aplicado filtros e segmentar os dados, rotular o divisor para categorizar objetos em novos rótulos, com base em aspectos inerentes aos dados e finalmente rotular estatísticas para medir e visualizar as características dos objetos segmentados. Para cada um desses modos, menu drop-down no topo deixou controles de canto que dados são mostrados, e o controle deslizante na parte superior controla o eixo z. Os atalhos da ferramenta fornece controle de fácil acesso sobre contraste, transparência de camadas, zoom, panorâmica e voltando para "casa" no painel de visualização e ferramentas de abertura para anotação conforme descrito no protocolo. Clique aqui para ver uma versão maior desta figura.
Figura 2. Hierarquia de supraregião reduz a complexidade de segmentação de imagens.
Uma imagem do Berkeley segmentação Dataset (BSDS50037) foi usada para demonstrar os efeitos das supraregiões e propriedades. A imagem original (à esquerda) é composta por milhares de voxels, que são então reunidos em grupos adjacentes, similares para criar algumas centenas supervoxels (centro). Supervoxels também podem ser reunidos em grupos adjacentes, similares para criar algumas dezenas de megavoxels (à direita). Com cada agrupamento, a complexidade da tarefa segmentação é diminuída, para recursos computacionais e manuais. Importante, um exemplo 2D é mostrado aqui, no entanto, ambos os supervoxels e megavoxels são 3D. Clique aqui para ver uma versão maior desta figura.
Figura 3. Processamento de um microCT Dataset usando uma estratégia de segmentação de treinamento modelo.
R. uma única fatia 2D dos dados brutos. B. aplicação de um filtro de variação total preso para os dados brutos aprimorado as fronteiras entre os vários aspectos do corpo frutífero. C. supervoxel adequada parâmetros foram escolhidos. M. uma região de interesse (caixa vermelha na C) é mostrada para demonstrar que os limites dos dados estão presentes no supervoxels si. E. três fatias do volume com anotações manuais de várias áreas do conjunto de dados exibidos em cores escuras (verdes, vermelhas, azuis e roxas) e previsões após a execução do treinamento do modelo exibido nas mesmas cores luz. F. as mesmas três fatias com a segmentação final após as previsões de formação de modelo foram aceites. Barras de escala são 1 mm. clique aqui para ver uma versão maior desta figura.
Figura 4. Processamento de um Dataset usando uma estratégia de segmentação supraregião de cryoET.
R. uma única fatia 2D dos dados brutos. B. uma região de interesse (caixa vermelha na ) com um conjunto de camadas de filtro aplicado para acentuar os limites das organelas. C. exemplo de anotar uma organela usando supraregiões. Uma única organela é mostrada com supervoxels sobrepostos com a anotação manual usuário exibida em preto (à esquerda) e o supervoxels escolhido com essa anotação, mostrada em azul (à direita). M. exemplo de anotar um microtubule usando supraregiões. Uma única região do microtubule é mostrada com a anotação manual usuário exibida em preto (à esquerda) e o supervoxels escolhido com essa anotação, mostrada em verde (à direita). E. A segmentação final apresentando a plaqueta de segmentado do plano de fundo usando o modelo de formação (ver tabela 1 para obter detalhes) e várias organelas e microtúbulos segmentados usando uma estratégia de segmentação supraregião. Cores não indicam tipos de organela específica como eles são mostrados aqui antes de classificação. Escala de barras em A, B e E são 1 μm e em C e D são 0,5 μm. Clique aqui para ver uma versão maior desta figura.
Figura 5. Análise de um Dataset usando a ferramenta de divisor de rótulo de cryoSXT.
R. uma única fatia 2D dos dados brutos. B. uma região de interesse (caixa vermelha na) com um filtro de variação total aplicado para acentuar as organelas. C. A segmentação final com supervoxels sobrepostos. D. a parte de visualização do separador rótulo com as organelas classificados usando as regras exibidas no F. E. A parte do enredo do separador rótulo exibindo a intensidade média dentro de cada objeto, com as regras exibidas no F aplicada. Cada linha vertical ao longo do eixo x representa um único objeto e é o código de cores para combinar com a classe que tem sido atribuído a. F. regras de classificação de exemplo para separar vários objetos com base em suas propriedades inerentes. Barras de escala são 1 μm. Clique aqui para ver uma versão maior desta figura.
Nome / Dataset | Fonte | P1 | P2 | P3 | P4 |
Filtro gaussiano | Sigma | ||||
Faixa / padrão | - | [0.5, 10] / 1 | |||
CryoET (G1) | Dados brutos | 1 | |||
CryoET (G2) | Dados brutos | 2 | |||
Variação total | Lambda | Espaçamento | # O Iter | Grampo | |
Faixa / padrão | - | [0.1, 30] / 10 | [10, 0.1] / 1 | [50, 500] / 100 | - |
MicroCT (TV1) | Dados brutos | 10 | 1 | 100 | (1,-) |
CryoET (TV2) | G1 | 7 | 1 | 200 | - |
CryoET (TV3) | G2 | 10 | 1 | 100 | - |
CryoSXR (TV4) | Dados brutos | 7 | 1 | 100 | - |
Limiarização | Vmin | VMAx | |||
Faixa / padrão |
Tabela 1. Parâmetros otimizados usado para processar cada um dos três conjuntos de dados (microCT, cryoET e cryoSXT).>
Para cada parâmetro, são dado um intervalo de propósito geral e padrão. Em muitos casos, os dados filtrados são usados como uma fonte para processamento a jusante. Nesses casos, uma abreviação é usada para denotar o novo conjunto de dados de origem. Por exemplo, G1 (dados brutos Gaussian cryoET filtrada) foi usados como entrada durante um filtro de variação total para criar TV2. Informação é apresentada apenas por aspectos da bancada de trabalho que foram usados para processar cada conjunto de dados. Por exemplo, formação de modelo não foi usada durante o processamento do dataset cryoSXT apresentado aqui, portanto sem parâmetros são dadas para isso.
SuRVoS bancada difere de outros programas de segmentação que otimização dos parâmetros é um passo necessário e importante antes de começar a segmentação real. Em alguns programas de segmentação manual ou semi manual, o usuário começa a segmentação dentro de momentos de abertura de um novo projeto. Com SuRVoS, porque grandes quantidades de volume vão ser segmentadas, com entrada do usuário muito pouco e os limites são delineados pelo programa, otimizar os parâmetros é fundamental para uma segmentação bem sucedida. Especificamente, têm canais e edifício da supraregião são duas áreas onde a atenção deve ser dada.
Dispõem de canais e modelo de formação
Além dos dados brutos, SuRVoS permite ao usuário criar conjuntos de dados adicionais ou canais derivados de uma existente dataset. Estes canais podem ser criados usando uma seleção de metodologias computacionais ou extratores de recurso. Cada uma das representações de dados estão disponível em paralelo e podem ser visualizadas individualmente para avaliar os resultados da aplicação de recurso ou filtro. Por causa destas características, eles são referidos como canais de recurso em SuRVoS. Há muitas opções de canal de recurso fornecidas dentro de SuRVoS. Para obter informações sobre as opções e parâmetros utilizados aqui, consulte a tabela 1, para obter uma lista completa e descrição de canais disponíveis recurso visite https://diamondlightsource.github.io/SuRVoS/ 2. Primeiro, barulhento datasets beneficiará denoising com o Gaussian ou total filtro de variação. Recomenda-se ainda mais cálculos de canal e supervoxel/megavoxel de recurso ser executada usando um esses conjuntos de dados denoised como o fonte de dados. Geralmente, a variação total denoised dataset é usado como a fonte de dados para cálculos de canal e supervoxel/megavoxel de recurso. Sugere-se executar com valores padrão, primeiro, avaliar o resultado em 3D e finalmente, iterativamente otimizar os parâmetros para o dataset. Além disso, o recurso de canais podem ser construídas em "conjuntos de filtro" para especificamente isolar aspectos do dataset e estes podem então ser usados como fontes de dados para criar supervoxels e megavoxels. Enquanto esta estratégia é altamente dependente de dataset, pode ser benéfico.
Têm canais também são usados como fontes para treinar o classificador no treinamento de modelo. Ao decidir em quais canais de recurso para usar, recomenda-se que alguns canais robusto recurso (por exemplo, da detecção de blob, textura e estrutura ou categorias de recursos robustos) são usados quando se trabalha com uma pequena quantidade de anotações para treinar o classificador. Quando se trabalha com uma grande quantidade de dados de treinamento, recomenda-se usar canais de característica mais gerais, de qualquer das categorias, enquanto fornecem informações variadas para o classificador (por exemplo, adicionar os canais de recurso acima lista de local características e categorias de funcionalidades Gaussian).
Há três partes principais para o modelo de formação: fornecendo fontes de entrada de dados que descrevem os dados, usando estas entradas para treinar um classificador e finalmente as previsões de saída de refinação. Geralmente, regiões menores dos dados exigirá mais anotações do usuário para treinar com precisão o classificador, enquanto regiões maiores dos dados exigirá menos anotações do usuário. Modelo de treinamento primeiro sem selecionar um refinamento pode ser usado para encontrar as melhores previsões. Em seguida, incluem o refinamento e otimizar o parâmetro lambda conforme necessário para corrigir problemas com as previsões, como buracos ou bordas irregulares.
Supervoxels e megavoxels
Supervoxels são aglomerados de vários nas proximidades, semelhante voxels38,39. Supervoxels começam como uma grade padrão 3D sobreposta os dados que então é deformada iterativamente a fim de respeitar os limites subjacentes e, assim, melhor representar os dados. Criação de Supervoxel e deformação é controlada por quatro entradas de usuário: fonte de dados, superpixel forma, espaçamento e compacidade. A fonte de dados fornece as entradas de dados que são consultadas durante a criação do supervoxel. Qualquer fonte pode ser usada, incluindo fontes de dados filtrados. Os parâmetros de forma superpixel determinam a grelha de partida 3D e a forma desejada aproximada do supervoxels resultante. Alterando estes parâmetros pode aumentar ou diminuir o tamanho da supervoxels antes da deformação. Os parâmetros de espaçamento Definirm a importância dos limites em cada direção. Alterando estes parâmetros pode enfatizar os limites em uma ou duas direções em detrimento de outro (s), ou seja, o supervoxels resultante se deformará para acompanhar melhor os limites dados na direção de determinado (s). O último parâmetro, compacidade, controla quanto a supervoxels pode deformar-se. Um número de baixa compacidade permite que o supervoxels a deformar-se mais. Esses parâmetros devem ser otimizados para fornecer supervoxels que representam os limites dos dados de interesse. Nota: Atualmente, parâmetros de forma de supervoxel devem ser igual a 1024 ou menos quando multiplicados juntos.
Em alguns aspectos, supervoxel parâmetros podem compensar um ao outro, ou seja, não há ninguém "resposta certa" ao decidir sobre parâmetros. Por exemplo, uma grande grelha de partida (por exemplo, forma de superpixel: 10 x 10 x 10) e um número de baixa compacidade (ex. 20) pode dar supervoxels com aderência de limite similar em comparação com uma grelha de partida pequena (por exemplo, superpixel forma 5 x 5 x 5) e uma maior número de compacidade (por exemplo, 50). Porque existem mais, supervoxels menor no segundo cenário, não têm a deformar-se tanto a representam limites. Ambos os conjuntos de parâmetros podem ser apropriados para segmentação do dataset.
A maior consideração quando escolher parâmetros de supervoxel é o quanto os supervoxels representam os dados. Exibir o supervoxels sozinho, sem dados por debaixo deles, como na Figura 2D, é uma boa maneira de avaliar parâmetros de supervoxel. Quando exibido desta forma, as bordas e os contornos das formas encontradas nos dados ainda devem estar visíveis no supervoxels.
Megavoxels são conglomerados de vários vizinhos, semelhante supervoxels38,39. Novamente são controlados por quatro entradas de usuário: fonte de dados, lambda, numbins e gama. Como com supervoxels, a fonte de dados fornece as entradas de dados que são consultadas durante a criação do megavoxel. Lambda e numbins tanto impacto a aderência de tamanho e limite do megavoxels. Como os megavoxels crescer maior (lambda elevado, baixo numbins), sua aderência limite diminui. O inverso também é verdadeiro, aderência limite aumentará com menor megavoxels (lambda baixa, alta numbins), no entanto como diminui o tamanho de megavoxel, assim como sua utilidade em segmentação de grandes quantidades de voxels rapidamente. O parâmetro opcional gama controla o fator de suavidade versus o custo de mesclar dois supervoxels juntos. Pequenos valores de gama podem realçar a similaridade entre dois supervoxels, à custa de ter menos megavoxels globais.
Como com supervoxels, a maior consideração quando escolhendo e otimização de parâmetros de megavoxel é bem como os megavoxels representam os dados. Exibir o megavoxels sozinho, como descrito por supervoxels novo pode ser usado para avaliar parâmetros. No entanto, porque megavoxels geralmente será muito maior e são tridimensionais, usando o t de ferramentas de anotaçãoo único megavoxels para garantir a fronteira entre as regiões de interesse é apertada de escolher também é recomendado.
Estratégia de anotação
Duas estratégias de anotação geral têm sido descritas: uma abordagem de treinamento do modelo é útil para a separação de grandes regiões de um dataset, enquanto uma abordagem de segmentação supraregião é útil para menores, mais diversos recursos como organelas individuais. As anotações podem ser organizadas de forma hierárquica, para que seja possível anotar grandes regiões primeiro e, em seguida, subdividir os em regiões mais específicas usando uma relação pai-filho. O rótulo do pai para um rótulo pode ser atribuído, clicando na área à direita da seleção de cor do rótulo e escolhendo um rótulo pai adequado um nível anterior. Na prática, a maioria dos conjuntos de dados usam o modelo formação e estratégias de segmentação supraregião de regiões/características específicas de interesse do segmento.
No modelo formação exemplo aqui, algumas entradas de treinamento (sob a forma de anotações de manual de usuário baseado em supervoxel) foram utilizadas em três fatias equidistantes dos dados. Desta forma, o aspecto de treinamento de modelo de SuRVoS aumenta enormemente a velocidade com que a segmentação é possível especialmente quando trabalhando com grandes, diferenciadas regiões tais como a divisão entre as regiões do corpo de frutificação goosegrass como destaque no Figura 3.
Quando o modelo de formação, se as previsões não podem ser vistas, pode ser necessário ir para a guia de visualização e certifique-se que a camada de previsões é ativada e definido como uma quantidade adequada de transparência. Também, uma confiança de 0 irá atribuir todas as supervoxel sem rótulo para um rótulo, com base em qualquer que seja a correspondência mais próxima é. Confiança de 100 apenas irá atribuir um rótulo, se apenas uma categoria de rótulo tem qualquer correspondência proporcional. Todo o resto é uma troca destes dois extremos. Ao selecionar um nível de confiança, sugere-se para verificar algumas fatias para inspecionar visualmente que não existem nenhum voxels incorretamente previsto antes para salvar a previsão de um rótulo.
Uma boa estratégia para anotar usando supraregiões é usar a ferramenta de ampliação para ampliar os dados, anotar algumas organelas, uma vez por uma fatia, usando uma abordagem "rápido e sujo" primeiro (Figura 4). Em seguida, mover para cima ou para baixo umas fatias em Z e repita este processo. Porque supervoxels são tridimensionais, muitas das falhas da abordagem "sujo" são fixadas por anotações feitas em acima ou abaixo de fatias. Desta forma, a segmentação é acelerada e os limites são fornecidos pelo supervoxels, em vez de manualmente.
Para limpar um rótulo, opções de refinamento de segmentação padrão foram fornecidas. Dilatação faz com que o rótulo de segmentação selecionado crescer pelo determinado raio, erosão provoca a encolher. Abertura e fechamento são a aplicação de erosão primeira e depois a dilatação ou vice-versa, respectivamente. E preenchimento de buracos faz exatamente isso. A ordem destas operações importa. Em geral, realizando preenchimento de buracos, em seguida, abertura e, em seguida, dilatação funciona bem. Cada método de refinamento pode ser aplicado em uma única fatia ("esta fatia"), em todas as fatias em 2D ("todas as fatias (2D)") ou em 3D ("todo volume (3D)"). Recomenda-se a todas as fatias (2D).
Significado e sentidos futuros
Segmentação eficiente e precisa é o próximo gargalo no processamento de conjuntos de dados 3D, especialmente com a coleção de rotina automatizada de terabytes de dados de imagem durante as sessões de longo prazo. SuRVoS bancada pode acelerar o processo de segmentação por um fator de 5 em comparação com segmentação manual. Também, porque os limites são delineados pela supervoxels, a variabilidade das Segmentações resultantes deve melhorar. No futuro, esperamos explorar maneiras de usar a segmentação de uma região 3D representativa de interesse como dados de treinamento para aplicar para o resto do volume, ou mesmo um volume separado, com alta confiança. Este avanço iria diminuir ainda mais a quantidade de tempo do usuário e de entrada necessária para segmento mesmo complexo biológico os volumes, ajudando a aliviar o gargalo de processamento e segmentação de imagem. Este, por sua vez, permitirá a comparação quantitativa de dados biológicos em vários Estados (por exemplo, não-doença, doença, tratada) com números experimentais robustos.
Os autores declaram que têm sem interesses financeiros concorrentes.
Nós gostaríamos de reconhecer e agradecer o Rui Wang e Wah Chiu da Baylor College of Medicine, para fornecer o conjunto de dados cryoET e Andrew Bodey da fonte de luz de diamante para auxiliar com o beamtime I13. Partes desta pesquisa foram apoiadas pela concessão do National Institutes of Health (NIH) n. º (P41GM103832), reconhecemos o Diamond Light Source para financiamento em conjunto Imanol Luengo sob STU0079 PhD.
Name | Company | Catalog Number | Comments |
computer | n/a | n/a | Must be running Linux operating system and have an NVidia GPU with at least 4 GB of memory |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados