Method Article
많은 이미징 기술 3 차원 데이터의 세분화는 복잡 한 생물 학적 시스템의 분석에서 주요 병목 이다. 여기, 우리가 설명 하는 다양 한 길이 스케일에서 체적 데이터를 세그먼트 반자동 SuRVoS 워크 벤치를 사용 하 여 예제 데이터 집합에서 cryo 전자 단층 촬영, cryo 소프트 x 선 단층 촬영, 그리고 위상 대비 x 선 단층 촬영 기법을 사용 하 여.
이러한 관심 분야에 추가 연구를 착수 수 있도록 세분화 특정 지역 이나 한 군데 볼륨 내에서 개체를 분리 하는 과정입니다. 고려 하면 복잡 한 생물 학적 시스템의 분석, 3 차원 이미지 데이터의 세분화 시간과 노동 집약적인 단계입니다. 많은 이미징 modalities의 증가 가용성 그리고 자동화 된 데이터 수집 체계,이 지식을 데이터에서 이동 현대 실험적인 생물학에 대 한 증가 도전 포즈. 이 간행물 SuRVoS 워크 벤치, 반자동으로 세그먼트 복잡 한 생물 학적 체적 데이터 메서드를 제공 하 여 이러한 문제를 해결 하도록 설계 된 프로그램의 사용을 설명 합니다. 다른 확대 및 이미징 modalities의 세 가지 데이터 집합 표시 됩니다 여기, 각각 SuRVoS와 세그먼트의 다른 전략을 강조. 단계 대조 x 선 단층 촬영 (microCT) 식물의 fruiting 본문의 세분화 모델 훈련을 사용 하 여 설명 하는, 인간 혈소판의 cryo 전자 단층 촬영 (cryoET) 슈퍼-및 megavoxels, 및 cryo 소프트 사용 하 여 분할을 보여 주기 위해 사용 됩니다. 포유류 세포 라인의 x 선 단층 촬영 (cryoSXT) 도구를 분할 하는 라벨을 입증 하는 데 사용 됩니다. 전략 및 각 데이터 형식에 대 한 매개 변수 또한 선물 된다. 단일 대화형 도구에 자동 프로세스의 선택, 혼합 하 여 SuRVoS는 여러 가지 혜택을 제공 합니다. 전체 시간 세그먼트 체적 데이터 수동 세분화, 다양 한 이미지 처리 분야에서 주류에 비해 5의 요인에 의해 감소 된다. 이 때 중요 한 저축 완전 수동 세분화 노력의 주를 걸릴 수 있습니다. 또한, 주관 계산 확인 된 경계 및 분할 복잡 한 컬렉션 개체의 계산 된 속성 보다는 사건에-의해-사건을 기준의 사용을 통해 해결 됩니다.
SuRVoS 워크 벤치는 관심, 해상도 또는 이미징 적임1,의 구조에 다양 한 샘플에서 메트릭 데이터에서 과학적으로 관련 정보를 추출 하는 연구를 허용 하도록 설계 된 소프트웨어의 한 조각 2. 체적 데이터와 같은이 종종 x-선 또는 전자 단층 촬영 시스템을 사용 하 여 수집 정기적으로 또는 기반으로 대형 실험실 그들의 복잡으로 인해 중앙된 시설. 모두 이러한 방법, 그리고 다른 기술, 대형 생산, 정보 풍부한 데이터 집합의 어떤 세그먼트 중 반자동 방식으로 또는 수동으로에 도전 증명. 근처-네이티브 상태 cryo 움직일 데이터 집합 낮은 복용량 이미징 조건, 낮은 신호 대 잡음 비율 및 cryo 전자 단층 촬영 (cryoET)3,4,5에서 특히 가난한 대비 결과 요구 하는 특히, . 일부 3D 데이터 집합에 추가 요소가 관련 된 도전적인 실험 조건에 의해 결과의 존재는, 예를 통해 제한 된 데이터 수집으로 인해 누락 된 쐐기 유물 범위, 결과 누락 된 정보에 기울기 및 광속3,,45의 방향으로 신장. 심지어 때 낮은 신호 대 잡음 또는 누락 된 쐐기 아티팩트는 문제 (예: 이온 빔 SEM6 초점 또는 직렬 블록 얼굴 SEM7), 복잡성 및 샘플, 및 많은 양의 데이터의 3 차원 본질 의미 분석 것 여전히 데이터 세분화를 위한 자동화 된 프로세스에서 혜택을.
현재 셀의 생물 학적 볼륨을 고려, 많은 옵션이 자동 또는 반자동으로 식별 말라, microtubules, 또는 특정 단백질 복합물, 템플릿 기반 검색을 사용 하 여 같은 매우 구체적인 휴대 전화 기능에 대 한 또는 데이터 집합 (예: 고대비, 스테인드, 수 지에 포함 된 샘플)8,,910,,1112특정 유형의 기능을 식별 합니다. 그러나, 이러한 경우 선험적으로 정보 또는 특정 샘플 준비 프로토콜에서는 이러한 세분화 전략의 광범위 한 적용을 제한 하는 데 필요한 있습니다. 또한 사용자 입력된13주어진 관심의 다양 한 구조의 모양을 배울 수 복 수준에서 모델 학습을 수행 하는 도구 사용할 수 있다. 그러나,이 수준에서 학습 및 테스트 모델의 복잡성 오류가 및 계산 비싼 수 있습니다. 도전적인 이미지 조건, 그리고 광범위 하 게 적용, 반자동 세분화 전략의 부족을 감안할 때, 수동 분할 일반적 이다, 복잡 한 생물 학적 재료14,15, 와 함께 작업 하는 경우에 16 , 그러나 17., 그것은 일반적으로 허용 수동 세분화의 과정만 소모, 하지만 또한 오류가, 주관적이 고 변수4,5,18,19 아니다 ,20. 그러나 수동 분할 프로세스 (즉, 보간, 올가미, 또는 타격 도구)을 쉽게 하기 위해 도구를 제공 하는 일부 세분화 프로그램21,22, 시끄러운 데이터 집합의 경우에,, 그들은 성공적으로 적용 하기 어려운과 심지어 그들이 사용 하는 경우 성공적으로,이 과정이 여전히 주관적이 고 가변입니다.
전통적으로, 세그먼트 두 가지 방법으로 사용 되었습니다: 질적 또는 양적. 이미징 기술 및 세분화 전략 개선, 그것은 되 고 더 일반적인 알고리즘 개발8,12, 생물학 질문에 대답 하는 양적 도구와 "지상 진실"으로 세분화를 사용 하 15,23,,2425. 이 위해서 자세한 견제와 균형은 변화와 과정26전체 주관 감소 해야 합니다. 그러나, 이러한 조치는 더욱 세분화의 시간이 걸리는 자연 증가. 이 때문에, 그것은 빠르고 덜 가변 분할 전략을 제공 하는 중요 한입니다.
SuRVoS 워크 벤치는 기계 학습 및 이미지 처리 도구를 또한 필요한 단계를 통해 사용자를 안내 하는 동안 세분화 과정에서 사용자를 지원의 선택과 함께 사용자를 제공 하 여 이러한 문제를 해결 하기 시작 합니다. 이 위해 두 가지 주요 혁신은 SuRVoS에서 함께 구현 됩니다. 첫째, 그룹 유사한, 그들의 고유의 속성을 기반으로 데이터의 인근 지역에 최고 지역 계층 구조를 사용 합니다. 각 계층에 영역의 강한 경계 준수 제공 하면서 적은 요소를 사용 하 여 동일한 볼륨을 나타냅니다. 따라서, 최고 지역 몇몇 크기 순서에 의해 볼륨 세그먼트의 복잡성을 줄이고 아직 여전히 정보27의 상당한 손실 없이 데이터를 나타냅니다. 둘째, SuRVoS 훈련 다음 나머지 볼륨28,29세그먼트를 사용 하는 분류자를 최소한의 수동 분할 입력을 사용 하 여 반자동된 세분화 전략을 제공 합니다. 이 전략 감소 수동 세그먼트, 세그먼트에 사용자 시간을 크게 감소 하 고, 최고 지역, 사용 하는 경우 경계, 잠재적으로 감소 변화 및 주관의 수동 묘사를 제거 합니다.
더 SuRVoS의 주요 특징은 레이블 쪼개는 도구, 사용자 그들의 고유한 특성에 따라 이미 세그먼트 개체의 시리즈를 분류할 수 있다 그것에 의하여. 관심의 다양 한 개체의 세분화, 후 서브 클래스 평균 개체 강도, 가변성, 크기 측정값을 기반으로 집합을 분할 하는 것이 도구를 사용할 수 있습니다, 그리고 위치, 등 유용과 개체의 큰 그룹을 분류할 때 높은 복잡성. 예를 들어 세포 세포의 그룹 미토 콘 드리 아, 빈 소포, 지질 방울 등으로 나눌 수 있습니다.; 또는 포함 분리 될 수 있다 자료 집합 크기 또는 모양에 따라. 일단 개별 레이블 세그먼트 수 있습니다. 그룹으로 분할 사용 하는 분류자, 식별 편견 감소의 수 있습니다.
SuRVoS 워크 벤치는 성공적으로 사용 되었다 세그먼트 데이터를 여러 이미징 기술에서. 여기, 싱크 로트 론 엑스레이 위상 대비 단층 촬영 (microCT) 식물의 fruiting 본문의 segmentati를 설명 하는모델 학습에 사용 하 여, 인간 혈소판의 cryo 전자 단층 촬영 (cryoET) 세분화 슈퍼-및 megavoxels를 사용 하 여 설명 하는 데 사용 됩니다. 및 cryo 소프트 x 선 단층 촬영 (cryoSXT)는 포유류 세포 라인의 도구를 분할 하는 라벨을 보여 주기 위해 사용 됩니다.
참고: 일반적으로 여기에 표시 된 각 데이터 형식에 대 한 특정 매개 변수 및 각 처리 단계에 대 한 매개 변수의 유용한 범위는 표 1에 제공 됩니다.
1. 준비 작업 영역 및 로드 데이터
2. 전처리 및 데이터 표현을
3. 적합 한 슈퍼 지구 생성
4. 주석 소개
5. 조각화를 사용 하 여 모델 학습 microCT 데이터 집합 함께 시연.
참고: 서로 다른 여러 큰 영역을 차별화 하는 데 많은 데이터 집합에 대 한 첫 번째 분할입니다. 예를 들어 세포질, 또는 외부 얼음 및 지원 구조에서 세포에서 핵을 분리. 명확한 구분된 경계와 큰 영역 세분화의이 유형에 대 한 모델 학습 유용합니다. 설명 하기 위해이, Goosegrass의 엑스선 단계 대비 단층 데이터 사용 됩니다.
6. 슈퍼 지구를 사용 하 여 세분화 CryoET 데이터 집합 함께 시연.
참고: 이후 슈퍼 지역 세분화는 더 작은, 몰래 바인딩된 영역에 대 한 유용, 세포와이 데이터 집합 내에서 microtubules의 세분화에 초점 여기 있을 것입니다. 모델 훈련 신속 하 게 배경 얼음과 탄소;에서 혈소판을 세그먼트에 사용 되었다 이러한 매개 변수 추가, 논의 하지 않습니다 하지만 표 1에 표시 됩니다.
7. 분류 및 분석의 데이터 개체에 따라 고유의 특성, CryoSXT 데이터 집합 함께 시연
참고: 일반적으로, 분할 후 다음 단계는 데이터의 분석. 레이블 분할 도구 SuRVoS에 평균 개체 강도, 분산, 볼륨, 또는 위치와 같은 개체의 기본 특성에 따라 규칙을 사용 하 여 세그먼트 개체의 분류에 대 한 수 있습니다. 각 새 개체 클래스에 대 한 이러한 조치 간의 관계의 시각화에 대 한 레이블 통계 도구 수 있습니다. 이들은 분할 후 복잡 한 3D 데이터 집합의 분석을 위한 강력한 새로운 도구.
8. 데이터 및 세그먼트
세 가지 다른 기술 (microCT, cryoET, 및 cryoSXT)에서 수집 된 3 개의 볼륨 데이터 집합 SuRVoS 워크 벤치의 3 개의 중요 한 기능을 보여 주기 위해 사용 했다: 교육, 슈퍼 지역 세분화 및 레이블 분할 모델. 데이터 집합 각각에 대 한 전체 처리 매개 변수를 제공 됩니다 (표 1) 실험 결과의 다양 한 그룹을 나타냅니다.
SuRVoS 워크 벤치를 사용 하 여 모델 학습을 보여 경계를 정의 하는 지역으로 상대적으로 높은 반면 데이터 집합 선택 되었다. 이 데이터 집합의 솔 aparine또는 goosegrass, 과일의 다이아몬드 광원, 칠, 옥스퍼드셔 주, 영국에서 I13-2 다이아몬드 맨체스터 이미징 Beamline에 엑스선 단계 대비 단층 촬영을 사용 하 여 수집 되었다. 신선한 샘플 각도 회전 무대 위에 기본에 어에 탑재 했다, 샘플-검출기 거리의 30 m m. 노출 시간 0.10 s 핑크 빔 스펙트럼은 약 22의 평균 에너지로 keV. 예측은 0.1 °의 단계 크기를 가진 180 °를 통해 수집 했다. 단층 촬영 개조 예약을 사용 하 여 수행한 전파 기반 위상 대비를 위한 Paganin 필터30,31 32 ASTRA 툴킷33 에서 필터링 된 다시 투영 재구성 다음 이미지 , 34.이 데이터는 2 x 2 x 2 SuRVoS 워크 벤치로 입력 되 고 전에 파일 크기를 줄이기 위해 binning 다음 축소 되었다.
첫째, 입력된 데이터 (그림 3A) 필터링 되었고 (위와 더 낮은 강도 값 데이터에서 제거)를 채워 (그림 3B). 이 방법에서는, 배경 및 전경 보다 쉽게 구별할 수 하 고 과일의 내부 구조의 질감 지기도 했다. 다음으로, supervoxels는 필터링 된 데이터 집합 (그림 3C)의 위에 건설 되었다. supervoxels의 품질을 평가, 그들은 데이터를 데이터 집합의 관련 정보 supervoxels (그림 3D)에 의해 잘 표현 했다 확인 없이 표시 했다. 다음, 수동 주석 supervoxels를 사용 하 여 학습 데이터 볼륨 (그림 3E, 어두운 색상)의 3 개 조각에 제공 했다. 이 학습 데이터는 예측 (연한 색) 배경 (녹색), 과일 다름 (레드), 씨앗 소재 (보라색), 해당 지역 분류자를 훈련 하기에 충분 한 살 (파란색) 주변. 형태학 상세 작성 구멍, 성장 또는 필요한 (그림 3 층)으로 축소 하 여는 세그먼트를 정리 하기 위해 사용 되었다. 적절 한 매개 변수를 결정 하 고이 데이터 집합을 분할 하는 총 시간 2 시간을 했다.
입증 하기 위해 슈퍼 지역 세분화 SuRVoS 워크 벤치를 사용 하 여, 소음과 복잡 한 데이터 집합15를선정 되었다. 이 데이터 집합은 의학의 베일 러 대학, 휴스턴, 텍사스 주 미국에서 고분자 이미징에 대 한 국립 센터에서 cryoET를 사용 하 여 수집 되었다. 간단히, 혈소판은 글로우 방전에 냉동 식이 되었고 금 표준 처리 홀리 탄소 가장 격자. 기울기 시리즈 2 ° 증가와 ±65 °에서 수집 되었다. 기울기 시리즈 다음 아이 모드35가 다시 투영을 사용 하 여 개축 되었다.
SuRVoS (그림 4A)에 데이터를 로드 한 후 관심 영역 선택 하 고 적절 한 필터 세트 적용 되었다. 이 경우에, 채워 대비 총 변형 필터 다음 부드럽게 가우시안 필터 가장자리와 데이터 (그림 4B)의 질감을 강조 하 사용 되었다. 다음, 최소한의 supervoxel 기반 사용자 입력 모델 훈련 배경 얼음과 탄소에서 혈소판을 세그먼트에 사용 되었다. 다음, megavoxels와 supervoxels 세미 수동 세그먼트 세그먼트에 있는 세포 사용 되었다. 마지막으로, supervoxel source 매개 약한 denoising 필터 변경 되었습니다 그리고 supervoxel 모양 더 세분화 (그림 4C) microtubules 경계를 유지 하기 위해 더 작은 ( 표 1참조) 되었다. 빠른 수동 주석을 사용한는 세포와는 microtubules에 대 한 관심의 기능을 설명 하는 supervoxels를 선택 하려면 모든 5-10 조각 (그림 4D & 4E). 적절 한 매개 변수를 결정 하 고 제시 하는 관심의 영역을 분할 하는 총 시간 6 h 이었다.
레이블 SuRVoS 워크 벤치를 사용 하 여 분할을 보여 많은, 다양 한 세포를 사용 하 여 dataset 선택 되었다. 이 데이터 집합 beamline B24 다이아몬드 광원, 칠, 옥스퍼드셔 주, 영국36에 cryoSXT를 사용 하 여 수집 되었다. 간단히, HEK293 세포 골드 파인더 격자에 성장 했다, 적절 한 크기의 골드 fiducials 추가 되었습니다 그리고 격자 식이 blotting 다시 양면으로 EM을 사용 하 여 고정. 기울기 시리즈 다음 0.5 ° 증가와 ±65 °에서 현미경에 수집 되었다. 기울기 시리즈 다음 아이 모드35가 다시 투영을 사용 하 여 개축 되었다.
SuRVoS (그림 5A)로 데이터를 로드 한 후 관심 영역 선택 하 고 적절 한 총 변형 필터를 볼륨 (그림 5B)에 걸쳐 세포의 경계를 강화 하는 데 사용 되었다. 다음, 세포 되었고 반 manually megavoxels 및 supervoxels를 사용 하 여 세그먼트 다음 채우기 구멍, 폐쇄 하 고 부드러운 가장자리 (그림 5C) 팽창으로 세련 된. 총 시간을 적절 한 매개 변수를 결정 하 고 제시 하는 관심 영역을 세그먼트 4 h 이었다. 세분화, 종료할 일단 레이블 스플리터 (그림 5D) 데이터 집합 및 데이터 플롯 (그림 5E)에서 각 개체에 대 한 다양 한 특성에는 개체와 각 세포 기관이 시각화 하 사용 되었다. 레이블 분할 인터페이스는 인터랙티브 시각화 및 데이터 플롯에 각 새로운 레이블 클래스와 관련 된 색상을 업데이 트입니다. 유용한 클래스 (그림 5 층)에 개체를 분리 하는 데 사용할 수 있는 데이터에 내재 된 특성에 따라 다양 한 규칙을 만들 수 있습니다.
그림 1입니다. 레이아웃 및 SuRVoS 작업 대의 일반적인 기능입니다.
GUI 인터페이스 시각화 창 오른쪽에는 왼쪽에 있다. 이 두 영역 도구 및 바로 가기의 열으로 구분 됩니다. GUI 세그먼트 데이터, supervoxel 및 megavoxel 매개 변수를 선택 하는 데이터를 전처리 하는 주요 단계를 통해 사용자를 걸어 배열 되 고 필요한 경우 사용 하는 세그먼트를 내보내기 전에 모델을 학습. 시각화 창 세 가지 모드에서 사용할 수 있습니다: 기본 시각화 및 데이터를 보려면 세분화그리고 모든 필터를 적용 하 고 세그먼트의 데이터를 새로운 레이블을 데이터에 내재 된 측면을 기반으로 개체를 분류 하는 스플리터 라벨 마지막으로 측정 된 개체의 특성을 시각화 하는 통계 레이블. 각이 모드에 대 한 상단에 있는 드롭-다운 메뉴 코너 컨트롤 데이터 표시 왼쪽과 상단에 슬라이더 제어 z 축. 도구 단축키 프로토콜에 설명 된 대로 주석 시각화 창에 열기 도구 대비, 레이어, 확대/축소, 이동 및 "홈" 반환의 투명도에 쉽게 액세스 제어를 제공 합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
그림 2입니다. 슈퍼 지역 계층 이미지 세분화의 복잡성을 줄일 수 있습니다.
버클리 세분화 데이터 집합 (BSDS50037)에서 이미지 속성 및 슈퍼 영역의 효과 설명 하기 위해 사용 되었다. 원본 이미지 (왼쪽)는 몇 백 supervoxels (센터)를 만드는 인접 한, 유사한 그룹으로 모여 다음 복의 수천의 구성 됩니다. Supervoxels는 megavoxels (오른쪽)의 몇 가지 수만 만들려고 인접, 비슷한 그룹으로 얻을 수 있습니다. 각 그룹화와 계산 및 수동 리소스에 대 한 세분화 작업의 복잡성 감소 됩니다. 그러나 중요 한 것은, 2D 예제는 여기에 표시 된,, supervoxels와 megavoxels는 3D. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
그림 3입니다. MicroCT 모델 교육 세분화 전략을 사용 하 여 데이터 집합의 처리.
A. 원시 데이터의 단일 2D 슬라이스. B. fruiting 신체의 다양 한 측면 사이의 경계 강화 원시 데이터에 클램핑 된 총 변형 필터 적용. C. 적절 한 supervoxel 매개 변수는 선택 되었다. D. 관심 ( C의 빨간색 상자) 영역 데이터의 경계가 자신 supervoxels에 설명에 표시 됩니다. 데이터 집합의 다양 한 분야의 수동 주석으로 볼륨의 E. 3 조각 어두운 색상 (녹색, 빨간색, 파란색, 보라색) 표시 하 고 예측 모델 훈련을 실행 한 후 동일한 밝은 색상에 표시. F. 마지막 세그먼트는 모델 훈련 예측 후와 동일한 3 조각. 스케일 바는 1 m m. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
그림 4입니다. CryoET 슈퍼 지역 세분화 전략을 사용 하 여 데이터 집합의 처리.
A. 원시 데이터의 단일 2D 슬라이스. B. 관심 ( A의 빨간색 상자)는 세포의 경계를 강조에 적용 계층된 필터 설정 영역입니다. C. 예는 세포 기관이 슈퍼 영역을 사용 하 여 주석. 단일 세포 기관이 수동 사용자 주석 (왼쪽) 검은색으로 표시 된 중첩 supervoxels와 supervoxels 블루 (오른쪽)에 표시 된 해당 주석 선택 표시 됩니다. D. 예 microtubule 슈퍼 영역을 사용 하 여 주석. Microtubule의 단일 영역 수동 사용자 주석 블랙 (왼쪽)와 녹색 (오른쪽)에 표시 된 해당 주석 선택 supervoxels에 표시와 함께 표시 됩니다. E. 최종 세분화는 혈소판 기능 모델 (자세한 내용은 표 1을 참조), 그리고 다양 한 세포 훈련과 microtubules 슈퍼 지역 세분화 전략을 사용 하 여 세그먼트를 사용 하 여 백그라운드에서 세그먼트. 색상 그들은 다음과 같이 분류 하기 전에 특정 세포 기관이 종류를 나타내지 않습니다. 확장에 막대 A, B 및 E는 1 μ m 및에 C와 D는 0.5 μ m. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
그림 5입니다. CryoSXT 레이블 분할 도구를 사용 하 여 데이터 집합의 분석.
A. 원시 데이터의 단일 2D 슬라이스. B. 강조는 세포에 적용 된 총 유사 필터 (A의 빨간색 상자) 관심의 영역입니다. C. 중첩 supervoxels와 마지막 분할. 디 F에 표시 된 규칙을 사용 하 여 분류 하는 세포와 레이블 스플리터의 시각화 부분. E. F 적용에 표시 된 규칙 각 개체 내의 평균 강도 표시 하는 레이블 분할자의 음모 부분. X 축 따라 각 수직 라인 단일 개체를 나타내고 그것에 할당 된 클래스와 일치 하는 색상으로 구분 됩니다. F. 그들의 고유한 특성에 따라 다양 한 개체를 별도의 예제 분류 규칙. 스케일 바는 1 μ m. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.
이름 / 데이터 집합 | 소스 | P1 | P2 | P3 | P4 |
가우스 필터 | 시그마 | ||||
범위/기본 | - | [0.5, 10] / 1 | |||
(G 1) cryoET | 원시 데이터 | 1 | |||
(G2) cryoET | 원시 데이터 | 2 | |||
총 변동 | 람다 | 간격 | # Iter | 클램프 | |
범위/기본 | - | [0.1, 30] / 10 | [0.1, 10] / 1 | [50, 500] / 100 | - |
(TV1) microCT | 원시 데이터 | 10 | 1 | 100 | (1,-) |
(TV2) cryoET | G1 | 7 | 1 | 200 | - |
(TV3) cryoET | G2 | 10 | 1 | 100 | - |
(TV4) cryoSXR | 원시 데이터 | 7 | 1 | 100 | - |
임계 처리 | Vmin | 브이 맥스 | |||
범위/기본 |
표 1입니다. 3 데이터 집합 (microCT, cryoET, 및 cryoSXT)의 각각을 처리 하는 데 사용 되는 최적화 된 매개 변수입니다.>
각 매개 변수에 대 한 일반적인 목적의 범위와 기본 제공 됩니다. 대부분의 경우에서 필터링 된 데이터는 다운스트림 처리에 대 한 소스로 사용 됩니다. 이러한 경우에, 약어는 새로운 소스 데이터 집합을 나타내는 데 사용 됩니다. 예를 들어 g 1 (가우시안 필터링된 cryoET 원시 데이터) TV2 만들려고 총 변형 필터 중 입력으로 사용 되었다. 정보는 각 데이터 집합을 처리 하는 데 사용 된 작업 대의 측면에만 제시 됩니다. 예를 들어 모델 훈련 여기에 제시 된 cryoSXT 데이터 집합의 처리 동안 사용 되지 않은, 따라서 매개 변수가 없는이 부여 됩니다.
SuRVoS 워크 벤치 다릅니다 다른 세분화 프로그램에서 매개 변수 최적화 실제 세분화 하기 필요 하 고 중요 한 단계입니다. 일부 수동 또는 반 수동 세분화 프로그램에서 사용자는 새로운 프로젝트를 여는 순간 내 세그먼트 시작 합니다. SuRVoS와 대용량 볼륨의 매우 작은 사용자 입력으로 분단 될 것 이다 고 경계는 프로그램으로 지정 하려면 매개 변수를 최적화 이므로 성공적인 세분화에 중요 합니다. 특히, 기능 및 최고 지역 건물 관심을 지불 해야 하는 두 영역이 있습니다.
기능 및 모델 교육
원시 데이터 뿐만 아니라 SuRVoS는 추가 데이터 집합을 만들거나 기존 데이터 집합에서 파생 된 채널 사용자 수 있습니다. 이 채널은 다양 한 계산 방법론 또는 기능 추출기를 사용 하 여 만들 수 있습니다. 각 데이터 표현을 동시에 사용할 수 있으며 기능 또는 필터 응용 프로그램의 결과 평가 하기 위해 개별적으로 표시 될 수 있습니다. 이러한 특성 때문에 그들은 SuRVoS에 기능 채널 이라고 하. SuRVoS에서 제공 하는 많은 기능 채널 옵션을 확인 하 고 있습니다. 옵션 및 매개 변수 사용에 대 한 내용은 여기, 전체 목록에 대 한 표 1을 참조 하 고 사용 가능한 기능 채널의 설명 방문 https://diamondlightsource.github.io/SuRVoS/ 2. 첫 번째, 시끄러운 데이터 집합에서 가우스 또는 총 denoising 유익할 변형 필터. 것이 좋습니다 추가 기능 채널 및 supervoxel/megavoxel 계산 수행 하이 denoised 데이터 집합 중 하나를 사용 하 여 데이터 원본으로. 일반적으로, 총 변이 denoised 데이터 집합 기능 채널 및 supervoxel/megavoxel 계산 소스 데이터로 사용 됩니다. 그것은 먼저 기본 값으로 실행, 3d에서 결과 평가 하 고 마지막으로, 반복적으로 데이터 집합에 대 한 매개 변수 최적화에 좋습니다. 또한, 채널 쌓아 올릴 수 있다 "필터 세트"로 특히 기능, 데이터 집합 및이 분리 다음 supervoxels 및 megavoxels를 만드는 데이터 원본으로 사용할 수 있습니다. 이 전략은 매우 종속 데이터 집합, 그것은 도움이 될 수 있습니다.
기능 채널 또한 훈련 모델 훈련에서 분류자를 원본으로 사용 됩니다. 때 사용 하는 기능은 채널에서 그것 사용이 좋습니다 몇 가지 강력한 기능 채널 (예를 들어, blob 감지, 짜임새 및 구조, 또는 강력한 기능 범주에서)는 작은 양의 주석 작업할 때 훈련 하는 분류자입니다. 많은 양의 학습 데이터를 사용 하는 것이 좋습니다는 분류자에 다양 한 정보를 제공 하는 그들은 더 많은 기능은 채널 범주에서 전반적인 사용 (예를 들어, 로컬에서 위의 목록 기능 채널에 추가 기능 및 가우스 기능 범주)입니다.
교육 모델에 3 개 주요 부품이 있다: 데이터를 설명 하는 입력된 데이터 소스를 제공, 이러한 입력을 사용 하 여 분류자, 훈련 하 고 마지막으로 출력 예측 정제. 일반적으로, 데이터의 작은 영역 데이터의 더 큰 지역 적은 사용자 주석 필요 합니다 하는 동안 분류자를 정확 하 게 훈련을 더 많은 사용자 주석 필요 합니다. 모델 훈련 먼저 상세를 선택 하지 않고 사용할 수 있습니다 최상의 예측을 찾을 수 있습니다. 다음 상세를 포함 하 고 구멍 또는 가장자리 등 예측 문제를 해결 하는 데 필요한 람다 매개 변수를 최적화 합니다.
Supervoxels 및 megavoxels
Supervoxels는 여러 클러스터 근처, 비슷한 복38,39. Supervoxels 기본 경계를 준수 하기 위해 반복적으로 변형 다음 데이터에 중첩 표준 3D 그리드로 시작 하 고 따라서 더 나은 데이터를 나타냅니다. Supervoxel 생성 및 변형 4 개의 사용자 입력에 의해 제어 됩니다: 데이터 원본, superpixel 모양, 간격, 및 소형. 데이터 소스는 supervoxel 생성 하는 동안 쿼리는 데이터 입력을 제공 합니다. 필터링 된 데이터 소스를 포함 하 여 모든 소스를 사용할 수 있습니다. Superpixel 모양 매개 변수 시작 3D 그리드 및 결과 supervoxels의 대략적인 원하는 모양을 결정합니다. 이러한 매개 변수를 변경 증가 하거나 변형 하기 전에 supervoxels의 크기를 줄일 수 있습니다. 간격 매개 변수는 각 방향에 있는 경계의 중요성을 정의합니다. 이러한 매개 변수를 변경 하나 경계를 강조할 수 있다 또는 다른 (s), 결과 supervoxels 의미 비용으로 두 방향으로 데이터를 특정된 방향에 경계를 따라 더 변형 됩니다. 마지막 매개 변수, 소형, 얼마나 많은 supervoxels 변형 수 제어 합니다. 낮은 압축 수 더 변형 supervoxels 수 있습니다. 이러한 매개 변수는 관심의 데이터의 경계를 나타내는 supervoxels를 제공 하기 위해 최적화 되어야 합니다. 참고: 현재, supervoxel 모양 매개 변수는 1024 동일 해야 합니다이 함께 곱한 때.
몇 가지 방법으로 supervoxel 매개 변수 보정할 수 있습니다, 거기 아무도 "정답"은 의미 매개 변수에 결정할 때. 예를 들어 큰 시작 격자 (예: superpixel 형태: 10 x 10 x 10) 및 낮은 압축 수 (출 20) 작은 시작 표 (예: superpixel 모양 5 x 5 x 5)에 비해 비슷한 경계 준수와 높은 supervoxels를 줄 수 있습니다 소형 숫자 (예: 50)입니다. 있기 때문에 더 많은, 두 번째 시나리오에 더 작은 supervoxels 그들은 필요가 없습니다 경계를 나타내는 만큼 변형. 두 집합이 매개 변수는 데이터 집합의 세그먼트에 대 한 적절 한 될 수 있습니다.
Supervoxel 매개 변수를 선택할 때 가장 큰 고려 사항은 supervoxels 데이터를 대표 하는 얼마나 잘 이다. 표시에서 그림 2D, 그들, 밑 데이터 없이 혼자 supervoxels supervoxel 매개 변수를 평가 하는 좋은 방법 이다. 이 방법으로 표시, 가장자리와 데이터에서 발견 하는 도형의 윤곽선 여전히 표시 됩니다는 supervoxels에서.
Megavoxels는 여러 이웃, 유사한 supervoxels38,39의 대기업. 그들은 다시 4 개의 사용자 입력에 의해 제어 됩니다: 데이터 소스, 람다, numbins, 및 감마. Supervoxels에서와 마찬가지로 데이터 소스 megavoxel 생성 하는 동안 쿼리는 데이터 입력을 제공 합니다. 람다와 numbins는 megavoxels의 크기와 경계 준수에 영향을. megavoxels 더 큰 (높은 람다, 낮은 numbins)를 성장, 그들의 경계 준수 감소 합니다. 그러나 대화도 사실 이다, 경계 준수와 함께 증가할 것 이다 작은 megavoxels (낮은 람다, 높은 numbins), megavoxel 크기 감소, 그래서 않습니다 신속 하 게 많은 양의 복 세그먼트에서 그들의 유용성. 옵션 감마 매개 변수 2 supervoxels를 함께 병합의 비용 대 부드럽게 요소를 제어 합니다. 감마의 작은 값은 데 적은 megavoxels 전반적인 비용 두 supervoxels 사이의 유사성을 강화할 수 있다.
Supervoxels, 것과 같이 가장 큰 고려 사항은 선택 하 고 megavoxel 매개 변수를 최적화 하는 경우는 megavoxels 데이터를 대표 하는 얼마나 잘 이다. 표시 하는 megavoxels supervoxels에 설명 된 대로 혼자 다시 매개 변수를 평가 하기 위해 사용할 수 있습니다. 그러나, 때문에 megavoxels 일반적으로 훨씬 더 큰 것 3 차원를 사용 하 여 주석 도구 to 선택 관심 영역 사이 경계는 꽉 수 있도록 단일 megavoxels 또한 것이 좋습니다.
주석 전략
두 가지 일반적인 주석 전략 설명: 모델 교육 접근은 슈퍼 지역 세분화 접근 개별 세포와 같은 더 작은, 더 다양 한 기능에 대 한 유용 하지만 데이터 집합의 큰 영역을 분리 하는 데 유용. 먼저, 큰 영역을 주석을 다음 부모-자식 관계를 사용 하 여 보다 구체적인 지역으로 그들을 분할 수 있도록 계층적 패션에 주석을 구성할 수 있습니다. 레이블의 부모 레이블 레이블 색 선택의 오른쪽에 있는 영역을 클릭 하 고 이전 수준에서 적절 한 상위 레이블을 선택 하 여 지정할 수 있습니다. 실제로, 대부분 데이터 집합 사용 하 여 모델 학습 및 슈퍼 지역 세분화 전략 관심의 특정 영역/기능 세그먼트.
모델 훈련 예 여기에 몇 가지 훈련 입력 (수동 사용자 supervoxel 기반 주석 형태로)는 데이터의 3 개의 동등 하 게 간격 둔된 조각에 사용 되었다. 이 방법에서는, SuRVoS의 모델 교육 측면 성은 세분화 된 가능한 에 강조 goosegrass fruiting 시체에서 지역 간의 격차 등 지역의 차별화 된 큰, 작업 하는 경우에 특히 속도 증가 그림 3.
때 모델 교육, 예측을 볼 수 없습니다, 경우 그것은 수 있습니다 시각화 탭에가 고 예측 레이어 켜져 있는지 확인 해야 할 고 투명의 적절 한 금액으로 설정. 또한, 0의 신뢰 모든 레이블된 supervoxel 어떤 가까운가에 따라 레이블을 할당할 수 있습니다. 단지 100의 신뢰는 라벨의 1 개의 종류는 어떤 비례 일치 하는 경우에 레이블을 할당할 것 이다. 사이 모든 것이 두 극단의 거래 이다. 신뢰 수준을 선택할 때 그것은 아무 잘못 예측된 복 레이블에 예측을 저장 하기 전에 육안으로 직접 검사를 몇 조각 확인 하기 좋습니다.
슈퍼 지구를 사용 하 여 주석을 위한 좋은 전략 데이터에 주석을 한 번에 한 조각, 먼저 "빠른, 지저분한" 접근을 사용 하 여 (그림 4C)에 몇 가지 세포를 확대 도구를 사용 하는 것입니다. 다음, Z에 몇 조각 위아래로 이동 하 고이 과정을 반복 합니다. Supervoxels 3 차원 이기 때문에, "지저분한" 방법의 결함의 많은 조각 아래 또는 위의 주석에 의해 고정 됩니다. 이 방법에서는, 세분화는 가속화 하 고 경계는 supervoxels에 의해 보다는 수동으로 제공 됩니다.
라벨 정리, 표준 세분화 구체화 옵션 제공 되었다. 팽창 하면 선택한 세분화 레이블이 특정된 반경으로 성장, 침식 축소 됩니다. 열기 및 닫기는 각각 첫 번째 침식 및 다음 팽창, 또는의 응용 프로그램입니다. 그리고 채우기 구멍을 정확 하 게. 이러한 작업 순서 상관. 일반적으로, 다음 열기, 다음 팽창 작용 채우기 구멍을 수행. 각 수정 방법 ("이이 슬라이스"), 단일 슬라이스에 2D ("모든 조각 (2D)") 또는 3D ("전체 볼륨 (3D)") 모든 조각에 적용할 수 있습니다. 모든 조각 (2D) 것이 좋습니다.
의미와 향후 방향
효율적이 고 정확한 세분화 장기 세션 동안 이미지 데이터의 테라 바이트의 일상적인 자동된 수집으로 특히의 3D 데이터 집합 처리에 다음 병목 이다. SuRVoS 워크 벤치는 수동 세분화에 비해 5 배 세분화 과정을 속도 수 있습니다. 또한, 경계는 supervoxels에 의해 구분 된, 있기 때문에 결과 세그먼트의 다양성 개선 한다. 미래에 높은 신뢰와 볼륨, 또는 심지어 별도 볼륨의 나머지에 적용할 훈련 데이터의 대표적인 3D 영역의 세분화를 사용 하는 방법을 탐구 하겠습니다. 이 사전 추가 사용자 시간과 세그먼트도 복잡 한 생물 학적 볼륨, 이미지 세분화 및 처리 병목 현상을 완화 하는 데 필요한 입력의 양을 줄일 것 이다. 이, 차례로, 강력한 실험 번호와 다양 한 상태 (예: 비-질병, 질병, 치료)에 생물학 데이터의 양적 비교를 허용할 것 이다.
저자 들은 아무 경쟁 금융 관심사 선언 합니다.
우리는 인정 하 고 루이 왕와 베일 러 대학의과 대학에서 제공 하는 cryoET 데이터 집합에 대 한 Wah 애기와 다이아몬드 광원에서 앤드류 Bodey I13 beamtime 지원 감사 하 고 싶습니다. 이 연구의 부분 했다 국립 보건원 (NIH) 부여 제 (P41GM103832) 다이아몬드 광원 인정 박사 STU0079 아래 Imanol Luengo 공동 자금에 지원 됩니다.
Name | Company | Catalog Number | Comments |
computer | n/a | n/a | Must be running Linux operating system and have an NVidia GPU with at least 4 GB of memory |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유