로그인

JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

간 동맥 치료법은 외과 절제술을 받을 수 없는 간세포 암 환자에 대 한 치료의 표준 이다. 이러한 치료에 대 한 응답을 예측 하는 방법을 제안 했다. 기술은 기계 학습 모델 처리 이전 응답을 예측할 수 있는 훈련 사전 절차 임상, 통계, 및 이미징 정보를 사용 합니다.

초록

간 동맥 치료법은 외과 절제술을 받을 수 없는 간세포 암 환자에 대 한 치료의 표준 이다. 이 연구의 목적은 개입 이전 내부 동맥 치료에 응답을 예측 하는 방법을 개발 했다.

메서드를 내부 동맥 치료 사전 결과 예측을 위한 일반 프레임 워크를 제공 합니다. 그것은 환자의 코 호트에서 임상, 인구 통계 및 이미징 데이터를 풀링 및 기계 학습 모델의 학습에 이러한 데이터를 사용 하 여 포함. 학습 된 모델은 내부 동맥 치료에 응답을의 그들의 가능성을 예측 하기 위해 새로운 환자에 적용 됩니다.

메서드 인수 및 N 이미 트랜스 동맥 치료 받은 환자에서 임상, 인구 통계 및 이미지 데이터의 구문 분석을 수반 한다. 이러한 데이터 (연령, 성별, 간 경 변, 종양 증진, 의) 개별 기능으로 구문 분석 되며 true/false 값 (예: 60, 남성 성, 종양 향상 설정된 임계값, 이상의 나이)에 binarized. 낮은-분산 기능 및 결과 낮은 일변량 연결 기능 제거 됩니다. 각 치료 환자 여부 그들은 반응 또는 치료에 반응 하지 않았다 표시 됩니다. 각 훈련 환자 따라서 바이너리 기능과 결과 레이블 집합으로 표시 됩니다. 기계 학습 모델 사용 하 여 N -1 환자 왼쪽 아웃 환자에 대 한 테스트와 훈련을 합니다. 이 프로세스는 각 N 환자에 대해 반복 됩니다. N 모델 최종 모델에 도달 하기 위해 평균 된다.

기술을 확장 하 고 나중에 추가 기능 포함을 수 있습니다. 그것은 또한 외부 중재 방사선과 임상 연구 질문에 적용 될 수 있습니다 받아들이기는 과정입니다. 주요 제한은 수동으로 각 환자에서 기능을 파생 하는 필요입니다. 깊은 라는 기계 학습의 인기 있는 현대적인 형태가이 제한에서 고통을 하지 않습니다 학습 하지만 큰 데이터 집합을 요구 한다.

서문

외과 후보자는 간세포 암 종 환자는 간 동맥 치료1,2,3제공 됩니다. 치료 관리 하기 전에 환자가 간 동맥 치료에 응답 합니다 여부를 결정 하는 없는 단일 통계가입니다. 이 연구의 목적은 기계 학습에서 메서드를 적용 하 여 치료 반응을 예측 하는 방법을 설명 했다. 이러한 모델 치료 진행 여부를 선택할 때 실무자와 환자에 게 지침을 제공 합니다.

프로토콜 훈련과 주 환자 데이터 (임상 노트, 인구 통계, 실험실 데이터 및 이미징)에서 시작 하는 모델 업데이트에 대 한 재현 과정을 수반 한다. 이진 기능 집합 및 이진 결과 대상 레이블을 나타내는 각 환자와 데이터는 특정 기능에 대 한 구문 분석 됩니다 처음. 결과 레이블 설립된 영상 기반 응답 기준 간세포 치료4,5,,67에 대 한 사용 하 여 결정 됩니다. 기능 및 대상 레이블 기계 학습 소프트웨어를 배우는 기능 및 특정 학습 모델 (로지스틱 회귀 또는 무작위 숲)8,,910아래 결과 간의 매핑을 전달 됩니다. 비슷한 기술은 방사선학과 암 진단 및 치료 예측11,,1213에 대 한 연구의 다른 영역에 적용 되었습니다.

메서드를 사용 하면 중재 방사선과 분야 컴퓨터 과학에서 기술을 적응. 중재 방사선학 그리고 의학에서 전통적인 의미 연구는 일반적으로 모노 또는 올리고 기능 분석에 의존. 예를 들어 말기 간 질병에 대 한 모델 간 질환의 정도 평가 하기 위해 5 임상 통계를 포함 합니다. 제안된 된 방법의 장점은 자유롭게; 기능을 추가 하는 기능입니다. 20-5 기능 예제 분석에서 고려 됩니다. 추가 기능을 추가할 수 있습니다 원하는대로.

기술 사전 및 사후 개입 이미징 데이터를 사용할 수 있는 다른 방사선 중재에 적용 될 수 있습니다. 예를 들어 결과 경 피 적인 치료를 다음과 비슷한 방식으로 예언 될 수 있습니다. 연구의 주요 한계는 필요는 수동 보좌 기능을 모델에 포함. 데이터 큐레이터 및 기능 추출 실천에 대 한 시간이 많이 걸리는 이며 이러한 기계 학습 모델의 임상 도입을 방해 수 있습니다.

프로토콜

1입니다. 기계 학습에 대 한 워크스테이션 설치

  1. 시스템을 사용 하 여 다음:
    인텔 코어 2 듀오 또는 높은 CPU 2.0 g h z에서
    4GB 또는 더 많은 시스템 메모리
    POSIX 호환 운영 체제 (리눅스 또는 맥 OS) 또는 마이크로소프트 윈도 즈 7
    프로그램을 실행 하 고 파일 저장에 대 한 사용자 권한
  2. 다음 도구를 설치:
    아나콘다 Python3: https://www.anaconda.com/download
    DICOM NIfTI 변환기 (dcm2niix)-https://github.com/rordenlab/dcm2niix
    숭 고 한 텍스트 편집기: https://www.sublimetext.com/
    itk-스냅 (선택 사항): http://www.itksnap.org
    1. 아나콘다 Python3, dcm2nii 및 숭 고 한 텍스트를 설치, 운영 체제 설치 단계에 대 한 그들의 각각의 웹사이트를 방문 하십시오.
    2. 만들고 아나콘다 환경 활성화 합니다.
      conda 만들-이름 mlenv
      conda 활성화 mlenv
    3. 기계 학습에 대 한 아나콘다 패키지를 설치 합니다.
      conda 설치 numpy scipy scikit-nltk nibabel를 배울
      참고: nltk 패키지는 nibabel 패키지 의료 이미지 조작에 대 한 유용한 기능을 제공 하는 반면 일반 텍스트 임상 노트를 구문 분석 하는 데 유용. itk 스냅 기관과 의료 이미지에서 종양을 세그먼트에 대 한 설치할 수 있습니다. 그것은 특정 지역에 제한 기능에 대 한 유용 합니다.

2입니다. 일반 텍스트 임상 노트와 구조화 된 임상 데이터에서 추출 기능

  1. 프로젝트에 대 한 부모 디렉터리를 만들고 부모 폴더 내의 각 환자에 대 한 폴더를 만듭니다. 디렉터리 구조를 유사 합니다.
    프로젝트 /
    프로젝트/Patient_1 /
    프로젝트/Patient_2 /
    프로젝트/Patient_3 /
    ...
  2. 임상 노트를 전자 의료 기록 (EMR)에서 일반 텍스트를 가져옵니다. 검색 노트 EMR을 통해 수동으로 또는 데이터 덤프를 통해 병원 정보 기술 (IT) 사무실에 의하여. 해당 폴더에서 각 환자의 노트를 저장 합니다.
    Project/Patient_1/History_and_Physical.txt
    Project/Patient_1/Procedure_Note.txt
    1. 임상 기능을 모델에 포함 하기로 했다. 이러한 기능에 대 한 일반 텍스트 클리닉 노트를 구문 분석 합니다. Python 자연 언어 툴키트 (nltk) 라이브러리 문서를 문장으로 분할에 대 한 유용한 명령을 제공 합니다. 각 문장 황 달 같은 적절 한 용어에 대 한 검색 될 수 있습니다. 줄 당 하나의 기능 파일에 각 환자의 기능을 저장 합니다.
      Project/Patient_1/Features.txt:
      나이 67
      섹스 남성
      알 부 민 3.1
      cirrhotic 없음
      hepatitis_c 아무
      ...
    2. 이진이 아닌 기능에 대 한 모든 환자에서 각 기능의 중앙값을 가져가 라. 중간 값에 따라 true(1) 또는 false(0) 값으로 각 기능을 binarize.
      Project/Patient_1/Binary_Features.txt:
      age_over_60 0
      male_sex 1
      albumin_less_than_3.5 1
      presence_of_cirrhosis 0
      hepatitis_c 0
      ...

3입니다. 의료 이미지에서 특징 추출

참고: 3 단계 코드 예제에 대 한 보충 자료를 참조 하십시오.

  1. 병원 PACS에서에서 사전 및 사후 치료 자기 공명 DICOM 이미지를 다운로드 합니다. 해당 환자 폴더에 이미지를 저장 합니다.
    프로젝트 /
    Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm
    Project/Patient_1/Pre_TACE_MRI_Arterial.dcm
    Project/Patient_1/Post_TACE_MRI_Pre-Constrast.dcm
    Project/Patient_1/Post_TACE_MRI_Arterial.dcm
  2. Dcm2niix 프로그램을 사용 하 여 NIfTI 형식으로 DICOM 이미지를 변환 합니다. 다음 명령은 지정 된 폴더에 모든.dcm 이미지 변환 합니다. 모든 환자에 대해 반복 합니다.
    dcm2niix 프로젝트/Patient_1 /
    dcm2niix 프로젝트/Patient_2 /
  3. 파이썬에 각 NIfTI 파일을 로드 합니다.
    가져오기 nibabel
    이미지 = nibabel.load('Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm')
    1. 각 이미지의 방향을 정식화합니다 이렇게 하면 x, y 및 z 축 이미지를 획득 하는 데 사용 하는 컴퓨터에 관계 없이 동일 하.
      cImage = nibabel.as_closest_canonical(image)
  4. 사용 하 여 각 이미지에 대 한 이진 간 및 종양 마스크 세그먼트 itk 스냅 (또는 해당 소프트웨어 패키지).
    Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Liver_Mask.bin
    Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Tumor_Mask.bin
  5. 파이썬에 간 및 종양 마스크를 읽기. 아래 코드에는 미스터 이미지로 같은 정식 축 따라 마스크의 방향을 위하여 방향 문제를 해결 하는 방법을 보여 줍니다.
    np으로 numpy 가져오기
    f:로 오픈 (liver_mask_file, 'rb')와 함께
    liver_mask = f.read()
    liver_mask = np.fromstring (liver_mask, dtype 'uint8' =)
    liver_mask = np.reshape (liver_mask, diff.shape, 순서 = 'F')
    liver_mask = liver_mask [:,::-1:]
    liver_mask [liver_mask > 0] = 1
    1. 간 및 종양 마스크를 사용 하 여 간 종양을 포함 하는 복을.
      간 = np.copy(cImage)
      간 [liver_mask < = 0] = 0
  6. 말 간 향상 기능을 계산 합니다.
    mean_liver_enhancement = mean(liver)
    1. 간 볼륨 기능을 계산 합니다.
      pixdim = cImage.header['pixdim']
      단위 = pre.header['xyzt_units']
      dx, dy, dz = pre_pixdim [1:4]
      liver_volume = length(liver) * dx * dx * dz
    2. (선택 사항) 원하는 대로 추가 기능을 계산 합니다.
  7. 이미지 기능 환자 관련 기능 파일을 업데이트 합니다.
    Project/Patient_1/Features.txt:
    나이 67
    섹스 남성
    알 부 민 3.1
    cirrhotic 없음
    hepatitis_c 아무
    pre_tace_mean_liver_enhancement 78
    pre_tace_liver_volume 10000
    1. 각 이미지 기능에 대 한 평균 값을 계산 하 고 단계 2.2.2에서 binarize.
      Project/Patient_1/Binary_Features.txt:
      age_over_60 0
      male_sex 1
      albumin_less_than_3.5 1
      presence_of_cirrhosis 0
      hepatitis_c 0
      pre_tace_mean_liver_enhancement 1
      pre_tace_liver_volume 0

4. 집계 및 감소 기능

참고: 4 단계 코드 예제에 대 한 보충 자료를 참조 하십시오.

  1. 환자는 y와 x 축에 기능 스프레드시트에 각 환자에 대 한 Binary_Features.txt 파일 결합.
    환자> 60 세남성 성알 부 민 < 3.5경 변 증의 존재C 형 간염 존재간 강화 > 50을 의미간 볼륨 > 20000
    10110010
    21110000
    30110100
    1. 마지막 열으로 qEASL 결과 응답 레이블을 추가 합니다.
      환자> 60 세남성 성알 부 민 < 3.5경 변 증의 존재C 형 간염 존재간 강화 > 50을 의미간 볼륨 > 20000qEASL 응답자
      101100101
      211100001
      301101000
    2. 스프레드시트 탭 구분 파일로 내보냅니다.
      Project/ML_Matrix.tsv:
      PatientAge > 60 남성 섹스 알 부 민 < 3.5 존재의 변 C 형 간염 존재 의미 간 향상 > 50 간 볼륨 > 20000 qEASL 응답자
      1 0 1 1 0 0 1 0 1
      2 1 1 1 0 0 0 0 1
      3 0 1 1 0 1 0 0 0
  2. 고려에서 낮은 분산 기능을 제거 합니다.
    np으로 numpy 가져오기
    sklearn.feature_selection에서 VarianceThreshold를 가져올

    # 이진 매트릭스에서 읽기.
    기능 =
    레이블 =
    i, L enumerate(sys.stdin)에서:
    만약 내가 = = 0
    계속
    n_fs_L = L.strip().split('\t')
    n_fs_L[1:-1]])에 _ features.append([float(_)
    labels.append(n_fs_L[-1])
    X = np.array(features)
    y = np.array(labels)

    # 응답자와 비 respnders의 20% 이상에서 나타나는 특징을 계산 합니다.
    모델 = VarianceThreshold (임계값 = 0.8 * (1-0.8))
    X_new = model.fit_transform (X, y)
    남성 섹스, 알 부 민 < 3.5, 간 경 변 및 간 볼륨 > 2000 기능 제거 되었습니다.
    환자> 60 세C 형 간염 존재간 강화 > 50을 의미qEASL 응답자
    10011
    21001
    30100
  3. 결과와 낮은 일변량-협회 기능을 제거 합니다. 4.2 전달 기능만을 필터링 합니다. 유지 ceil (로그2(N)) 기능, 여기서 N 은 숫자 환자. Ceil (로그2(3)) = 2.

    가져오기 수학
    sklearn.feature_selection에서 SelectKBest를 가져올
    sklearn.feature_selection에서 chi2를 가져올

    # 4.2.1에서 이진 매트릭스에서 읽기
    ...

    # 일변량 협회 최고 ceil(log2(N)) 기능을 계산 합니다.
    k = math.ceil(log2(length(y)))
    모델 = SelectKBest (chi2, k = k)
    X_new = model.fit_transform (X, y)

    남성 성 시대 > 60 기능 4.2.1에서 나머지 기능에서 제거 되었습니다.
환자C 형 간염 존재간 강화 > 50을 의미qEASL 응답자
1011
2001
3100

5입니다. 모델 학습 및 테스트

5 단계 코드 예제에 대 한 보충 자료를 참조

  1. 4.3에서 바이너리 기능 매트릭스를 사용 하 여 로지스틱 회귀 모델 기차.
    가져오기 수학
    sklearn.linear_model에서 LogisticRegression를 가져올

    # 4.2와 4.3 이진 매트릭스에서 읽기.
    ...

    # 각 환자에 대 한 다른 모든 환자에 대 한 모델 기차.
    점수 0.0 =
    모델 =
    len(X)에 환자:
    # 기차는 환자 중 하나를 제외한 모든 모델.
    train_x = np.array ([i, enumerate(X)에 _ _ if i! 환자 =])
    train_y = np.array ([i, enumerate(y)에 _ _ if i! 환자 =])
    모델 = LogisticRegression(C=1e15)
    model.fit (train_x, train_y)

    # 왼쪽 아웃 환자에 테스트 합니다.
    y_prediction = model.predict(X[patient])
    경우 y_prediction = y [환자]:
    점수 = 1
    models.append(model)
  2. 4.2.2에서 바이너리 기능 매트릭스를 사용 하 여 임의의 포리스트 모델 기차. 단계는 5.2.1, 동일 제외 하 고 다음과 같이 모델 인스턴스를 업데이트 해야 합니다.
    sklearn.ensemble에서 RandomForestClassifier를 가져올
    ...
    모델 = RandomForestClassifier(n_estimators=100)
    ...
  3. 점수 인쇄 / 5.1 및 5.2 len (X). 이 각각 모든 로지스틱 회귀 모델의 모든 무작위 숲 모델 평균 정확도를 나타냅니다. 모든 N 모델 예측 결과으로 평균 분류와 함께 새로운 환자에 적용 되어야 합니다.

결과

제안된 된 방법 간세포 암에 대 한 트랜스-동맥 치료 했다 받은 36 환자에 적용 되었습니다. 20-5 기능 확인 하 고 1-5 단계를 사용 하 여 binarized. 5 기능 분산 및 변량 협회 필터 (5.1 및 5.2 단계 참조)을 만족 하 고 모델 학습에 사용 했다. 각 환자는 응답자 또는 qEASL 응답 조건에서 비 응답으로 분류 됐다. 동안 대상 레이블 벡터 36 x 1 기능 매트릭스는 이렇게 36 x 5 배열 이었다.

토론

수술 절제에 대 한 후보는 간세포 암 종 환자는 간 동맥 치료 제공 됩니다. 환자 응답 합니다 확인 하려면 존재 하는 몇 가지 방법-치료. 치료 후 평가 기법 종양 크기 또는 종양 대비 통풍 관의 변화에 의존. 이러한 응답 기준 가장 정확한 되 고 간 (qEASL) 기준의 연구에 대 한 양적 유럽 협회 라고 합니다. qEASL 모두 체적 변화와 향상 다음 응답의 가능성을 예측 하는 치료에 의존 합니다. QEASL...

공개

A.A.는 소프트웨어 상담으로 건강 충실도, Inc. 임상 노트 의료 급여를 최적화 하기 위한 기법을 학습 하는 유사한 기계를 사용 하 여 작동 합니다.

J.F.G.는 Guerbet 의료, BTG, 임계값 제약 (샌 프란 시스 코, 캘리포니아), 보스턴, 과학과 Terumo (엘크 튼, 메릴랜드);에서 개인 요금을 받습니다. 그리고 예 지 연구소 (Westport, 코네티컷)에 대 한 유료 컨설팅을 했다.

다른 작가 상충을 확인 했습니다.

감사의 말

A.A. 학생 연구의 사무실, Yale의과 대학에서 자금 지원을 받았다.

L.J.S.는 건강의 국가 학회 (NIH/NCI R01CA206180), Leopoldina 박사 친목, 그리고 방사선 과학 (아 헨, 독일)의 롤프 W. Guenther 재단에서 보조금을 받습니다.

제 과학 연구 및 개발 (예루살렘, 이스라엘, Neuherberg, 독일);에서 건강의 국가 학회 (NIH/NCI R01CA206180), 필립스 헬스케어, 그리고 독일-이스라엘 재단 보조금을 받습니다. 그리고 방사선 과학과 Charite 베를린 연구소의 건강 임상 과학자 프로그램 (베를린, 독일)의 롤프 W. Guenther 재단에서 장학금.

J.S.D.와 메이저 리그에서 건강의 국가 학회 (NIH/NCI R01CA206180) 및 (최고, 네덜란드) 필립스 의료 보조금을 받을 수 있습니다.

J.F.G.는 건강의 국가 학회 (NIH/NCI R01CA206180), 필립스 헬스케어, BTG (런던, 영국), 보스턴 과학 (말보로, 매사 추세 츠), 및 Guerbet 의료 (빌팽, 프랑스)에서 보조금을 받습니다.

자료

NameCompanyCatalog NumberComments
Computer workstationN/AN/AIntel Core 2 Duo or higher CPU at 2.0 GHz; 4 GB or more system memory; POSIX-compliant operating system (Linux or Mac OS) or Microsoft Windows 7; User permissions for executing programs and saving files
Anaconda Python 3Anaconda, Inc.Version 3.6Python 3 system and libraries packaged for scientists and researchers
DICOM to NIfTINeuroImaging Tools & Resources CollaboratoryVersion 1.0 (4/4/2018 release)Standalone program for converting DICOM imaging files to NIfTI format
Sublime Text EditorSublime HQ Pty LtdVersion 3 (Build 3143)Text-editor for writing Python code
Required Python LibrariesN/AVersion 3.2.25 (nltk)
Version 0.19.1 (scikit-learn)
Natural Language Toolkit (nltk)
Scikit-learn
ITK-SNAPN/AVersion 3.6.0Optional toolkit for performing segmentation of organ systems in medical images.

참고문헌

  1. Benson, A., et al. NCCN clinical practice guidelines in oncology: hepatobiliary cancers. J National Comprehensive Cancer Network. 7 (4), 350-391 (2009).
  2. Siegel, R., Miller, K., Jemal, A. Cancer statistics, 2016. CA Cancer J Clin. 66 (1), 7-30 (2016).
  3. Bruix, J., et al. Clinical management of hepatocellular carcinoma. Conclusions of the Barcelona-2000 European Association for the Study of the Liver conference. Journal of Hepatology. 35 (3), 421-430 (2001).
  4. Eisenhauer, E., et al. New response evaluation criteria in solid tumours: revised RECIST guideline (version 1.1). European Journal of Cancer. 45 (2), 228-247 (2009).
  5. Gillmore, R., et al. EASL and mRECIST responses are independent prognostic factors for survival in hepatocellular cancer patients treated with transarterial embolization. Journal of Hepatology. 55 (6), 1309-1316 (2011).
  6. Lin, M., et al. Quantitative and volumetric European Association for the Study of the Liver and Response Evaluation Criteria in Solid Tumors measurements: feasibility of a semiautomated software method to assess tumor response after transcatheter arterial chemoembolization. Journal of Vascular and Interventional Radiology. 23 (12), 1629-1637 (2012).
  7. Tacher, V., et al. Comparison of Existing Response Criteria in Patients with Hepatocellular Carcinoma Treated with Transarterial Chemoembolization Using a 3D Quantitative Approach. Radiology. 278 (1), 275-284 (2016).
  8. Pedregosa, F., et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 12, 2825-2830 (2011).
  9. Bishop, C. . Pattern recognition and machine learning. , 738 (2006).
  10. Alpaydin, E. . Introduction to machine learning. Third edition. , 613 (2014).
  11. Kim, S., Cho, K., Oh, S. Development of machine learning models for diagnosis of glaucoma. PLoS One. 12 (5), (2017).
  12. Son, Y., Kim, H., Kim, E., Choi, S., Lee, S. Application of support vector machine for prediction of medication adherence in heart failure patients. Healthcare Informatics Research. 16 (4), 253-259 (2010).
  13. Wang, S., Summers, R. Machine learning and radiology. Medical Image Analysis. 16 (5), 933-951 (2012).
  14. Abajian, A., et al. Predicting Treatment Response to Intra-arterial Therapies for Hepatocellular Carcinoma with the Use of Supervised Machine Learning-An Artificial Intelligence Concept. Journal of Vascular and Interventional Radiology. , (2018).

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

140chemoembolization

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유