Predicción de respuesta al tratamiento tratamientos guiados por imágenes mediante aprendizaje automático: un ejemplo para el Trans-Arterial tratamiento de Carcinoma Hepatocelular

Aaron Abajian; Nikitha Murali; Lynn Jeanette Savic; Fabian Max Laage-Gaupp; Nariman Nezami; James S. Duncan; Todd Schlachter; MingDe Lin; Jean-François Geschwind; Julius Chapiro

doi:10.3791/58382

Autores

Contáctenos

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

Resumen

Tratamientos Intraarteriales son el estándar del cuidado para los pacientes con carcinoma hepatocelular que no pueden someterse a resección quirúrgica. Se propone un método para predecir la respuesta a estas terapias. La técnica utiliza información clínica, demográfica y proyección de imagen previas al procedimiento para entrenar modelos de aprendizaje de máquina capaces de predecir la respuesta antes del tratamiento.

Resumen

Tratamientos Intraarteriales son el estándar del cuidado para los pacientes con carcinoma hepatocelular que no pueden someterse a resección quirúrgica. El objetivo de este estudio fue desarrollar un método para predecir la respuesta al tratamiento intraarterial antes de la intervención.

El método proporciona un marco general para la predicción de los resultados antes de la terapia intrarterial. Se trata de agrupación de datos clínicos, demográficos y proyección de imagen a través de una cohorte de pacientes y utilizar estos datos para un modelo de aprendizaje de máquina del tren. El modelo de formación se aplica a nuevos pacientes para predecir su probabilidad de respuesta a la terapia intrarterial.

El método consiste en la adquisición y análisis de datos clínicos, demográficos e N pacientes que ya han experimentado terapias trans-arterial. Estos datos se analiza en discretas características (edad, sexo, cirrosis, grado de tumor mejora, etc.) y binarizados en valores verdadero/falso (p. ej., edad de 60, género masculino, realce del tumor más allá de un umbral fijado, etc.). Se eliminan características de varianza baja y características con asociaciones univariable baja con el resultado. Cada paciente tratado se etiqueta según si respondió o no respondió al tratamiento. Así, cada paciente formación está representado por un conjunto de características binarias y una etiqueta de resultado. Modelos de aprendizaje de máquina son entrenados utilizando N - 1 pacientes con pruebas en el paciente de la izquierda-hacia fuera. Este proceso se repite para cada uno de los N pacientes. Los modelos de N se calcula el promedio para llegar a un modelo final.

La técnica es extensible y permite la inclusión de características adicionales en el futuro. Es también un proceso generalizable que puede aplicarse a preguntas de la investigación clínica fuera de radiología intervencionista. La principal limitación es la necesidad de derivar características manualmente de cada paciente. Una forma moderna popular de aprendizaje automático llamado profundo aprendizaje no sufren de esta limitación, pero requiere más grandes conjuntos de datos.

Introducción

Pacientes con carcinoma hepatocelular que no son candidatos a cirugía se ofrecen terapias intra arterial¹^,²^,³. No hay ninguna métrica única que determina si un paciente responderá a una terapia intra arterial antes de administra el tratamiento. El objetivo de este estudio fue demostrar un método que predice respuesta al tratamiento mediante la aplicación de métodos de aprendizaje automático. Tales modelos orientar a profesionales y pacientes al elegir si continuar con un tratamiento.

El protocolo implica un proceso reproducible para la capacitación y actualización de un modelo a partir de datos primarios del paciente (notas clínicas, datos demográficos, datos de laboratorio y proyección de imagen). Los datos se analizan inicialmente para características específicas, con cada paciente representado por un conjunto de características binarias y una etiqueta de destino de resultados binarios. La etiqueta de resultado se determina mediante un criterio de respuesta establecidos basados en la proyección de imagen para hepatocelular terapia⁴^,⁵^,⁶^,⁷. Las características y las etiquetas meta se pasan al software de aprendizaje de máquina que aprende la correlación entre las características y los resultados bajo un específico modelo (regresión logística o bosque aleatorio)⁸^,⁹^,¹⁰de aprendizaje. Técnicas similares se han aplicado en radiología y en otras áreas de investigación del cáncer para el diagnóstico y tratamiento predicción¹¹^,¹²^,¹³.

El método adapta a las técnicas de la informática al campo de la radiología intervencionista. Estudios de tradicional importancia en radiología intervencionista y medicina en general, se basan en análisis de mono-oligo-función o. Por ejemplo, el modelo para la enfermedad de hígado fase final incorpora cinco parámetros clínicos para evaluar el grado de enfermedad hepática. La ventaja del método propuesto es la posibilidad de añadir características liberalmente; 25 características se consideran en el análisis del ejemplo. Las características adicionales pueden agregarse como deseado.

La técnica puede aplicarse a otras intervenciones radiográficas que disponen de datos de imágenes pre y post intervención. Por ejemplo, los resultados después de tratamientos percutáneos podrían predecirse de manera similar. La principal limitación del estudio es la necesidad de características de cura manual para su inclusión en el modelo. Extracción de conservación y función de los datos es desperdiciador de tiempo para el médico y puede impedir la adopción clínica de tal modelos de aprendizaje de máquina.

Access restricted. Please log in or start a trial to view this content.

Protocolo

1. Instalación de estación de trabajo para el aprender de máquina

Utilice un sistema con lo siguiente:
Intel Core 2 Duo CPU o superior a 2,0 GHz
4 GB o más memoria del sistema
Sistema operativo compatible con POSIX (Linux o Mac OS) o Microsoft Windows 7
Permisos de usuario para ejecutar programas y guardar los archivos
Instalar las siguientes herramientas:
Anaconda Python3: https://www.anaconda.com/download
DICOM a NIfTI convertidor (dcm2niix) - https://github.com/rordenlab/dcm2niix
Sublime Text Editor: https://www.sublimetext.com/
ITK-SNAP (opcional): http://www.itksnap.org
1. Instalar Anaconda Python3, dcm2nii y Sublime Text, visite su sitios web para pasos de instalación específicos de sistema operativo.
2. Crear y activar un entorno de Anaconda.
  crear Conda - nombre mlenv
  CONDA activar mlenv
3. Instalar paquetes de Anaconda del aprender de máquina.
  CONDA instalar numpy scipy scikit-aprender nltk nibabel
  Nota: El paquete nltk es útil para el análisis de notas clínicas de texto plano, mientras que el paquete de nibabel proporciona funciones útiles para la manipulación de la imagen médica. ITK-SNAP puede ser instalado para la segmentación de los órganos y los tumores de imágenes médicas. Es útil para las funciones de restricción a regiones específicas.

2. Extracción de la característica de texto notas clínicas y datos clínicos estructurados

Crear un directorio para el proyecto y cree una carpeta para cada paciente dentro de la carpeta principal. Debería parecerse la estructura de directorios:
Proyecto /
Proyecto/Patient_1 /
Proyecto/Patient_2 /
Proyecto/Patient_3 /
...
Obtener texto plano notas clínicas del registro médico electrónico (EMR). Recuperar notas manualmente a través de la EMR o por medio de la oficina de tecnologías de la información hospital mediante un volcado de datos. Guarde notas de cada paciente en sus respectivas carpetas.
Project/Patient_1/History_and_Physical.txt
Project/Patient_1/Procedure_Note.txt
1. Decidió que las características clínicas a incluir en el modelo. Analizar las notas de la clínica de texto de estas características. La biblioteca de Python Natural Language Toolkit (nltk) proporciona comandos útiles para dividir documentos en oraciones. Cada frase puede buscarse términos apropiados como ictericia. Almacenar las características de cada paciente en un archivo con una de las características por línea.
  Project/Patient_1/Features.txt:
  67 años
  hombre sexo
  albúmina 3.1
  no cirrótico
  hepatitis_c no
  ...
2. Para funciones no-binaria, tomar el valor medio de cada característica a través de todos los pacientes. Binarize cada función como un valor true(1) o false(0) basado en el valor mediano.
  Project/Patient_1/Binary_Features.txt:
  age_over_60 0
  male_sex 1
  albumin_less_than_3.5 1
  presence_of_cirrhosis 0
  hepatitis_c 0
  ...

6 K Extracción de la característica de imágenes médicas

Nota: Ver paso 3 materiales suplementarios para ejemplos de código.

Descargar imágenes DICOM de pre y post terapia de resonancia magnética del hospital PACS. Almacenar imágenes en las carpetas correspondientes del paciente.
Proyecto /
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm
Project/Patient_1/Pre_TACE_MRI_Arterial.dcm
Project/Patient_1/Post_TACE_MRI_Pre-Constrast.dcm
Project/Patient_1/Post_TACE_MRI_Arterial.dcm
Convertir imágenes DICOM NIfTI formato usando el programa dcm2niix. Los siguientes comandos convierte .dcm todas las imágenes en la carpeta especificada. Repita para todos los pacientes.
Proyecto de dcm2niix/Patient_1 /
Proyecto de dcm2niix/Patient_2 /
Cargar cada archivo NIfTI en Python.
importación nibabel
imagen = nibabel.load('Project/Patient_1/Pre_TACE_MRI_Pre-Contrast.dcm')
1. Canoniza la orientación de cada imagen. Esto asegura que la x, y y z ejes son idénticas, independientemente de la máquina utilizada para la adquisición de las imágenes.
  cImage = nibabel.as_closest_canonical(image)
Utilice itk-SNAP (o un paquete de software equivalente) para segmento binario hígado y tumor máscaras para cada imagen.
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Liver_Mask.bin
Project/Patient_1/Pre_TACE_MRI_Pre-Contrast_Tumor_Mask.bin
Leer las máscaras de hígado y tumor en Python. El código siguiente muestra cómo corregir los problemas de orientación con el fin de orientar las máscaras a lo largo de los mismos ejes canónicos como las imágenes del Señor.
numpy importación como np
con open (liver_mask_file, 'rb') como f:
liver_mask = f.read()
liver_mask = np.fromstring (liver_mask, dtype = 'uint8')
liver_mask = np.reshape (liver_mask, diff.shape, order = 'F')
liver_mask = liver_mask [:,:: -1:]
liver_mask [liver_mask > 0] = 1
1. Use las máscaras de hígado y tumor para aislar vóxeles que contiene hígado y tumor.
  hígado = np.copy(cImage)
  hígado [liver_mask < = 0] = 0
Calcular la función de mejoramiento hepática media.
mean_liver_enhancement = mean(liver)
1. Calcular la función de volumen hepático.
  pixdim = cImage.header['pixdim']
  unidades = pre.header['xyzt_units']
  DX, dy, dz = pre_pixdim [1:4]
  liver_volume = length(liver) * dx * dx * dz
2. (Opcional) Calcular las características adicionales como desee.
Archivo de actualización de las funciones específicas de la paciente con las características de la imagen.
Project/Patient_1/Features.txt:
67 años
hombre sexo
albúmina 3.1
no cirrótico
hepatitis_c no
pre_tace_mean_liver_enhancement 78
pre_tace_liver_volume 10000
1. Calcular los valores promedio para cada función de proyección de imagen y binarize como en el paso 2.2.2.
  Project/Patient_1/Binary_Features.txt:
  age_over_60 0
  male_sex 1
  albumin_less_than_3.5 1
  presence_of_cirrhosis 0
  hepatitis_c 0
  pre_tace_mean_liver_enhancement 1
  pre_tace_liver_volume 0

4. cuentan con agregación y reducción

Nota: Ver paso 4 materiales suplementarios para ejemplos de código.

Combinar los archivos de Binary_Features.txt para cada paciente en una hoja de cálculo con pacientes en el eje y y en el eje x.
Paciente Edad > 60 Sexo masculino Albúmina 3.5 < Presencia de cirrosis La hepatitis C presente significa mejora hígado > 50 volumen hepático > 20000
1 0 1 1 0 0 1 0
2 1 1 1 0 0 0 0
3 0 1 1 0 1 0 0
1. Agregar etiquetas de respuesta de resultado de qEASL como la última columna.
  Paciente Edad > 60 Sexo masculino Albúmina 3.5 < Presencia de cirrosis La hepatitis C presente significa mejora hígado > 50 volumen hepático > 20000 qEASL Responder
  1 0 1 1 0 0 1 0 1
  2 1 1 1 0 0 0 0 1
  3 0 1 1 0 1 0 0 0
2. Exportar la hoja de cálculo como un archivo delimitado por tabuladores.
  Project/ML_Matrix.tsv:
  PatientAge > 60 albúmina sexo masculino < 3.5 presencia de cirrosis Hepatitis C presente mejora hígado media > 50 volumen hepático > 20000 qEASL respondedor
  1 0 1 1 0 0 1 0 1
  2 1 1 1 0 0 0 0 1
  3 0 1 1 0 1 0 0 0
Quitar funciones de varianza baja de consideración.
numpy importación como np
de importación sklearn.feature_selection VarianceThreshold

# Lea en la matriz binaria.
características =]
etiquetas =]
para i, L en enumerate(sys.stdin):
Si yo == 0
continuar
n_fs_L = L.strip().split('\t')
Features.Append([Float(_) _ en n_fs_L[1:-1]])
Labels.Append(n_fs_L[-1])
X = np.array(features)
y = np.array(labels)

# Calcular características que aparecen en al menos el 20% de respondedores y no respnders.
modelo = VarianceThreshold (umbral = 0.8 * (1 - 0.8))
X_new = model.fit_transform (X, y)
El sexo masculino, albúmina < 3.5, presencia de cirrosis y volumen hepático > 2000 se han quitado.
Paciente Edad > 60 La hepatitis C presente significa mejora hígado > 50 qEASL Responder
1 0 0 1 1
2 1 0 0 1
3 0 1 0 0
Quitar características con baja asociación univariable con el resultado. Filtrar sólo aquellas características que 4.2. Conservan características (log₂(N)), donde N es el número pacientes de ceil. Ceil (Log₂(3)) = 2.

importación matemáticas
de importación sklearn.feature_selection SelectKBest
de sklearn.feature_selection importación de chi2

# Leer en la matriz binaria como en 4.2.1
...

# Calcular características principales ceil(log2(N)) por asociación univariable.
k = math.ceil(log2(length(y)))
modelo = SelectKBest (chi2, k = k)
X_new = model.fit_transform (X, y)

La función de > 60 de edad de sexo masculino se ha eliminado de las restantes características de 4.2.1.

Paciente	La hepatitis C presente	significa mejora hígado > 50	qEASL Responder
1	0	1	1
2	0	0	1
3	1	0	0

5. Modelo de formación y pruebas

Ver paso 5 materiales suplementarios para ejemplos de código

Formar un modelo de regresión logística utilizando la matriz de funciones binarias de 4.3.
importación matemáticas
de importación sklearn.linear_model LogisticRegression

# Lea en la matriz binaria como en 4.2 y 4.3.
...

# Para cada paciente, un modelo en el resto de los pacientes del tren.
puntuación = 0.0
modelos =]
para el paciente en len(X):
# Tren modelo en todos sino uno de los pacientes.
train_x = np.array ([_ i, _ en enumerate(X) if i! = paciente])
train_y = np.array ([_ i, _ en enumerate(y) if i! = paciente])
modelo = LogisticRegression(C=1e15)
Model.Fit (train_x, train_y)

# La prueba en el paciente de la izquierda-hacia fuera.
y_prediction = model.predict(X[patient])
Si y_prediction == y [paciente]:
resultado += 1
Models.Append(Model)
Un modelo de bosque aleatorio utilizando la matriz de funciones binarias de 4.2.2 del tren. Pasos son idénticos a 5.2.1, excepto la instanciación del modelo debe ser actualizada como sigue:
de importación sklearn.ensemble RandomForestClassifier
...
modelo = RandomForestClassifier(n_estimators=100)
...
Imprimir partitura / len (X) para 5.1 y 5.2. Esto representa la exactitud promedio de todos los modelos de regresión logística y todos los modelos al azar del bosque, respectivamente. Todos los modelos de N se deben aplicar a pacientes nuevos con la clasificación promedio como el resultado de la predicción

Access restricted. Please log in or start a trial to view this content.

Resultados

El método propuesto se aplicó a 36 pacientes que habían experimentado trans-arterial terapias para el carcinoma hepatocelular. Se identificaron veinticinco características y binarizada siguiendo los pasos del 1-5. Cinco características satisfacen la varianza y filtros de asociación univariante (vea los pasos 5.1 y 5.2) y fueron utilizados para entrenamiento de modelo. Cada paciente fue etiquetado como responder o no responder bajo los criterios de respuesta qEASL. La matriz de carac...

Access restricted. Please log in or start a trial to view this content.

Discusión

Pacientes con carcinoma hepatocelular que no son candidatos para la resección quirúrgica se ofrecen terapias intra arteriales. Existen pocos métodos para determinar si un paciente responderá pre-tratamiento. Técnicas de evaluación después del tratamiento se basan en cambios en el tamaño del tumor o captación de contraste del tumor. Son los llamados criterios de respuesta, siendo más precisa la cuantitativa Asociación Europea para el estudio del criterio del hígado (qEASL). qEASL se basa en ambos volu...

Access restricted. Please log in or start a trial to view this content.

Divulgaciones

A.A. funciona como una consulta de software salud fidelidad, Inc. que emplea la máquina similar aprendiendo técnicas en notas clínicas para la optimización de reembolso médico.

J.F.G. recibe honorarios de personales de salud de Guerbet, BTG, umbral Pharmaceuticals (San Francisco, California), Boston Scientific y Terumo (Elkton, Maryland); y tiene una consultoría pagada para los laboratorios de presciencia (Westport, Connecticut).

Ninguno de los otros autores han identificado un conflicto de intereses.

Agradecimientos

A.A. recibió apoyo financiero de la oficina de investigación del estudiante, escuela de medicina de Yale.

L.J.S. recibe subvenciones de los institutos nacionales de salud (NIH/NCI R01CA206180), Beca Postdoctoral de Leopoldina y la Rolf W. Guenther Foundation de Ciencias radiológicas (Aquisgrán, Alemania).

J.C. recibe subvenciones de los institutos nacionales de salud (NIH/NCI R01CA206180), Philips Healthcare y la Fundación israelo-alemana para la investigación científica y el desarrollo (Jerusalén, Israel y Neuherberg, Alemania); y becas de la Foundation de Guenther de Rolf W. de Ciencias radiológicas y la Charité Berlín Instituto programa de salud clínico científico (Berlín, Alemania).

J.S.D. y M.L. reciben subvenciones de los institutos nacionales de salud (NIH/NCI R01CA206180) y Philips Healthcare (Best, Holanda).

J.F.G. recibe subvenciones de los institutos nacionales de salud (NIH/NCI R01CA206180), Philips Healthcare, BTG (Londres, Reino Unido), Boston Scientific (Marlborough, Massachusetts) y Guerbet Healthcare (Villepinte, Francia)

Access restricted. Please log in or start a trial to view this content.

Materiales

Name	Company	Catalog Number	Comments
Computer workstation	N/A	N/A	Intel Core 2 Duo or higher CPU at 2.0 GHz; 4 GB or more system memory; POSIX-compliant operating system (Linux or Mac OS) or Microsoft Windows 7; User permissions for executing programs and saving files
Anaconda Python 3	Anaconda, Inc.	Version 3.6	Python 3 system and libraries packaged for scientists and researchers
DICOM to NIfTI	NeuroImaging Tools & Resources Collaboratory	Version 1.0 (4/4/2018 release)	Standalone program for converting DICOM imaging files to NIfTI format
Sublime Text Editor	Sublime HQ Pty Ltd	Version 3 (Build 3143)	Text-editor for writing Python code
Required Python Libraries	N/A	Version 3.2.25 (nltk) Version 0.19.1 (scikit-learn)	Natural Language Toolkit (nltk) Scikit-learn
ITK-SNAP	N/A	Version 3.6.0	Optional toolkit for performing segmentation of organ systems in medical images.

Referencias

Benson, A., et al. NCCN clinical practice guidelines in oncology: hepatobiliary cancers. J National Comprehensive Cancer Network. 7 (4), 350-391 (2009).
Siegel, R., Miller, K., Jemal, A. Cancer statistics, 2016. CA Cancer J Clin. 66 (1), 7-30 (2016).
Bruix, J., et al. Clinical management of hepatocellular carcinoma. Conclusions of the Barcelona-2000 European Association for the Study of the Liver conference. Journal of Hepatology. 35 (3), 421-430 (2001).
Eisenhauer, E., et al. New response evaluation criteria in solid tumours: revised RECIST guideline (version 1.1). European Journal of Cancer. 45 (2), 228-247 (2009).
Gillmore, R., et al. EASL and mRECIST responses are independent prognostic factors for survival in hepatocellular cancer patients treated with transarterial embolization. Journal of Hepatology. 55 (6), 1309-1316 (2011).
Lin, M., et al. Quantitative and volumetric European Association for the Study of the Liver and Response Evaluation Criteria in Solid Tumors measurements: feasibility of a semiautomated software method to assess tumor response after transcatheter arterial chemoembolization. Journal of Vascular and Interventional Radiology. 23 (12), 1629-1637 (2012).
Tacher, V., et al. Comparison of Existing Response Criteria in Patients with Hepatocellular Carcinoma Treated with Transarterial Chemoembolization Using a 3D Quantitative Approach. Radiology. 278 (1), 275-284 (2016).
Pedregosa, F., et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 12, 2825-2830 (2011).
Bishop, C. Pattern recognition and machine learning. , Springer. New York. 738(2006).
Alpaydin, E. Introduction to machine learning. Third edition. , The MIT Press. Cambridge, Massachusetts. 613(2014).
Kim, S., Cho, K., Oh, S. Development of machine learning models for diagnosis of glaucoma. PLoS One. 12 (5), (2017).
Son, Y., Kim, H., Kim, E., Choi, S., Lee, S. Application of support vector machine for prediction of medication adherence in heart failure patients. Healthcare Informatics Research. 16 (4), 253-259 (2010).
Wang, S., Summers, R. Machine learning and radiology. Medical Image Analysis. 16 (5), 933-951 (2012).
Abajian, A., et al. Predicting Treatment Response to Intra-arterial Therapies for Hepatocellular Carcinoma with the Use of Supervised Machine Learning-An Artificial Intelligence Concept. Journal of Vascular and Interventional Radiology. , (2018).

Access restricted. Please log in or start a trial to view this content.

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Medicina n mero 140 Machine learning inteligencia artificial radiolog a intervencionista carcinoma hepatocelular trans arterial chemoembolization supervis el aprender de m quina predictivo modelar predecir resultados procedimiento de la planificaci n

This article has been published

Video Coming Soon

Keep me updated:

Paciente	Edad > 60	Sexo masculino	Albúmina 3.5 <	Presencia de cirrosis	La hepatitis C presente	significa mejora hígado > 50	volumen hepático > 20000
1	0	1	1	0	0	1	0
2	1	1	1	0	0	0	0
3	0	1	1	0	1	0	0