Method Article
In this paper, an experimental framework to perform closed-loop experiments is presented, in which information processing (i.e., coding and decoding) and learning of neuronal assemblies are studied during the continuous interaction with a robotic body.
Information coding in the Central Nervous System (CNS) remains unexplored. There is mounting evidence that, even at a very low level, the representation of a given stimulus might be dependent on context and history. If this is actually the case, bi-directional interactions between the brain (or if need be a reduced model of it) and sensory-motor system can shed a light on how encoding and decoding of information is performed. Here an experimental system is introduced and described in which the activity of a neuronal element (i.e., a network of neurons extracted from embryonic mammalian hippocampi) is given context and used to control the movement of an artificial agent, while environmental information is fed back to the culture as a sequence of electrical stimuli. This architecture allows a quick selection of diverse encoding, decoding, and learning algorithms to test different hypotheses on the computational properties of neuronal networks.
Muchas de las características de la función cerebral son actualmente imposibles de reproducir en un sistema artificial. La capacidad del cerebro para procesar rápidamente la información sensorial compleja y generar, en respuesta, órdenes motoras precisas es por sí misma ya más allá del estado-de-la-arte actual. Pero su capacidad de adaptarse a las diferentes condiciones de aprender de la experiencia pasada hace tan inmensamente superior a los sistemas de control de humanos-desarrollado. Hasta ahora, los intentos de reproducir o explotar esta plasticidad se han reunido poco éxito, y la comprensión de los mecanismos internos del cerebro ha eludido al alcance de los investigadores. Uno de los temas principales durante la investigación de la relación entre el cerebro y el comportamiento es la incapacidad para acceder correctamente todas las variables del sistema: idealmente, un montaje experimental óptima sería permitir la grabación y la estimulación simultánea de un gran número de neuronas, la estabilidad a largo plazo , el seguimiento de sinapsis posiciones y pesos, y controlable bi-directional interacción con el medio ambiente. La dificultad en el seguimiento de todas esas variables simultáneamente llevó al estudio de la relación cerebro-comportamiento en dos escalas muy diferentes: ya sea con comportarse animales, sin control fino sobre las condiciones experimentales 1-7 o con partes pequeñas y aisladas, tales como porciones de tejido neuronal, sin visión de conjunto del sistema 8. En este último caso, si bien ninguna configuración experimental ideado permite el seguimiento completo de todos los parámetros que intervienen en el funcionamiento de incluso una simple red neuronal, una buena compensación es proporcionada por las neuronas disociadas crecido en microelectrodos Arrays (AMUMA) 9. Esos dispositivos, nacidos a finales de los 70 de 10, tienen varias ventajas sobre las técnicas de electrofisiología tradicionales: en primer lugar, la posibilidad de grabar y estimular una red neuronal en muchos lugares diferentes a la vez (por lo general 60 electrodos). Además, el acoplamiento de los AMA con células es casi no invasiva, Lo que permite la observación de la misma red durante largos períodos de tiempo, hasta varios meses 11. Los efectos fisiológicos de la estimulación eléctrica en cultivos disociados se han estudiado ampliamente gracias a esos dispositivos, revelando que muchas propiedades observadas a escalas mayores (tales como, por ejemplo, la plasticidad y la memoria de sencillos procesos 12-14) se conservan a pesar de la pérdida de la arquitectura. Durante el crecimiento del cultivo, las redes comienzan a mostrar la actividad espontánea en unos 7 días in vitro (DIV) 15,16. Actividad de la red tiende a cambiar radicalmente con un mayor crecimiento; primera como picos individuales se reúnen en ráfagas (hacia el final de la segunda semana) 17, más tarde a medida que cambia en un patrón altamente complejo de sincronizada, la red no periódica ráfagas 18, que representa el estado de madurez de una red. Se ha sugerido 19 que este comportamiento sincrónico, algo similar a la observada en el registro in vivoIngs en animales para dormir, es causada por la falta de información sensorial.
Un enfoque diferente trató de obtener una mejor comprensión de la información de codificación ha sido tomada por la realización de experimentos de circuito cerrado, en el que se utilizaron diferentes tipos de señales para controlar la estimulación de la propia 11,20-23 red neuronal. En estos experimentos, un agente externo capaz de interacción con el entorno se ha usado para generar la información sensorial se alimenta a la red neuronal, que, a su vez, produce los comandos de motor para un mecanismo efector. Esto permitió observaciones de cómo las propiedades dinámicas y adaptativas de los sistemas neuronales evolucionaron en respuesta a los cambios inducidos en el medio ambiente.
Una instalación para efectuar 'encarnaba neurofisiología "experimentos fue desarrollado, donde una plataforma con ruedas sensor (un robot físico o su modelo virtual) se mueve en una arena y sus perfiles de velocidad son determinados por la actividad de un neuronalsistema (es decir, una población de neuronas de rata en cultivo durante un MEA). El robot se caracteriza por los perfiles de velocidad de sus dos ruedas controladas de forma independiente y por las lecturas actuales de los sensores de distancia. La naturaleza exacta de los sensores de distancia no es relevante; pueden ser sensores ópticos o sensores de ultrasonido activa o pasiva. Es evidente que este problema no se aplica en el caso de los robots virtuales, en las que los sensores pueden ser diseñados con cualquier característica deseada.
En los experimentos descritos en el presente documento, el robot utilizado es siempre la aplicación virtual, con 6 sensores de distancia apuntando a 30 °, 60 ° y 90 ° desde el robot partida en ambas direcciones. La actividad de los tres sensores de izquierda y derecha se promedia y la actividad de la cultura biológica está impulsada por la información recogida por este tipo de 'super-sensors "(que se acaba de referir como sensores" correctas "en el resto de" izquierda "y de este trabajo). El protocol descrito en realidad puede ser aplicado a la robot físico con ajustes bastante menores. La información recogida por el robot (ya sea físico o virtual) se codifica en una serie de estímulos que se utilizan para manipular la actividad de la red neural biológica, que está separada físicamente por el robot. Los estímulos en sí son todos idénticos y por lo tanto no codifican ninguna información. Lo relevante es su frecuencia: aumentos de las tasas de estimulación cuando el robot se acerca a un obstáculo, con diferentes centros de prestación de codificación de la información sensorial de los 'ojos' de izquierda y derecha del robot. La red neuronal se presentan diferentes respuestas al tren entrante de estímulos: la tarea del algoritmo de decodificación es traducir la actividad de la red resultante en comandos utilizados para controlar las ruedas del robot. Dado un comportamiento de la red 'perfecto' (es decir, con el fiable y totalmente separado las respuestas a estímulos de diferentes electrodos), esto Result en el robot de conducción en su arena sin golpear ningún obstáculo. La mayoría de las redes presente un comportamiento muy diferentes de la idealidad, por lo tanto, se introduce un protocolo de aprendizaje sencilla: cuando se activa, la estimulación tetánica (breves períodos de estimulación de alta frecuencia, 20 Hz de estimulación durante 2 segundos, inspirado en los protocolos descritos en 24,25) después de un colisión con un obstáculo se entrega. Si los resultados de la estimulación tetánica en un refuerzo local de la conectividad de red, esto se traducirá en un aumento progresivo de las capacidades de navegación del robot.
HyBrainWare2, una versión mejorada del software personalizado publicado en 26, es la arquitectura de núcleo desarrollado para manejar el control de los diferentes dispositivos del sistema (estimulador, adquisición de datos, procesamiento y visualización, la comunicación robot o simulación). Este software ha sido desarrollado en nuestro laboratorio y está disponible gratuitamente bajo petición. Este software proporciona la interfaz conla tarjeta de adquisición de datos: una vez que el usuario inicia la adquisición de datos de la interfaz gráfica de usuario, el software controla la tarjeta de adquisición para iniciar el muestreo y la conversión A / D de los datos procedentes de los electrodos de registro. Estos datos pueden ser grabado, aparece la pantalla o analizado en tiempo real para detectar los puntos, de acuerdo con las opciones establecidas por el usuario (ver sección Procedimiento para más detalles). Además, en el software, la definición de codificación (traducción de la información sensorial en una estimulación eléctrica) y decodificación (traducción de actividad registrada en comandos de motor para el robot) algoritmos debe ser especificado. En particular, nuestra configuración es relativamente fácil de usar en comparación con sistemas similares diseñados en el pasado 27, ya que casi todas las variables se puede acceder por el usuario justo antes de comenzar el experimento real, mientras que toda la información registrada se guarda automáticamente en un formato compatible con una caja de herramientas de análisis de datos neural 28.
La sección siguiente procedimiento describe un experimento de aprendizaje sobre las culturas de hipocampo de rata disociada: todo el cultivo y los parámetros experimentales se proporcionan para esta preparación particular y pueden necesitar ser modificada si un sustrato biológico diferente se va a utilizar. Del mismo modo, el experimento descrito se aprovecha de la arquitectura de bucle cerrado para investigar el efecto de aprendizaje de la estimulación tetánica, pero la propia arquitectura es lo suficientemente flexible para ser utilizado en el estudio de las diferentes características de las redes neuronales disociadas. Las principales variantes del experimento propuesto se explican con más detalle en la sección de Discusión.
1. Preparación de cultivos neuronales durante un MEA
2. Selección de los parámetros de grabación para la Adquisición MEA
3. Selección de MEA electrodos para estimular la Computación Neuronal Cultura y Respuesta Mapa
4. Para conectar la cultura neuronal con el Robot: Selección de Codificación y decodificación de Esquemas
5. Diseño de la Navegación Arena para el Robot
6. Selección de electrodos MEA a Grabar la actividad neuronal de la Cultura
7. Realización de un experimento de Neuro-robótica
8. Segundo Mapa Respuesta Computación
El marco experimental desarrollado permite la prueba de si es posible un intercambio de información entre un cultivo de neuronas y la realización virtual de un robot físico 34. La Figura 1 muestra varias muestras de caminos obtenidos recorridas por un robot virtual en 20 min experimentos en diferentes condiciones : de izquierda a derecha un experimento adecuado de circuito cerrado, un "vacío MEA" experimento robot (no hay células se colocan en la MEA para este experimento de control) y un robot experimento en lazo abierto (tipo de estimulación es constante en lugar de codificar la información del sensor) están representados. Las trazas representativas confirman que una interacción bidireccional entre los elementos neuronales artificiales y es necesario a fin de obtener buenas actuaciones de navegación del robot. Sin embargo, el robot experimenta varios éxitos contra los obstáculos.
En la Figura 2, el rendimiento de navegación del robot, expressed como píxeles viajado entre éxitos posteriores, se muestra en diferentes condiciones. Las dos primeras columnas muestran la distribución de las distancias recorridas en los experimentos de control antes mencionadas ('MEA vacío' y las configuraciones de bucle abierto), mientras que la tercera y cuarta columnas muestran el rendimiento con y sin, respectivamente, el suministro de la estimulación tetánica después de cada chocó contra un obstáculo. La introducción de la estimulación tetánica (Cfr Procedimiento, punto 7.2) mejora significativamente la distancia recorrida entre dos hits consecutivos, lo que mejora las prestaciones de navegación del robot 35.
En la Figura 3, se presenta el rendimiento de navegación de un robot con diferentes condiciones de descodificación. Con este fin, una configuración de arena diferente ha sido adoptada. Esto ayudó a cuantificar el éxito de navegación del robot dentro de la arena 36: como se describe en el paso 4.1 del procedimiento, el robot espresentó una serie de pistas cortas. La tasa de éxito es simplemente la relación entre el número de pistas cruzadas con éxito más el número de pistas presentados. En particular, durante los experimentos se realizó una identificación en tiempo real de los picos de la explosión y aisladas. Los paradigmas de descodificación difieren entre sí debido a los pesos relativos de las ráfagas y picos aislados (Procedimiento Cf., señala 03/05 a 03/06 y Discusión).
Figura 1: Una red neuronal y un robot tienen un intercambio bidireccional de información Esta figura muestra tres caminos representativos viajado por el robot más de 20 minutos de experimento.. En particular, las áreas de color verde claro son libres para que el robot se mueva en, mientras oscuros píxeles verdes representan obstáculos infranqueables que el robot puede percibir a través de sus sensores de distancia. En cada ensayo, el robot comienza in la sección izquierda superior de la arena y se desplaza a su posición final, representado como un gran punto rosa. Los puntos negros representan más pequeños golpes contra un obstáculo, mientras que el camino codificado por colores proporciona una indicación de la evolución temporal del movimiento del robot. La barra de color a la derecha expresa el tiempo transcurrido desde el inicio del experimento en minutos. (A) trayectoria seguida durante un experimento de bucle cerrado. (B) trayectoria seguida durante un "vacío" experimento MEA (no hay células se cultivan en el MEA superficie). () Ruta C seguido durante un experimento en lazo abierto (tipo de estimulación es constante durante todo el experimento). Haga clic aquí para ver una versión más grande de la figura.
Figura 2: Los resultados de rendimiento se ven afectados por cerrado-loop y estimulación tetánica. En este gráfico se informa de las distribuciones de las distancias recorridas por el robot entre éxitos posteriores en diferentes condiciones. En particular, las dos primeras distribuciones representan experimentos de control ('Empty' para grabaciones sin neuronas chapados en la MEA, 'lazo abierto' (OL) para experimentar con un robot "ciego"). Las dos últimas columnas representan la condición de "bucle cerrado" sin (CL) y con (CL + TS) el protocolo de aprendizaje implementado a través de la estimulación tetánica (TS), entregado a la cultura siguiente hits contra un obstáculo. En cada caja, el segmento central horizontal representa la mediana de la distribución, la plaza vacía el valor medio, la barra central se extiende a la primera y tercer cuartil y los bigotes se extiende a los 5 º y 95 º percentiles. Los valores extremos son representados como diamantes. Estadísticas se han realizado utilizando el test de Kruskall-Wallis análisis uno de varianzaen filas: la comparación del par de Student-Newman-Keuls revela que todos los valores de la mediana son significativamente diferentes con p <0,05.
Figura 3: La descodificación influye en el rendimiento robótico El gráfico anterior representa la probabilidad, para un algoritmo de decodificación que se describe, del robot para navegar con éxito a través de una pista corta en una cantidad limitada de tiempo.. Identificación de ráfagas y picos aislados se realiza en tiempo real durante el mismo experimento. En el primer caso ('picos') todos los picos detectados presentan el mismo peso relativo, para el segundo y tercer distribuciones un peso de 0 se fijó para, respectivamente, picos aislados y picos pertenecientes a una explosión. Las dos últimas columnas representan los resultados obtenidos en el caso en que todos los picos se contabilizan, pero con un peso relativo diferente según su posición.En particular, en la cuarta columna aislado picos se les dio mayor peso relativo de eventos de ráfaga, mientras que la ponderación se invierte para la decodificación con relación a la quinta columna de datos. En cada gráfico, la línea central representa la mediana de la distribución, la plaza vacía el valor medio, mientras que la barra central se extiende a la primera y tercer cuartil y los bigotes se extiende a los 5 º y 95 º percentiles. Estadísticas se han realizado utilizando el test de Kruskall-Wallis análisis uno de varianza en filas. La comparación por pares (método de Student-Newman-Keuls,) revela que las diferencias significativas (p <0.05) se pueden observar entre las columnas 1 y 4, 2 y 4, 2 y 5, 2 y 3.
En este trabajo una arquitectura neuro-robótica basa en un controlador neural (es decir, una red de neuronas procedentes de la corteza o el hipocampo de ratas embrionarias), bi-direccionalmente conectado a un robot virtual, se presenta. El robot, que tiene sensores y las ruedas, se ve obligado a moverse en un escenario estático con obstáculos y su tarea consiste en evitar colisiones.
La primera y posiblemente más crítico aspecto del procedimiento descrito es la preparación de los cultivos sí mismos, como la tasa de fracaso tenderá a ser significativa incluso en el mejor de condiciones técnicas. Una descripción detallada de las técnicas de cultivo es, sin embargo, fuera del alcance del presente trabajo. Como pauta general, las grabaciones deben ocurrir cuando la tasa de disparo de la red alcanza un nivel estable, por lo general después de 3 semanas in vitro. Una indicación aproximada de las culturas saludables es la presencia de espontánea actividad electrofisiológica en varios Chann grabaciónels (al menos 20 canales más de 60 disponibles). Tales cultivos se caracterizan por un alto grado de inter-conectividad neuronal. En tales condiciones, la actividad neural generalmente queda fuertemente sincronizado y, a veces, se muestran los eventos epileptiformes, con intensa clavar seguido por minuto-largos períodos de silencio 37. Ambas características presentan un problema: la sincronización excesiva hará que sea imposible distinguir las respuestas a estímulos de diferentes electrodos, mientras que los cultivos que muestran actividad epileptiforme responderán a la primera estímulo presentado con una larga estallido de actividad, seguido de un período de silencio, independientemente de cualquier estímulos sucesivos entregado. Tanto estos problemas pueden ser fuertemente mejoran por el empleo de las culturas estampadas 35, en el que la población neural se divide en dos o más débilmente sub-grupos interconectados.
Otra cuestión es que las respuestas neuronales dependen en gran medida de la distribución de stimul entrantei 38,39. En un experimento de bucle cerrado, la estimulación suministrada es una función de las lecturas de los sensores, que, a su vez, son una consecuencia del movimiento del robot y por lo tanto de las propias respuestas neuronales. Esto implica que no hay una manera fácil de establecer de antemano qué respuestas se observó durante el experimento real. Como resultado, la selección de electrodos de entrada-salida debe confiar en aproximaciones sucesivas. En el protocolo descrito, un proceso de dos pasos (a saber, los pasos 5.5 y 6.4) se lleva a cabo para tratar de determinar un mapa de conexión. En el primer paso, una secuencia regular de estimulaciones se entrega y las respuestas a tales estímulos se utilizan para derivar un primer mapa de conexión y un conjunto temporal de canales de grabación. Esta configuración se utiliza para realizar la prueba de manejo se describe en el paso 6.4 y seleccione los canales de registro que serán monitoreadas durante el experimento real.
En la sección de resultados, un representante res de navegaciónULT y las mejoras inmediatas provocadas por la introducción de un modelo de aprendizaje se presentan. A lo largo de la descripción del protocolo, se mencionan varias otras variantes experimentales posibles. Por ejemplo, los dos grandes sistemas de codificación implementados en HyBrainWare2 (lineales y estocásticos), donde se desarrollaron para investigar el papel exacto de la variabilidad de entrada temporal en el código neural 38. En el caso lineal, la tasa de estimulación instantánea es una función de los parámetros definidos por el usuario y sensores robot grabaciones. En el caso estocástico, cada instancia de tiempo tiene una probabilidad dada a elegir para entregar un estímulo. Tal probabilidad se calcula automáticamente por HyBrainWare2 para que las tasas de estimulación esperados coinciden con la del primer caso. La posibilidad de añadir fluctuación de codificación lineal proporciona una transición suave entre los dos casos descritos anteriormente. De la misma manera, la exploración de diferentes combinaciones de parámetros en la sección de decodificación podría ayudar a arrojar luz sobre el preciSE papel de estallar en las redes neurales in vitro. La velocidad de cada rueda del robot aumenta proporcionalmente al parámetro de peso cada vez que se detecta un evento en la zona de salida correspondiente, mientras que el coeficiente de extinción indica cuánto tiempo, en segundos, una de las contribuciones lleva a perder el 50% de su valor . La caries es un simple exponencial. Esas variantes ya se han tenido en cuenta en el diseño actual de HyBrainWare2, pero muchas más posibilidades de investigación están abiertas si las modificaciones adicionales en el software o configuración experimental se pueden introducir.
Una limitación significativa en lugar del protocolo aquí descrito es el requisito del software desarrollado encargo, HyBrainWare2 (libremente disponible bajo petición a todos los usuarios interesados). Este software ha sido diseñado para un conjunto de dispositivos (estimulador, tarjeta de adquisición, amplificador MEA) de un modelo y fabricante específico. Si bien es posible adaptarlo para trabajar en diconfiguraciones ferentes, la conversión llevará algún habilidad de programación. Del mismo modo, las opciones incluidas cubren sólo un conjunto limitado de todas las preguntas experimentales que podrían investigarse a través de una instalación de este tipo. Por ejemplo, el algoritmo de detección de pico implementado en la arquitectura presentada (tiempo preciso de detección de pico 40) está completamente definida por varios parámetros codificados de forma rígida que necesitan ser cambiado si el objeto de registro es muy diferente de las redes neuronales disociadas (por ejemplo, células cardíacas o rebanadas). Finalmente, el protocolo de aprendizaje consiste en la entrega de un resumen, de alta frecuencia (2 seg de 20 Hz estimulación, cada pulso de estímulo es el mismo que los utilizados para codificar la información sensorial) la estimulación después de cada golpe obstáculo. Si el robot encuentra un obstáculo con el lado derecho, la estimulación tetánica se entrega al electrodo que por lo general los códigos de información lado derecho y lo mismo es cierto para los golpes laterales izquierdos. Este protocolo está codificada y no puede be cambiado por el usuario sin necesidad de modificar el software de salir.
Si bien la configuración que aquí se presenta no es el primer sistema encarnada para experimentos híbrido, de circuito cerrado 20,23,27,41,42, los diseñados en el pasado se han centrado en una sola tesis apoyada por datos de un número limitado de preparaciones análogas . Por otro lado, la configuración descrita se ha utilizado para un gran número de experimentos (más de 100 culturas se han registrado desde 2012) con preparaciones diferentes para la modularidad y el origen, mientras que los propios experimentos abordado diferentes temas (por ejemplo, impacto de la estimulación tetánica y relevancia de estallar, como se presenta en los resultados). En un futuro próximo, se prevén nuevas sesiones experimentales para verificar los efectos duraderos de tanto la estimulación tetánica y de circuito cerrado y la relación entre la regularidad estimulación y observado respuestas. Otro tema a tratar es el vínculo entre la actividad espontánea y observado, conla idea de añadir un nuevo algoritmo de decodificación que tiene en cuenta la historia de la actividad pasada y la estimulación 43.
The authors declare they have no competing financial interests.
Los autores desean Ph.D. gracias estudiante Marta Bisio para el cultivo y mantenimiento de redes neuronales más de microelectrodos Arrays y Dr. Marina Nanni y la doctora Claudia Chiabrera de NBT-IIT para la asistencia técnica para los procedimientos de disección y disociación. La investigación que lleva a estos resultados ha recibido financiación del Séptimo Programa Marco de la Unión Europea (TIC-FET FP7 / 2007-2013, FET joven Exploradores esquema) en virtud del acuerdo de subvención n ° 284772 BOW CEREBRO ( www.brainbowproject.eu ). Los autores también desean agradecer a Silvia Chiappalone por su ayuda en la producción de los gráficos utilizados en la introducción.
Name | Company | Catalog Number | Comments |
Stimulus Generator 4002 | Multi Channel Systems | ||
MEA1060-Inv-BC | Multi Channel Systems | ||
TC02 | Multi Channel Systems | ||
NI 6255 Acquisition Card | National Instruments | ||
Microsoft Visual Studio 2008 | Microsoft | ||
2078P Multichannel System-National Instruments adapter board | Developed at University of Genova (Italy) | ||
Matlab 2010 | Mathworks | ||
HyBrainWare2 | HyBrainWare2: Contact Information |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados