Method Article
Proporcionamos un protocolo detallado para realizar estudios de fotogrametría de estructura submarina a partir del movimiento para generar modelos 3D y ortomosaicos.
La fotogrametría de estructura a partir del movimiento (SfM) es una técnica utilizada para generar reconstrucciones tridimensionales (3D) a partir de una secuencia de imágenes bidimensionales (2D). Los métodos SfM se están volviendo cada vez más populares como una forma no invasiva de monitorear muchos sistemas, incluidos los paisajes antropogénicos y naturales, las estructuras geológicas y los ecosistemas terrestres y acuáticos. Aquí, se proporciona un protocolo detallado para recopilar imágenes de SfM para generar modelos 3D de hábitats bentónicos. Además, se han comparado el costo, la eficiencia del tiempo y la calidad de salida de emplear una cámara réflex digital de lente única (DSLR) frente a una cámara de acción menos costosa. Se observó una compensación entre el tiempo computacional y la resolución, con la cámara DSLR produciendo modelos con más del doble de resolución, pero tardando aproximadamente 1,4 veces más en producir que la cámara de acción. Este manual tiene como objetivo proporcionar una descripción detallada de los pasos necesarios para recopilar datos de SfM en hábitats bentónicos para aquellos que no están familiarizados con la técnica, así como para aquellos que ya utilizan métodos similares.
Los procesos de los ecosistemas son naturalmente dinámicos y pueden ser difíciles de cuantificar. La última década ha visto un aumento en las nuevas tecnologías para capturar ecosistemas y su dinámica en una gama de escalas, desde el escaneo láser 3D de características individuales del ecosistema hasta la teledetección satelital de grandes áreas 1,2,3. En los hábitats bentónicos, la estructura está íntimamente relacionada con la función del ecosistema8, lo que hace que las herramientas que simultáneamente permiten monitorear la geometría y la estructura de la comunidad sean especialmente valiosas para comprender la dinámica ecológica. Sin embargo, muchos enfoques modernos no se pueden utilizar en sistemas acuáticos debido a las propiedades físicas del agua (por ejemplo, refracción, distorsión, turbidez). Las técnicas, como LiDAR (Light Detection and Ranging) y algunos métodos de reconocimiento aéreo, pueden ser apropiados a grandes escalas espaciales, pero no pueden adquirir la resolución necesaria para evaluar los cambios de escala fina en hábitats bentónicos. Los métodos de fotogrametría de estructura a partir del movimiento (SfM) se han adaptado recientemente para producir ortomosaicos a gran escala y de alta resolución y modelos de superficie 3D de hábitats submarinos 4,5,6,7.
La fotogrametría SfM es un método relativamente de bajo costo, simple, no invasivo y repetible que permite la generación de registros a gran escala y de alta resolución del ambiente bentónico en ecosistemas acuáticos9. SfM utiliza una secuencia de imágenes 2D para generar reconstrucciones de modelos 3D. Los modelos generados a partir de SfM se pueden utilizar para recopilar datos sobre la complejidad estructural (por ejemplo, rugosidad, dimensionalidad)4,5,10,11,12 y la estructura de la comunidad (por ejemplo, composición de especies, demografía de la población)13,14,15 de los ecosistemas bentónicos. Además, como este método es relativamente barato, rápido y repetible, puede ser utilizado tanto por científicos como por no científicos para recopilar información valiosa y objetiva sobre estos ecosistemas. Por lo tanto, este método es una técnica viable para su uso en proyectos de ciencia ciudadana donde la estandarización del esfuerzo de muestreo, la minimización del sesgo, el compromiso de los participantes y la facilidad de capacitación son vitales para la calidad de los datos y el éxito general16,17.
Este artículo proporciona un protocolo detallado para realizar estudios submarinos de SfM. Al mismo tiempo, el uso de una cámara DSLR se ha comparado con el de una "cámara de acción" más rentable, y se describen las ventajas y desventajas relativas de cada una. El objetivo general es familiarizar a los científicos y no científicos con los métodos de encuesta bentónica SfM lo más rápidamente posible al proporcionar un protocolo simple y de uso común, a su vez, promoviendo el uso de este método más ampliamente. Para ver ejemplos de estudios que han aplicado variaciones de este método para estudiar comunidades ecológicas submarinas, véase Burns et al. (2015)4, Storlazzi et al. (2016)18, Ventura et al (2016 y 2018)19,20, Edwards et al. (2017)14, George et al. (2018)21, Anelli et al. (2019)22, y Torres-Pulliza et al. (2020)10.
El método descrito aquí requiere un equipo de snorkel o buceo para dos personas. Después de seleccionar el sitio de estudio, se coloca un carrete de línea (Figura 1A) en el centro del sitio y las fichas de calibración (Figura 1B) se distribuyen ~ 2 m del centro. Una persona (el nadador) nada con la cámara y captura imágenes del sitio, mientras que la segunda persona (el asistente) cuida el carrete en el centro de la parcela (Figura 1C). Primero, el nadador conecta la cámara al carrete a través de la línea y luego comienza a tomar imágenes continuas del bentos mientras nada boca abajo y hacia adelante para desenrollar la línea del carrete. El nadador debe mantener una distancia vertical de ~1 m sobre el sustrato en todo momento, ajustando su posición para que coincida con la de la topografía mientras nada. Es importante destacar que la línea que conecta el carrete y la cámara debe permanecer tensa en todo momento para crear un espacio uniforme en la espiral mientras el nadador examina la parcela. El asistente mantiene el carrete en una posición estable y vertical y se asegura de que el carrete no gire y que la línea no se enrede.
Una vez que la línea se ha desenrollado por completo, el nadador se detiene, gira y nada en la dirección opuesta para retroceder la línea alrededor del carrete. A medida que el nadador cambia de dirección, el asistente gira el carrete para enrollar la línea, exactamente 180 ° para evitar la superposición exacta del camino saliente. Una vez que el nadador está lo más cerca posible del centro, la cámara se separa de la línea, y el asistente toma el carrete y la línea y nada lejos de la parte central del sitio. Luego, el nadador termina de obtener imágenes del centro de la trama moviendo la cámara en una pequeña espiral sobre el centro. Si bien hay varias formas de obtener imágenes de un área de manera efectiva, el método de carrete y línea descrito aquí es robusto incluso en condiciones ambientales no ideales donde las aguas superficiales agitadas, el oleaje o la baja visibilidad podrían impedir la recopilación de datos. En estos escenarios, este método mantiene a los buceadores / buceadores unidos y asegura una alta superposición de imágenes al mantener al nadador en un camino controlado.
1. Materiales
2. Métodos detallados
3. Limpie el sitio.
En este ejemplo, se tomaron imágenes del sitio de arrecife 2_7 ubicado en Patch Reef 13 en Kāneʻohe Bay, Oʻahu, Hawaiʻi, y se utilizaron 3.125 fotos JPEG de la DSLR y 3.125 capturas de fotogramas JPEG del video de la cámara de acción (Tabla 1) como entrada para crear los ortomosaicos y modelos 3D. El flujo de trabajo general consistió en 5 etapas: 1) alineación de fotos para generar la nube de puntos dispersos, 2) escalar la nube de puntos dispersos y optimizar las cámaras, 3) construir la nube de puntos densa (también se generaron mapas de profundidad durante esta etapa), 4) construir el modelo digital de elevación (DEM) y el ortomosaico, y 5) generar el modelo 3D y la textura. Tenga en cuenta que las etapas 4 y 5 no necesariamente deben realizarse en ese orden, pero deben realizarse después de procesar la nube de puntos densa y los mapas de profundidad. La georreferenciación de los modelos debe ocurrir antes de generar el ortomosaico y el DEM. La configuración utilizada para estas etapas y los detalles de procesamiento se describen en la Tabla 2 y la Tabla de materiales, respectivamente.
Para métodos más detallados de cómo generar modelos 3D y ortomosaicos, véase el Material Suplementario y Suka et al.23. El tiempo de procesamiento fue más corto para el modelo derivado de la cámara de acción para cada paso, incluida la generación de nubes de puntos dispersos, la generación de nubes de puntos densos, la representación de modelos de malla y la representación de modelos texturizados. Esto condujo a un tiempo de procesamiento total significativamente más rápido para el modelo de cámara de acción (6 h 39 min) que el modelo DSLR (9 h 14 min). El tiempo exacto para el procesamiento del modelo variará con la potencia computacional y las configuraciones de hardware específicas.
El modelo generado usando imágenes de la cámara DSLR contenía 2.848.358 puntos de nubes dispersas y 787.450.347 puntos de nubes densas, mientras que el modelo generado a partir de las imágenes de la cámara de acción contenía solo 2.630.543 puntos de nubes dispersas y 225.835.648 puntos de nubes densas. Esto llevó a que los modelos DSLR tuvieran más de 2 veces la resolución que los modelos de cámaras de acción con resoluciones ortomosaicas de 0.442 y 0.208 mm / píxel para los modelos derivados de DSLR y cámaras de acción, respectivamente (Tabla 1). A pesar de la mejor resolución del modelo DSLR en relación con el modelo de cámara de acción, ambos métodos fueron capaces de producir modelos de alta calidad con poca diferencia en la representación visual cuando el área de arrecife de ~113 m 2 se representó como un modelo de elevación digital de 20 cm2 (paneles superiores de la Figura 2) o proyección ortomosaico 2D (paneles centrales de la Figura 2).
Figura 1: Fotogrametría de estructura a partir del movimiento. (A) Ejemplo de un equipo de carrete para controlar la distancia del nadador con un mango y un bastón adjuntos para un posicionamiento y manejo precisos. (B) Mosaicos de calibración. (C) Un esquema de la trayectoria de natación con las posiciones relativas del nadador (verde) y el asistente (naranja). Haga clic aquí para ver una versión más grande de esta figura.
Figura 2: Comparación visual de modelos digitales de elevación y ortomosaicos. Modelos digitales de elevación (arriba) y ortomosaicos (centro) construidos a partir de imágenes DSLR (izquierda) y cámara de acción (derecha). El panel inferior es un zoom de las áreas en los cuadros blancos en los ortomosaicos. Las escalas del mapa de calor en el panel superior representan la distancia desde la superficie del agua en metros (m). Haga clic aquí para ver una versión más grande de esta figura.
Canon EOS Rebel SL3 | GoPro Héroe 7 | |
Costar | ||
Cámara | ~$600.00 | ~$220.00 |
Carcasa subacuática | ~$1,700.00 | NA |
Costo total | ~$2,300.00 | ~$220.00 |
Fotos | ||
Formato de archivo de foto | .jpeg | .jpeg |
Resolución de la foto | 24 megapíxeles | 12 megapíxeles (de vídeo 4K) |
Fotos alineadas / fotos totales | 3125 / 3125 | 3125 / 3125 |
Métricas de fotogrametría | ||
Puntos de nubes dispersas | 2,848,358 | 2,630,543 |
Puntos de nubes densas | 787,450,347 | 225,835,648 |
Caras (modelo 3D) | 11,919,451 | 3,834,651 |
Resolución del modelo digital de elevación (DEM) | 0,831 mm/píxel | 1,77 mm/píxel |
Resolución ortomosaica | 0,208 mm/píxel | 0,442 mm/píxel |
Tiempos de procesamiento | ||
Generación de nubes dispersas | 1 h 23 mín | 1 h 27 mín |
Generación de nubes densas | 4 h | 3 h 11 mín |
Representación de modelos de malla | 3 h 32 mín | 1 h 49 mín |
Representación de texturas | 19 minutos | 12 minutos |
Tiempo total de procesamiento del equipo | 9 h 14 mín | 6 h 39 mín |
Tabla 1: Información detallada sobre el costo de configuración, las fotos utilizadas para construir los modelos, las métricas de fotogrametría y el tiempo de procesamiento. El procesamiento se realizó utilizando la misma configuración para ambos modelos. Tenga en cuenta que el tiempo de procesamiento no incluye el tiempo para varios pasos, como la edición de fotos, la extracción de imágenes de vídeo, la realineación de fotos y la edición y escala de los modelos.
Canon EOS Rebel SL3 | GoPro Héroe 7 | |
Imágenes | ||
Tamaño medio del archivo | ~ 8,3 MB | ~ 4,7 MB |
Adquisición de fotos | Modo continuo | Extraído del vídeo 4K |
Corrección de color | Manual | Manual |
Corrección de la lente | No | Sí |
Configuración del proceso de fotogrametría | ||
Generación de nubes dispersas | Precisión: Alta | Precisión: Alta |
Punto clave: 40,000 | Punto clave: 40,000 | |
Punto de empate: 4,000 | Punto de empate: 4,000 | |
Preselección genérica: Sí | Preselección genérica: Sí | |
Generación de nubes densas | Calidad media | Calidad media |
Generación de modelos de malla 3D | ||
Fuente: | Mapas de profundidad | Mapas de profundidad |
Calidad: | Medio | Medio |
Recuento facial: | Bajo | Bajo |
Interpolación: | Habilitado | Habilitado |
Calcular colores de vértice: | Sí | Sí |
Generación de texturas 3D | ||
Tipo de textura: | Mapa difuso | Mapa difuso |
Fuente: | Imágenes | Imágenes |
Modo de mapeo: | Genérico | Genérico |
Modo de fusión: | Mosaico | Mosaico |
Tamaño / recuento de texturas: | 4096 / 1 | 4096 / 1 |
Modelo digital de elevación (DEM) | Desde la nube densa | Desde la nube densa |
Ortomosaico | Desde DEM | Desde DEM |
Tabla 2: Información detallada sobre las imágenes recogidas y el procesamiento fotogramétrico. El procesamiento se realizó utilizando la misma configuración para ambos modelos.
Material complementario. Haga clic aquí para descargar este archivo.
Este estudio demuestra que tanto la cámara DSLR como la cámara de acción producen modelos con una resolución superior a 0,5 mm / píxel en menos de 10 h de tiempo de procesamiento en una computadora de escritorio estándar. La principal compensación entre la DSLR y la cámara de acción, aparte del costo, es una resolución más fina frente a un tiempo de procesamiento más rápido, respectivamente. Sin embargo, los tiempos de procesamiento informados solo incluyen el procesamiento computacional. Por lo tanto, aunque el tiempo computacional es menor para la cámara de acción, hay una cantidad significativa de tiempo (10-20 min) invertido en la extracción de imágenes de los videos que no se requiere con la DSLR. Una alternativa es utilizar la cámara de acción en modo de disparo continuo para evitar la extracción de imágenes. El modo de disparo continuo no se utilizó en este ejemplo, ya que la cámara de acción solo puede disparar a 2 fps, lo que requiere una velocidad de natación significativamente más lenta para recopilar suficientes imágenes para construir un modelo completo. En este sentido, hay una compensación entre un mayor tiempo en el campo utilizando el modo de disparo continuo versus un mayor tiempo en la computadora, extrayendo imágenes, cuando se usa el modo de video.
Las ventajas de la cámara de acción incluyen asequibilidad y facilidad de transporte y operación bajo el agua. La principal ventaja de la DSLR es que produce imágenes de mayor resolución; por lo tanto, las cámaras DSLR se recomiendan sobre las cámaras de acción cuando las primeras no tienen un costo prohibitivo. Los tipos de preguntas que un estudio busca abordar también serán importantes para determinar el método utilizado. Por ejemplo, una cámara de acción podría ser preferible en entornos que son relativamente homogéneos (por ejemplo, lechos de pastos marinos, hábitats de corales muertos / escombros), o donde solo se evalúan métricas comunitarias amplias (como abundancia, diversidad) a grandes escalas espaciales. Sin embargo, una cámara DSLR podría implementarse en los casos en que el seguimiento de los cambios a escala fina en organismos o sustratos individuales sea de interés.
Como este es un método de campo, los resultados del modelo dependerán de varios factores ambientales, como la iluminación, la claridad del agua, las condiciones de la superficie, la cantidad de oleadas y el movimiento de peces o estructuras bentónicas no estacionarias (por ejemplo, pastos marinos). Aunque no hay umbrales absolutos de cuándo es apropiado usar este método, los días ligeramente nublados con alta claridad del agua, condiciones de superficie tranquila y poca oleada generalmente producen los mejores modelos. Además, hay un límite a la profundidad mínima requerida para estos métodos. Estos métodos no funcionan bien en condiciones en las que hay menos de 0,5 m de agua debido a la baja superposición entre las fotos y menos características distintivas por foto. Sin embargo, esto resalta otra ventaja de la cámara de acción, es decir, son más pequeñas y, por lo tanto, son más fáciles de usar a profundidades más bajas. Además, un carrete de diámetro más pequeño y una mayor velocidad de fotogramas (o lente de ángulo más amplio) pueden mejorar la superposición de imágenes en condiciones muy poco profundas9.
Muchos otros tipos de datos se pueden integrar con este enfoque. Por ejemplo, los ortomosaicos se han utilizado para mostrar la densidad espacial de los datos moleculares (por ejemplo, genes y metabolitos) en corales 24 y humanos 25 utilizando el software de código abierto 'ili'26. La misma plataforma también podría usarse para mapear las densidades espaciales de animales, microorganismos, virus y / o productos químicos en el medio ambiente. Otros ejemplos han utilizado SfM para anotar especies bentónicas espacialmente en ortomosaicos utilizando software de sistema de información geográfica10. Además, los modelos 3D generados por SfM se pueden utilizar para estimar las características del hábitat, como la rugosidad y la dimensión fractal. De hecho, los métodos descritos aquí se utilizaron recientemente para derivar una nueva teoría geométrica para las superficies del hábitat10. Finalmente, los ortomosaicos se están utilizando como superficies de entrada para modelos computacionales espacialmente explícitos, lo que permite que las simulaciones dinámicas se superpongan en la superficie 3D del modelo. Ser capaz de generar fácilmente grandes imágenes y representaciones 3D de hábitats bentónicos ha permitido a los científicos marinos abordar preguntas hasta ahora inimaginables3.
En general, aquí hay un protocolo detallado para realizar fotogrametría SfM bajo el agua con cámaras DSLR o cámaras de acción más rentables. Estos métodos pueden ser utilizados por los científicos para una amplia gama de propósitos, desde la extracción de datos sobre ecosistemas bentónicos hasta el desarrollo de superficies de entrada 3D para simulaciones in silico . Sin embargo, estos protocolos también pueden ser utilizados por no científicos como parte de los esfuerzos de ciencia ciudadana para recopilar información valiosa sobre patrones de biodiversidad, complejidad del hábitat, estructura de la comunidad y otras métricas ecológicas.
Los autores no tienen intereses financieros contrapuestos u otros conflictos de intereses.
Agradecemos a la Fundación de la Familia Paul G. Allen por financiar esta investigación y agradecemos a Ruth Gates por la inspiración para usar la tecnología para ayudar a conservar los arrecifes. También agradecemos a NOAA y otros colaboradores por la discusión reflexiva sobre estos métodos. Por último, agradecemos a Catie Foley y Patrick Nichols por proporcionar el dron y el video submarino de estos métodos.
Reconocemos a la Fundación Nacional de Pesca y Vida Silvestre como socio financiador en este trabajo.
Name | Company | Catalog Number | Comments |
Action camera (GoPro Hero7 Black) | GoPro | Could be any waterproof action camera | |
Adobe Lightroom | Adobe | Color correction | |
Calibration tiles ( flat PVC board cut to size for Agisoft targets. Attach a dive weight underneath if expecting waves) | Any negatively buoyant object of known size and color. We recommend using the scale marker templates available from Agisoft Metashape software (v.1.6.0). | ||
DSLR camera (Canon EOS Rebel SL3 ) | Canon | 3453C002AA | Could be any DSLR camera in a underwater housing |
Line (plastic clothes line filament) | Any negatively buoyant line that is strong enough to withstand field use | ||
Micro SDXC memory card (for GoPro) | |||
Oceanic Veo 2.0 | Oceanic | Digital depth gauge | |
SDXC memory card (for DSLR) | Any SDXC memory card should work, so long as there is enough space to hold all the pictures necessary to build the model | ||
Spool (2 inch-long section of 8 inch diameter PVC pipe which was attached to a 3 feet section of 1 inch PVC pipe to form the stem | Any negatively buoyant, round object of the desired diameter | ||
Underwater camera housing for DSLR (Ikelite 200DLM/C Underwater TTL Housing) | Ikelite | 6970.09 | Should be the specific water housing for the DSLR make and model |
Windows 10 desktop computer with an Intel i9-9900K 8-core CPU, two Nvidia GeForceRTX 2070 SUPER GPUs, and 128 GB of RAM. | Processing |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados