Method Article
Nous fournissons un protocole détaillé pour la réalisation d’études de photogrammétrie sous-marine de structure à partir du mouvement afin de générer des modèles 3D et des orthomosaïques.
La photogrammétrie Structure à partir du mouvement (SfM) est une technique utilisée pour générer des reconstructions tridimensionnelles (3D) à partir d’une séquence d’images bidimensionnelles (2D). Les méthodes SfM sont de plus en plus populaires comme moyen non invasif de surveiller de nombreux systèmes, y compris les paysages anthropiques et naturels, les structures géologiques et les écosystèmes terrestres et aquatiques. Ici, un protocole détaillé est fourni pour la collecte d’images SfM afin de générer des modèles 3D d’habitats benthiques. De plus, le coût, le gain de temps et la qualité de sortie de l’utilisation d’un appareil photo reflex numérique à objectif unique (DSLR) par rapport à un appareil photo d’action moins coûteux ont été comparés. Un compromis entre le temps de calcul et la résolution a été observé, l’appareil photo reflex numérique produisant des modèles avec plus de deux fois la résolution, mais prenant environ 1,4 fois plus de temps à produire que la caméra d’action. Cette introduction vise à fournir une description détaillée des étapes nécessaires à la collecte de données SfM dans les habitats benthiques pour ceux qui ne sont pas familiers avec la technique ainsi que pour ceux qui utilisent déjà des méthodes similaires.
Les processus écosystémiques sont naturellement dynamiques et peuvent être difficiles à quantifier. La dernière décennie a vu une poussée des nouvelles technologies pour capturer les écosystèmes et leur dynamique à diverses échelles allant du balayage laser 3D des caractéristiques individuelles des écosystèmes à la télédétection par satellite de grandes zones 1,2,3. Dans les habitats benthiques, la structure est intimement liée à la fonctionécosystémique 8, ce qui rend les outils qui permettent simultanément de surveiller la géométrie et la structure des communautés particulièrement précieux pour comprendre la dynamique écologique. Cependant, de nombreuses approches modernes ne peuvent pas être utilisées dans les systèmes aquatiques en raison des propriétés physiques de l’eau (p. ex. réfraction, distorsion, turbidité). Des techniques, telles que le LiDAR (Light Detection and Ranging) et certaines méthodes de relevés aériens, peuvent être appropriées à grande échelle spatiale, mais ne peuvent acquérir la résolution nécessaire pour évaluer les changements à petite échelle dans les habitats benthiques. Les méthodes de photogrammétrie SfM (Structure from Motion) ont récemment été adaptées pour produire des orthomosaïques à grande échelle et à haute résolution et des modèles de surface 3D d’habitats sous-marins 4,5,6,7.
La photogrammétrie SfM est une méthode relativement peu coûteuse, simple, non invasive et reproductible qui permet de produire des enregistrements à grande échelle et à haute résolution de l’environnement benthique dans les écosystèmes aquatiques9. SfM utilise une séquence d’images 2D pour générer des reconstructions de modèles 3D. Les modèles générés par SfM peuvent être utilisés pour recueillir des données sur la complexité structurelle (p. ex., rugosité, dimensionnalité)4,5,10,11,12 et la structure des communautés (p. ex., composition des espèces, démographie des populations)13,14,15 des écosystèmes benthiques. De plus, comme cette méthode est relativement peu coûteuse, rapide et reproductible, elle peut être utilisée par les scientifiques et les non-scientifiques pour recueillir des informations précieuses et objectives sur ces écosystèmes. Par conséquent, cette méthode est une technique viable à utiliser dans les projets de science citoyenne où la normalisation de l’effort d’échantillonnage, la minimisation des biais, l’engagement des participants et la facilité de formation sont essentiels à la qualité des données et au succès global16,17.
Cet article fournit un protocole détaillé pour la réalisation de relevés SfM sous-marins. Simultanément, l’utilisation d’un appareil photo reflex numérique a été comparée à celle d’une « caméra d’action » plus rentable, et les avantages et les inconvénients relatifs de chacun sont décrits. L’objectif global est de familiariser les scientifiques et les non-scientifiques avec les méthodes d’enquête SfM benthique aussi rapidement que possible en fournissant un protocole simple et couramment utilisé, ce qui favorise à son tour l’utilisation de cette méthode plus largement. Pour des exemples d’études qui ont appliqué des variations de cette méthode pour étudier les communautés écologiques sous-marines, voir Burns et al. (2015)4, Storlazzi et al. (2016)18, Ventura et al. (2016 et 2018)19,20, Edwards et al. (2017)14, George et al. (2018)21, Anelli et al. (2019)22, et Torres-Pulliza et al. (2020)10.
La méthode décrite ici nécessite une équipe de plongée avec tuba ou de plongée sous-marine pour deux personnes. Une fois le site d’étude sélectionné, une bobine de ligne (Figure 1A) est placée au centre du site, et les tuiles d’étalonnage (Figure 1B) sont distribuées à ~2 m du centre. Une personne (le nageur) nage avec la caméra et capture des images du site, tandis que la deuxième personne (l’assistant) s’occupe de la bobine au centre de la parcelle (Figure 1C). Tout d’abord, le nageur connecte la caméra à la bobine via la ligne, puis commence à prendre des photos continues du benthos tout en nageant face contre terre et en avant pour dérouler la ligne de la bobine. Le nageur doit maintenir une distance verticale de ~1 m au-dessus du substrat en tout temps, en ajustant sa position pour correspondre à celle de la topographie pendant qu’il nage. Il est important de noter que la ligne reliant la bobine et la caméra doit rester tendue en tout temps pour créer un espacement uniforme dans la spirale pendant que le nageur surveille la parcelle. L’assistant maintient la bobine dans une position stable et verticale et veille à ce que la bobine ne tourne pas et que la ligne ne s’emmêle pas.
Une fois la ligne complètement déroulée, le nageur s’arrête, tourne et nage dans la direction opposée pour reculer la ligne autour de la bobine. Lorsque le nageur change de direction, l’assistant tourne la bobine pour enrouler la ligne, exactement 180° pour éviter le chevauchement exact de la trajectoire sortante. Une fois que le nageur est aussi près du centre que possible, la caméra est détachée de la ligne, et l’assistant prend la bobine et la ligne et nage loin de la partie centrale du site. Le nageur termine ensuite d’imager le centre de l’intrigue en déplaçant la caméra dans une petite spirale au-dessus du centre. Bien qu’il existe plusieurs façons d’imager efficacement une zone, la méthode de bobine et de ligne décrite ici est robuste, même dans des conditions environnementales non idéales où des eaux de surface agitées, une houle ou une faible visibilité pourraient autrement entraver la collecte de données. Dans ces scénarios, cette méthode maintient les plongeurs / plongeurs attachés et assure un chevauchement élevé des images en gardant le nageur sur une trajectoire contrôlée.
1. Matériaux
2. Méthodes détaillées
3. Nettoyez le site.
Dans cet exemple, le site de récif 2_7 situé sur le récif Patch Reef 13 dans la baie de Kāneʻohe, Oʻahu, Hawaii, a été photographié, et 3 125 photos JPEG du reflex numérique et 3 125 captures d’images JPEG de la vidéo de la caméra d’action (tableau 1) ont été utilisées comme entrée pour créer les orthomosaïques et les modèles 3D. Le flux de travail général comprenait 5 étapes: 1) alignement des photos pour générer le nuage de points clairsemé, 2) mise à l’échelle du nuage de points clairsemé et optimisation des caméras, 3) construction du nuage de points dense (des cartes de profondeur ont également été générées au cours de cette étape), 4) construction du modèle numérique d’élévation (MNE) et de l’orthomosaïque, et 5) génération du modèle 3D et de la texture. Notez que les étapes 4 et 5 ne doivent pas nécessairement être effectuées dans cet ordre, mais elles doivent être effectuées après le traitement des nuages de points denses et des cartes de profondeur. Le géoréférencement des modèles doit avoir lieu avant la génération de l’orthomosaïque et du DEM. Les paramètres utilisés pour ces étapes et les détails du traitement sont décrits dans le tableau 2 et le tableau des matériaux, respectivement.
Pour des méthodes plus détaillées sur la façon de générer des modèles 3D et des orthomosaïques, voir le Matériel supplémentaire et Suka et al.23. Le temps de traitement était plus court pour le modèle dérivé de la caméra d’action pour chaque étape, y compris la génération de nuages de points clairsemés, la génération de nuages de points denses, le rendu du modèle maillé et le rendu du modèle texturé. Cela a conduit à un temps de traitement global nettement plus rapide pour le modèle de caméra d’action (6 h 39 min) que pour le modèle DSLR (9 h 14 min). Le temps exact de traitement du modèle varie en fonction de la puissance de calcul et des configurations matérielles spécifiques.
Le modèle généré à l’aide d’images de l’appareil photo reflex numérique contenait 2 848 358 points de nuage clairsemés et 787 450 347 points de nuages denses, tandis que le modèle généré à partir des images de la caméra d’action ne contenait que 2 630 543 points de nuage clairsemés et 225 835 648 points de nuage denses. Cela a conduit à ce que les modèles DSLR aient plus de 2 fois la résolution des caméras d’action que les modèles de caméras d’action avec des résolutions orthomosaïques de 0,442 et 0,208 mm / pixel pour les modèles dérivés des reflex numériques et des caméras d’action, respectivement (Tableau 1). Malgré la meilleure résolution du modèle reflex numérique par rapport au modèle de caméra d’action, les deux méthodes ont permis de produire des modèles de haute qualité avec peu de différence dans la représentation visuelle lorsque la zone de récif de ~113 m 2 était représentée sous la forme d’un modèle numérique d’élévation de 20 cm 2 (panneaux supérieurs de la figure 2) ou d’une projection orthomosaïque 2D (panneaux intermédiaires de la figure 2).
Figure 1 : Photogrammétrie de la structure à partir du mouvement. (A) Exemple d’un gréement de bobine pour contrôler la distance du nageur avec une poignée et une perche attachées pour un positionnement et une manipulation précis. (B) Carreaux d’étalonnage. (C) Un schéma du sentier de nage avec les positions relatives du nageur (vert) et de l’assistant (orange). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 2 : Comparaison visuelle des modèles numériques d’élévation et des orthomosaïques. Modèles numériques d’élévation (en haut) et orthomosaïques (au milieu) construits à partir d’images de reflex numériques (à gauche) et de caméras d’action (à droite). Le panneau inférieur est un zoom des zones dans les boîtes blanches dans les orthomosaïques. Les échelles de carte thermique dans le panneau supérieur représentent la distance de la surface de l’eau en mètres (m). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Canon EOS Rebel SL3 | GoPro Hero 7 | |
Coût | ||
Caméra | ~$600.00 | ~220,00 $US |
Boîtier sous-marin | ~1 700,00 $US | NA |
Coût total | ~2 300,00 $ | ~220,00 $US |
Photos | ||
Format de fichier photo | .jpeg | .jpeg |
Résolution photo | 24 mégapixels | 12 mégapixels (à partir d’une vidéo 4K) |
Photos alignées / nombre total de photos | 3125 / 3125 | 3125 / 3125 |
Mesures de photogrammétrie | ||
Points de nuage clairsemés | 2,848,358 | 2,630,543 |
Points nuageux denses | 787,450,347 | 225,835,648 |
Visages (modèle 3D) | 11,919,451 | 3,834,651 |
Résolution du modèle numérique d’élévation (MNE) | 0,831 mm/pixel | 1,77 mm/pixel |
Résolution orthomosaïque | 0,208 mm/pixel | 0,442 mm/pixel |
Délais de traitement | ||
Génération de cloud clairsemée | 1 h 23 min | 1 h 27 min |
Génération de nuages denses | 4 h | 3 h 11 min |
Rendu du modèle de maillage | 3 h 32 min | 1 h 49 min |
Rendu de texture | 19 min | 12 min |
Temps total de traitement informatique | 9 h 14 min | 6 h 39 min |
Tableau 1 : Informations détaillées sur le coût d’installation, les photos utilisées pour construire les modèles, les mesures de photogrammétrie et le temps de traitement. Le traitement a été effectué en utilisant les mêmes paramètres pour les deux modèles. Notez que le temps de traitement n’inclut pas le temps pour les différentes étapes telles que la retouche photo, l’extraction d’images à partir d’une vidéo, le réalignement des photos, ainsi que la modification et la mise à l’échelle des modèles.
Canon EOS Rebel SL3 | GoPro Hero 7 | |
Images | ||
Taille moyenne du fichier | ~ 8,3 Mo | ~ 4,7 Mo |
Acquisition de photos | Mode continu | Extrait de la vidéo 4K |
Correction des couleurs | Manuelle | Manuelle |
Correction de l’objectif | Non | Oui |
Paramètres du processus de photogrammétrie | ||
Génération de cloud clairsemée | Précision: Haute | Précision: Haute |
Point clé : 40 000 | Point clé : 40 000 | |
Point d’égalité : 4 000 | Point d’égalité : 4 000 | |
Présélection générique: Oui | Présélection générique: Oui | |
Génération de nuages denses | Qualité moyenne | Qualité moyenne |
Génération de modèles maillés 3D | ||
Données sources : | Cartes de profondeur | Cartes de profondeur |
Qualité: | Douleur moyenne | Douleur moyenne |
Nombre de visages : | Bas | Bas |
Interpolation: | Activé | Activé |
Calculer les couleurs de sommets : | Oui | Oui |
Génération de textures 3D | ||
Type de texture : | Carte diffuse | Carte diffuse |
Données sources : | Images | Images |
Mode de mappage : | Générique | Générique |
Mode de mélange : | Mosaïque | Mosaïque |
Taille/nombre de textures : | 4096 / 1 | 4096 / 1 |
Modèle numérique d’élévation (MNE) | À partir d’un nuage dense | À partir d’un nuage dense |
Orthomosaïque | De DEM | De DEM |
Tableau 2 : Informations détaillées sur les images collectées et le traitement photogrammétrique. Le traitement a été effectué en utilisant les mêmes paramètres pour les deux modèles.
Matériel supplémentaire. Veuillez cliquer ici pour télécharger ce fichier.
Cette étude démontre que l’appareil photo reflex numérique et la caméra d’action produisent des modèles avec une résolution supérieure à 0,5 mm / pixel en moins de 10 heures de temps de traitement sur un ordinateur de bureau standard. Le principal compromis entre le reflex numérique et la caméra d’action, outre le coût, est une résolution plus fine par rapport à un temps de traitement plus rapide, respectivement. Cependant, les temps de traitement rapportés n’incluent que le traitement informatique. Ainsi, bien que le temps de calcul soit inférieur pour la caméra d’action, il y a une quantité importante de temps (10-20 min) investie dans l’extraction d’images à partir des vidéos qui n’est pas nécessaire avec le reflex numérique. Une alternative consiste à utiliser la caméra d’action en mode de prise de vue continue pour éviter l’extraction d’images. Le mode de prise de vue en continu n’a pas été utilisé dans cet exemple, car la caméra d’action ne peut filmer qu’à 2 ips, ce qui nécessite une vitesse de nage nettement plus lente pour collecter suffisamment d’images pour construire un modèle complet. À cet égard, il existe un compromis entre un temps plus long sur le terrain en utilisant le mode de prise de vue en continu et un temps plus long sur l’ordinateur, l’extraction d’images, lors de l’utilisation du mode vidéo.
Les avantages de la caméra d’action comprennent l’abordabilité et la facilité de transport et d’utilisation sous l’eau. Le principal avantage du reflex numérique est qu’il produit des images de plus haute résolution; Par conséquent, les appareils photo reflex numériques sont recommandés par rapport aux appareils photo d’action lorsque le premier n’est pas prohibitif. Les types de questions qu’une étude cherche à aborder seront également importants pour déterminer la méthode utilisée. Par exemple, une caméra d’action pourrait être préférable dans des environnements relativement homogènes (p. ex. herbiers marins, habitats de coraux et de gravats morts) ou où seules des mesures communautaires générales (telles que l’abondance, la diversité) sont évaluées sur de grandes échelles spatiales. Cependant, un appareil photo reflex numérique peut être déployé dans les cas où le suivi des changements à petite échelle dans des organismes ou des substrats individuels est intéressant.
Comme il s’agit d’une méthode de terrain, les résultats du modèle dépendront de divers facteurs environnementaux tels que l’éclairage, la clarté de l’eau, les conditions de surface, la quantité de surtension et le mouvement des poissons ou des structures benthiques non stationnaires (p. ex. herbiers marins). Bien qu’il n’y ait pas de seuil absolu indiquant quand il est approprié d’utiliser cette méthode, les jours légèrement nuageux avec une clarté d’eau élevée, des conditions de surface calmes et peu de surtension produisent généralement les meilleurs modèles. De plus, il y a une limite à la profondeur minimale requise pour ces méthodes. Ces méthodes ne fonctionnent pas bien dans des conditions où il y a moins de 0,5 m d’eau en raison du faible chevauchement entre les photos et du moins grand nombre d’éléments distinctifs par photo. Cependant, cela met en évidence un autre avantage de la caméra d’action, à savoir qu’elles sont plus petites et donc plus faciles à utiliser à des profondeurs moins profondes. De plus, une bobine de plus petit diamètre et une fréquence d’images plus élevée (ou un objectif grand angle) peuvent améliorer le chevauchement de l’image dans des conditions très peu profondes9.
De nombreux autres types de données peuvent être intégrés à cette approche. Par exemple, les orthomosaïques ont été utilisées pour montrer la densité spatiale des données moléculaires (par exemple, les gènes et les métabolites) sur les coraux 24 et les humains 25 en utilisant le logiciel open source 'ili'26. La même plate-forme pourrait également être utilisée pour cartographier les densités spatiales des animaux, des micro-organismes, des virus et / ou des produits chimiques dans l’environnement. D’autres exemples ont utilisé SfM pour annoter spatialement les espèces benthiques sur des orthomosaïques à l’aide d’un logiciel de système d’information géographique10. De plus, les modèles 3D générés par SfM peuvent être utilisés pour estimer les caractéristiques de l’habitat telles que la rugosité et la dimension fractale. En effet, les méthodes décrites ici ont été récemment utilisées pour dériver une nouvelle théorie géométrique des surfaces d’habitat10. Enfin, les orthomosaïques sont utilisées comme surfaces d’entrée pour des modèles de calcul spatialement explicites, ce qui permet de superposer des simulations dynamiques sur la surface 3D du modèle. Pouvoir générer facilement de grandes images et des représentations 3D d’habitats benthiques a permis aux scientifiques marins de répondre à des questions jusqu’alors inimaginables3.
Dans l’ensemble, voici un protocole détaillé pour effectuer une photogrammétrie SfM sous-marine avec des appareils photo reflex numériques ou des caméras d’action plus rentables. Ces méthodes peuvent être utilisées par les scientifiques à des fins très diverses, allant de l’extraction de données sur les écosystèmes benthiques au développement de surfaces d’entrée 3D pour des simulations in silico . Cependant, ces protocoles peuvent également être utilisés par des non-scientifiques dans le cadre des efforts de science citoyenne pour recueillir des informations précieuses sur les modèles de biodiversité, la complexité de l’habitat, la structure des communautés et d’autres paramètres écologiques.
Les auteurs n’ont pas d’intérêts financiers concurrents ou d’autres conflits d’intérêts.
Nous remercions la Fondation de la famille Paul G. Allen d’avoir financé cette recherche et sommes reconnaissants à Ruth Gates pour l’inspiration d’utiliser la technologie pour aider à conserver les récifs. Nous remercions également la NOAA et d’autres collaborateurs pour leur discussion réfléchie concernant ces méthodes. Enfin, nous remercions Catie Foley et Patrick Nichols d’avoir fourni le drone et la vidéo sous-marine de ces méthodes.
Nous reconnaissons la National Fish and Wildlife Foundation comme partenaire financier dans ce travail.
Name | Company | Catalog Number | Comments |
Action camera (GoPro Hero7 Black) | GoPro | Could be any waterproof action camera | |
Adobe Lightroom | Adobe | Color correction | |
Calibration tiles ( flat PVC board cut to size for Agisoft targets. Attach a dive weight underneath if expecting waves) | Any negatively buoyant object of known size and color. We recommend using the scale marker templates available from Agisoft Metashape software (v.1.6.0). | ||
DSLR camera (Canon EOS Rebel SL3 ) | Canon | 3453C002AA | Could be any DSLR camera in a underwater housing |
Line (plastic clothes line filament) | Any negatively buoyant line that is strong enough to withstand field use | ||
Micro SDXC memory card (for GoPro) | |||
Oceanic Veo 2.0 | Oceanic | Digital depth gauge | |
SDXC memory card (for DSLR) | Any SDXC memory card should work, so long as there is enough space to hold all the pictures necessary to build the model | ||
Spool (2 inch-long section of 8 inch diameter PVC pipe which was attached to a 3 feet section of 1 inch PVC pipe to form the stem | Any negatively buoyant, round object of the desired diameter | ||
Underwater camera housing for DSLR (Ikelite 200DLM/C Underwater TTL Housing) | Ikelite | 6970.09 | Should be the specific water housing for the DSLR make and model |
Windows 10 desktop computer with an Intel i9-9900K 8-core CPU, two Nvidia GeForceRTX 2070 SUPER GPUs, and 128 GB of RAM. | Processing |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon