Method Article
Wir bieten ein detailliertes Protokoll für die Durchführung von Unterwasser-Structure-from-Motion-Photogrammetrie-Vermessungen zur Erstellung von 3D-Modellen und Orthomosaiken.
Die Structure-from-Motion-Photogrammetrie (SfM) ist eine Technik, die verwendet wird, um dreidimensionale (3D) Rekonstruktionen aus einer Folge von zweidimensionalen (2D) Bildern zu erzeugen. SfM-Methoden werden als nicht-invasive Methode zur Überwachung vieler Systeme immer beliebter, einschließlich anthropogener und natürlicher Landschaften, geologischer Strukturen sowie terrestrischer und aquatischer Ökosysteme. Hier wird ein detailliertes Protokoll für das Sammeln von SfM-Bildern bereitgestellt, um 3D-Modelle von benthischen Lebensräumen zu erstellen. Darüber hinaus wurden die Kosten, die Zeiteffizienz und die Ausgabequalität der Verwendung einer digitalen Spiegelreflexkamera (DSLR) im Vergleich zu einer kostengünstigeren Action-Kamera verglichen. Es wurde ein Kompromiss zwischen Rechenzeit und Auflösung beobachtet, wobei die DSLR-Kamera Modelle mit mehr als der doppelten Auflösung produzierte, aber etwa 1,4-mal länger brauchte als die Action-Kamera. Diese Einführung zielt darauf ab, eine gründliche Beschreibung der Schritte zu liefern, die notwendig sind, um SfM-Daten in benthischen Lebensräumen zu sammeln, sowohl für diejenigen, die mit der Technik nicht vertraut sind, als auch für diejenigen, die bereits ähnliche Methoden anwenden.
Ökosystemprozesse sind von Natur aus dynamisch und können schwer zu quantifizieren sein. In den letzten zehn Jahren haben neue Technologien zur Erfassung von Ökosystemen und ihrer Dynamik in einer Reihe von Skalen zugenommen, vom 3D-Laserscanning einzelner Ökosystemmerkmale bis hin zur Satellitenfernerkundung großer Gebiete 1,2,3. In benthischen Lebensräumen ist die Struktur eng mit der Ökosystemfunktion8 verbunden, was Werkzeuge, die gleichzeitig die Überwachung der Geometrie und der Gemeinschaftsstruktur ermöglichen, besonders wertvoll für das Verständnis der ökologischen Dynamik macht. Viele moderne Ansätze können jedoch aufgrund der physikalischen Eigenschaften von Wasser (z. B. Brechung, Verzerrung, Trübung) nicht in aquatischen Systemen verwendet werden. Techniken wie LiDAR (Light Detection and Ranging) und einige Luftbildvermessungsmethoden können auf großen räumlichen Skalen geeignet sein, können jedoch nicht die Auflösung erreichen, die zur Beurteilung feinskaliger Veränderungen in benthischen Lebensräumen erforderlich ist. Structure-from-Motion (SfM)-Photogrammetriemethoden wurden kürzlich angepasst, um großflächige, hochauflösende Orthomosaike und 3D-Oberflächenmodelle von Unterwasserlebensräumenzu erstellen 4,5,6,7.
Die SfM-Photogrammetrie ist eine relativ kostengünstige, einfache, nicht-invasive und wiederholbare Methode, die es ermöglicht, großflächige, hochauflösende Aufzeichnungen der benthischen Umwelt in aquatischen Ökosystemen zu erstellen9. SfM verwendet eine Sequenz von 2D-Bildern, um 3D-Modellrekonstruktionen zu erstellen. Die aus SfM generierten Modelle können verwendet werden, um Daten über die strukturelle Komplexität (z.B. Robustheit, Dimensionalität)4,5,10,11,12 und die Gemeinschaftsstruktur (z.B. Artenzusammensetzung, Populationsdemographie)13,14,15 von benthischen Ökosystemen zu sammeln. Da diese Methode relativ kostengünstig, schnell und wiederholbar ist, kann sie sowohl von Wissenschaftlern als auch von Nicht-Wissenschaftlern verwendet werden, um wertvolle, objektive Informationen über diese Ökosysteme zu sammeln. Daher ist diese Methode eine praktikable Technik für den Einsatz in Citizen Science-Projekten, bei denen die Standardisierung des Stichprobenaufwands, die Minimierung von Verzerrungen, das Engagement der Teilnehmer und die einfache Schulung für die Qualität der Daten und den Gesamterfolg von entscheidender Bedeutung sind16,17.
Dieser Artikel enthält ein detailliertes Protokoll für die Durchführung von Unterwasser-SfM-Vermessungen. Gleichzeitig wurde die Verwendung einer DSLR-Kamera mit der einer kostengünstigeren "Action-Kamera" verglichen und die relativen Vor- und Nachteile jeder einzelnen Kamera skizziert. Das übergeordnete Ziel besteht darin, Wissenschaftler und Nicht-Wissenschaftler so schnell wie möglich mit benthischen SfM-Erhebungsmethoden vertraut zu machen, indem ein einfaches, häufig verwendetes Protokoll bereitgestellt wird, das wiederum die Verwendung dieser Methode in größerem Umfang fördert. Beispiele für Studien, die Variationen dieser Methode zur Untersuchung ökologischer Unterwassergemeinschaften angewendet haben, finden Sie in Burns et al. (2015)4, Storlazzi et al. (2016)18, Ventura et al. (2016 und 2018)19,20, Edwards et al. (2017)14, George et al. (2018)21, Anelli et al. (2019)22 und Torres-Pulliza et al. (2020)10.
Die hier beschriebene Methode erfordert ein Zwei-Personen-Schnorchel- oder SCUBA-Team. Nachdem der Vermessungsort ausgewählt wurde, wird eine Schnurspule (Abbildung 1A) in der Mitte des Standorts platziert, und die Kalibrierungskacheln (Abbildung 1B) werden ~2 m von der Mitte entfernt verteilt. Eine Person (der Schwimmer) schwimmt mit der Kamera und nimmt Bilder von der Stelle auf, während die zweite Person (der Assistent) die Spule in der Mitte des Diagramms pflegt (Abbildung 1C). Zuerst verbindet der Schwimmer die Kamera über die Leine mit der Spule und beginnt dann, kontinuierliche Bilder des Benthos aufzunehmen, während er mit dem Gesicht nach unten und vorwärts schwimmt, um die Schnur von der Spule abzuwickeln. Der Schwimmer sollte jederzeit einen vertikalen Abstand von ~1 m über dem Untergrund einhalten und seine Position beim Schwimmen an die Topographie anpassen. Wichtig ist, dass die Linie, die die Spule und die Kamera verbindet, immer straff bleibt, um einen gleichmäßigen Abstand in der Spirale zu schaffen, während der Schwimmer die Parzelle überblickt. Der Assistent hält die Spule in einer stabilen, aufrechten Position und sorgt dafür, dass sich die Spule nicht dreht und sich die Schnur nicht verheddert.
Sobald die Schnur vollständig abgewickelt ist, stoppt der Schwimmer, dreht sich und schwimmt in die entgegengesetzte Richtung, um die Schnur um die Spule zurückzustoßen. Wenn der Schwimmer die Richtung wechselt, dreht der Assistent die Spule, um die Schnur genau um 180° einzuwickeln, um eine exakte Überlappung des abgehenden Weges zu verhindern. Sobald sich der Schwimmer so nah wie möglich an der Mitte befindet, wird die Kamera von der Leine gelöst, und der Assistent nimmt die Spule und die Schnur und schwimmt vom zentralen Teil der Stelle weg. Der Schwimmer beendet dann die Abbildung des Zentrums des Diagramms, indem er die Kamera in einer kleinen Spirale über das Zentrum bewegt. Es gibt zwar mehrere Möglichkeiten, ein Gebiet effektiv abzubilden, aber die hier beschriebene Spulen- und Leinenmethode ist auch unter nicht idealen Umgebungsbedingungen robust, bei denen unruhiges Oberflächenwasser, Wellengang oder schlechte Sicht die Datenerfassung behindern könnten. In diesen Szenarien hält diese Methode Schnorchler / Taucher in Verbindung und sorgt für eine hohe Überlappung der Bilder, indem der Schwimmer auf einem kontrollierten Pfad gehalten wird.
1. Materialien
2. Detaillierte Methoden
3. Bereinigen Sie die Website.
In diesem Beispiel wurde der Riffstandort 2_7 am Patch Reef 13 in der Kāneʻohe Bay, Oʻahu, Hawaiʻi, abgebildet, und 3.125 JPEG-Fotos von der DSLR und 3.125 JPEG-Frames vom Action-Kamera-Video (Tabelle 1) wurden als Eingabe verwendet, um die Orthomosaiken und 3D-Modelle zu erstellen. Der allgemeine Arbeitsablauf bestand aus 5 Phasen: 1) Ausrichtung der Fotos zur Erzeugung der spärlichen Punktwolke, 2) Skalierung der spärlichen Punktwolke und Optimierung der Kameras, 3) Aufbau der dichten Punktwolke (Tiefenkarten wurden auch in dieser Phase erstellt), 4) Erstellung des digitalen Höhenmodells (DEM) und Orthomosaik und 5) Generierung des 3D-Modells und der Textur. Beachten Sie, dass die Phasen 4 und 5 nicht unbedingt in dieser Reihenfolge durchgeführt werden müssen, sondern nach der Verarbeitung der dichten Punktwolke und der Tiefenkarten durchgeführt werden müssen. Die Georeferenzierung der Modelle sollte vor dem Generieren des Orthosaiks und des DEM erfolgen. Die für diese Phasen verwendeten Einstellungen und Verarbeitungsdetails sind in Tabelle 2 bzw. Materialtabelle aufgeführt.
Detailliertere Methoden zur Erstellung von 3D-Modellen und Orthomosaiken finden Sie im Ergänzenden Material und in Suka et al.23. Die Verarbeitungszeit für das von der Action-Kamera abgeleitete Modell war für jeden Schritt kürzer, einschließlich der Erzeugung von Punktwolken mit geringer Dichte, der Erzeugung dichter Punktwolken, des Renderns von Netzmodellen und des Renderns von strukturierten Modellen. Dies führte zu einer deutlich schnelleren Gesamtverarbeitungszeit für das Action-Kamera-Modell (6 h 39 min) als für das DSLR-Modell (9 h 14 min). Die genaue Zeit für die Modellverarbeitung hängt von der Rechenleistung und den spezifischen Hardwarekonfigurationen ab.
Das Modell, das mit Bildern der DSLR-Kamera erstellt wurde, enthielt 2.848.358 spärliche Wolkenpunkte und 787.450.347 dichte Wolkenpunkte, während das aus den Bildern der Action-Kamera generierte Modell nur 2.630.543 spärliche Wolkenpunkte und 225.835.648 dichte Wolkenpunkte enthielt. Dies führte dazu, dass die DSLR-Modelle eine mehr als 2-fache Auflösung aufwiesen als die Action-Kamera-Modelle mit Orthomosaik-Auflösungen von 0,442 bzw. 0,208 mm/Pixel für die von DSLR- und Action-Kameras abgeleiteten Modelle (Tabelle 1). Trotz der besseren Auflösung des DSLR-Modells im Vergleich zum Action-Kameramodell waren beide Methoden in der Lage, qualitativ hochwertige Modelle mit geringen Unterschieden in der visuellen Darstellung zu erzeugen, wenn die Rifffläche von ~113m2 als digitales 20 cm 2-Höhenmodell (Abbildung 2 obere Tafeln) oder 2D-Orthomosaikprojektion (Abbildung 2 mittlere Tafeln) dargestellt wurde.
Abbildung 1: Structure-from-Motion-Photogrammetrie. (A) Beispiel für ein Spulengerät zur Steuerung der Schwimmerdistanz mit einem angebrachten Griff und einer Stange zur präzisen Positionierung und Handhabung. (B) Kalibrierkacheln. (C) Ein Schema des Schwimmweges mit relativen Positionen des Schwimmers (grün) und des Assistenten (orange). Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 2: Visueller Vergleich von digitalen Höhenmodellen und Orthomosaiken. Digitale Höhenmodelle (oben) und Orthomosaike (Mitte) aus DSLR- (links) und Action-Kamera-Bildern (rechts). Das untere Feld ist ein Zoom der Bereiche in den weißen Kästchen in den Orthomosaiken. Die Heatmap-Skalen im oberen Bereich stellen die Entfernung von der Wasseroberfläche in Metern (m) dar. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Canon EOS Rebel SL3 | GoPro Hero 7 | |
Kosten | ||
Kamera | ~$600.00 | ~$220.00 |
Unterwassergehäuse | ~1.700,00 $ | NA |
Gesamtkosten | ~2.300,00 $ | ~$220.00 |
Fotos | ||
Foto-Dateiformat | .jpeg | .jpeg |
Fotoauflösung | 24 Megapixel | 12 Megapixel (aus 4K-Video) |
Ausgerichtete Fotos / Fotos insgesamt | 3125 / 3125 | 3125 / 3125 |
Photogrammetrie-Metriken | ||
Spärliche Wolkenpunkte | 2,848,358 | 2,630,543 |
Dichte Wolkenpunkte | 787,450,347 | 225,835,648 |
Gesichter (3D-Modell) | 11,919,451 | 3,834,651 |
Auflösung des digitalen Höhenmodells (DEM) | 0.831 mm/Pixel | 1.77 mm/Pixel |
Orthomosaik-Auflösung | 0,208 mm/Pixel | 0,442 mm/Pixel |
Bearbeitungszeiten | ||
Spärliche Cloud-Generierung | 1 Std. 23 Min. | 1 Std. 27 Min. |
Dichte Cloud-Generierung | 4 h | 3 Std. 11 Min. |
Rendern von Netzmodellen | 3 Std. 32 Min. | 1 Std. 49 Min. |
Textur-Rendering | 19 Minuten | 12 Minuten |
Gesamte Computerverarbeitungszeit | 9 Std. 14 Min. | 6 Std. 39 Min. |
Tabelle 1: Detaillierte Informationen zu den Einrichtungskosten, den zur Erstellung der Modelle verwendeten Fotos, den Photogrammetrie-Metriken und der Verarbeitungszeit. Die Verarbeitung erfolgte bei beiden Modellen mit den gleichen Einstellungen. Beachten Sie, dass die Verarbeitungszeit keine Zeit für verschiedene Schritte wie Fotobearbeitung, Extrahieren von Bildern aus Videos, Neuausrichten von Fotos sowie Bearbeiten und Skalieren der Modelle umfasst.
Canon EOS Rebel SL3 | GoPro Hero 7 | |
Bilder | ||
Durchschnittliche Dateigröße | ~ 8.3 MB | ~ 4.7 MB |
Fotoaufnahme | Kontinuierlicher Modus | Aus 4K-Video extrahiert |
Farbkorrektur | Manuell | Manuell |
Objektivkorrektur | Nein | Ja |
Photogrammetrie-Prozesseinstellungen | ||
Spärliche Cloud-Generierung | Genauigkeit: Hoch | Genauigkeit: Hoch |
Kernpunkt: 40.000 | Kernpunkt: 40.000 | |
Tie-Point: 4.000 | Tie-Point: 4.000 | |
Generische Vorauswahl: Ja | Generische Vorauswahl: Ja | |
Dichte Cloud-Generierung | Mittlere Qualität | Mittlere Qualität |
Erstellung von 3D-Netzmodellen | ||
Ursprungsdaten: | Tiefenkarten | Tiefenkarten |
Qualität: | Mittel | Mittel |
Anzahl der Gesichter: | Niedrig | Niedrig |
Interpolation: | Ermöglichte | Ermöglichte |
Berechnen Sie die Scheitelpunktfarben: | Ja | Ja |
3D-Textur-Generierung | ||
Textur-Typ: | Diffuse Karte | Diffuse Karte |
Ursprungsdaten: | Bilder | Bilder |
Mapping-Modus: | Generisch | Generisch |
Mischmodus: | Mosaik | Mosaik |
Texturgröße/-anzahl: | 4096 / 1 | 4096 / 1 |
Digitales Höhenmodell (DEM) | Aus der dichten Wolke | Aus der dichten Wolke |
Orthomosaik | Von DEM | Von DEM |
Tabelle 2: Detaillierte Informationen zu den gesammelten Bildern und der photogrammetrischen Verarbeitung. Die Verarbeitung erfolgte bei beiden Modellen mit den gleichen Einstellungen.
Ergänzendes Material. Bitte klicken Sie hier, um diese Datei herunterzuladen.
Diese Studie zeigt, dass sowohl die DSLR-Kamera als auch die Action-Kamera Modelle mit einer Auflösung von mehr als 0,5 mm/Pixel in weniger als 10 Stunden Verarbeitungszeit auf einem Standard-Desktop-Computer produzieren. Der größte Kompromiss zwischen DSLR und Action-Kamera ist, abgesehen von den Kosten, eine feinere Auflösung im Vergleich zu einer schnelleren Verarbeitungszeit. Die gemeldeten Verarbeitungszeiten beinhalten jedoch nur die rechnerische Verarbeitung. Obwohl die Rechenzeit für die Action-Kamera geringer ist, wird also viel Zeit (10-20 min) in die Bildextraktion aus den Videos investiert, die bei der DSLR nicht benötigt wird. Eine Alternative besteht darin, die Action-Kamera im Serienbildmodus zu verwenden, um eine Bildextraktion zu vermeiden. Der Serienbildmodus wurde in diesem Beispiel nicht verwendet, da die Action-Kamera nur mit 2 Bildern pro Sekunde aufnehmen kann, was eine deutlich langsamere Schwimmrate erfordert, um genügend Bilder zu sammeln, um ein vollständiges Modell zu erstellen. In dieser Hinsicht gibt es einen Kompromiss zwischen einer längeren Zeit im Außendienst im Serienbildmodus und einer längeren Zeit am Computer beim Extrahieren von Bildern im Videomodus.
Zu den Vorteilen der Action-Kamera gehören die Erschwinglichkeit und der einfache Transport und Betrieb unter Wasser. Der Hauptvorteil der DSLR besteht darin, dass sie Bilder mit höherer Auflösung erzeugt. Daher werden DSLR-Kameras gegenüber Action-Kameras empfohlen, wenn erstere nicht unerschwinglich sind. Die Art der Fragen, die eine Studie zu beantworten versucht, ist auch wichtig für die Bestimmung der verwendeten Methode. Zum Beispiel könnte eine Action-Kamera in Umgebungen vorzuziehen sein, die relativ homogen sind (z. B. Seegraswiesen, tote Korallen-/Schuttlebensräume) oder in denen nur allgemeine Gemeinschaftsmetriken (wie Häufigkeit, Vielfalt) über große räumliche Skalen bewertet werden. Eine DSLR-Kamera kann jedoch in Fällen eingesetzt werden, in denen es von Interesse ist, feinskalige Veränderungen in einzelnen Organismen oder Substraten zu verfolgen.
Da es sich um eine Feldmethode handelt, hängen die Modellergebnisse von verschiedenen Umweltfaktoren ab, wie z. B. Beleuchtung, Wasserklarheit, Oberflächenbedingungen, Ausmaß des Anstiegs und Bewegung von Fischen oder nicht stationären benthischen Strukturen (z. B. Seegras). Obwohl es keine absoluten Schwellenwerte gibt, wann es angemessen ist, diese Methode anzuwenden, bringen leicht bewölkte Tage mit hoher Wasserklarheit, ruhigen Oberflächenbedingungen und wenig Wellengang in der Regel die besten Modelle hervor. Darüber hinaus gibt es eine Begrenzung der Mindesttiefe, die für diese Methoden erforderlich ist. Diese Methoden funktionieren nicht gut unter Bedingungen, bei denen weniger als 0,5 m Wasser vorhanden sind, da sich die Fotos nur geringfügig überlappen und weniger Unterscheidungsmerkmale pro Foto vorhanden sind. Dies unterstreicht jedoch einen weiteren Vorteil der Action-Kamera, d.h. sie sind kleiner und damit einfacher in geringeren Tiefen zu verwenden. Darüber hinaus können eine Spule mit kleinerem Durchmesser und eine höhere Bildrate (oder ein Weitwinkelobjektiv) die Bildüberlappung bei sehr flachen Bedingungen verbessern9.
Viele andere Datentypen können mit diesem Ansatz integriert werden. Zum Beispiel wurden Orthomosaike verwendet, um die räumliche Dichte molekularer Daten (z. B. Gene und Metaboliten) auf Korallen 24 und Menschen 25 mit der Open-Source-Software "ili'26" zu zeigen. Die gleiche Plattform könnte auch verwendet werden, um die räumlichen Dichten von Tieren, Mikroorganismen, Viren und/oder Chemikalien in der Umwelt zu kartieren. Andere Beispiele haben SfM verwendet, um benthische Arten unter Verwendung der Geoinformationssystemsoftware10 räumlich auf Orthomosaiken zu annotieren. Darüber hinaus können die von SfM generierten 3D-Modelle verwendet werden, um Habitateigenschaften wie Rauheit und fraktale Dimension abzuschätzen. In der Tat wurden die hier skizzierten Methoden kürzlich verwendet, um eine neue geometrische Theorie für Lebensraumoberflächen abzuleiten10. Schließlich werden Orthomosaike als Eingabeflächen für räumlich explizite Berechnungsmodelle verwendet, so dass dynamische Simulationen auf der 3D-Oberfläche des Modells überlagert werden können. Die Möglichkeit, auf einfache Weise große Bilder und 3D-Darstellungen von benthischen Lebensräumen zu erstellen, hat es Meereswissenschaftlern ermöglicht, bisher ungeahnte Fragen zu beantworten3.
Insgesamt finden Sie hier ein detailliertes Protokoll für die Durchführung der Unterwasser-SfM-Photogrammetrie mit DSLR-Kameras oder kostengünstigeren Action-Kameras. Diese Methoden können von Wissenschaftlern für eine Vielzahl von Zwecken eingesetzt werden, von der Extraktion von Daten über benthische Ökosysteme bis hin zur Entwicklung von 3D-Eingabeoberflächen für In-silico-Simulationen . Diese Protokolle können jedoch auch von Nicht-Wissenschaftlern im Rahmen von Citizen Science-Bemühungen verwendet werden, um wertvolle Informationen über Muster der biologischen Vielfalt, die Komplexität von Lebensräumen, die Gemeinschaftsstruktur und andere ökologische Metriken zu sammeln.
Die Autoren haben keine konkurrierenden finanziellen Interessen oder andere Interessenkonflikte.
Wir danken der Paul G. Allen Family Foundation für die Finanzierung dieser Forschung und sind Ruth Gates dankbar für die Inspiration, Technologie zum Schutz der Riffe einzusetzen. Wir danken auch der NOAA und anderen Mitarbeitern für die sorgfältige Diskussion über diese Methoden. Zu guter Letzt danken wir Catie Foley und Patrick Nichols für die Bereitstellung der Drohne und des Unterwasservideos dieser Methoden.
Wir erkennen die National Fish and Wildlife Foundation als Finanzierungspartner für diese Arbeit an.
Name | Company | Catalog Number | Comments |
Action camera (GoPro Hero7 Black) | GoPro | Could be any waterproof action camera | |
Adobe Lightroom | Adobe | Color correction | |
Calibration tiles ( flat PVC board cut to size for Agisoft targets. Attach a dive weight underneath if expecting waves) | Any negatively buoyant object of known size and color. We recommend using the scale marker templates available from Agisoft Metashape software (v.1.6.0). | ||
DSLR camera (Canon EOS Rebel SL3 ) | Canon | 3453C002AA | Could be any DSLR camera in a underwater housing |
Line (plastic clothes line filament) | Any negatively buoyant line that is strong enough to withstand field use | ||
Micro SDXC memory card (for GoPro) | |||
Oceanic Veo 2.0 | Oceanic | Digital depth gauge | |
SDXC memory card (for DSLR) | Any SDXC memory card should work, so long as there is enough space to hold all the pictures necessary to build the model | ||
Spool (2 inch-long section of 8 inch diameter PVC pipe which was attached to a 3 feet section of 1 inch PVC pipe to form the stem | Any negatively buoyant, round object of the desired diameter | ||
Underwater camera housing for DSLR (Ikelite 200DLM/C Underwater TTL Housing) | Ikelite | 6970.09 | Should be the specific water housing for the DSLR make and model |
Windows 10 desktop computer with an Intel i9-9900K 8-core CPU, two Nvidia GeForceRTX 2070 SUPER GPUs, and 128 GB of RAM. | Processing |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten