Fornecemos um protocolo detalhado para a realização de levantamentos de fotogrametria subaquática estrutura-de-movimento para gerar modelos 3D e ortomosaicos.
A fotogrametria estrutura-de-movimento (SfM) é uma técnica utilizada para gerar reconstruções tridimensionais (3D) a partir de uma sequência de imagens bidimensionais (2D). Os métodos de SfM estão se tornando cada vez mais populares como uma maneira não invasiva de monitorar muitos sistemas, incluindo paisagens antropogênicas e naturais, estruturas geológicas e ecossistemas terrestres e aquáticos. Aqui, um protocolo detalhado é fornecido para coletar imagens SfM para gerar modelos 3D de habitats bentônicos. Além disso, o custo, a eficiência de tempo e a qualidade de saída do emprego de uma câmera DSLR (Digital Single Lens Reflex) versus uma câmera de ação mais barata foram comparados. Um tradeoff entre tempo computacional e resolução foi observado, com a câmera DSLR produzindo modelos com mais que o dobro de resolução, mas levando aproximadamente 1,4 vezes mais tempo para produzir do que a câmera de ação. Esta cartilha tem como objetivo fornecer uma descrição completa das etapas necessárias para coletar dados de SfM em habitats bentônicos para aqueles que não estão familiarizados com a técnica, bem como para aqueles que já usam métodos semelhantes.
Os processos ecossistêmicos são naturalmente dinâmicos e podem ser difíceis de quantificar. Na última década, houve um aumento de novas tecnologias para capturar ecossistemas e sua dinâmica em uma variedade de escalas, desde a varredura a laser 3D de características individuais do ecossistema até o sensoriamento remoto por satélite de grandes áreas 1,2,3. Em habitats bentônicos, a estrutura está intimamente ligada à função do ecossistema8, tornando ferramentas que simultaneamente permitem o monitoramento da geometria e da estrutura da comunidade especialmente valiosas para a compreensão da dinâmica ecológica. No entanto, muitas abordagens modernas não podem ser usadas em sistemas aquáticos devido às propriedades físicas da água (por exemplo, refração, distorção, turbidez). Técnicas, como o LiDAR (Light Detection and Ranging) e alguns métodos de aerolevantamento, podem ser apropriados em grandes escalas espaciais, mas não podem adquirir a resolução necessária para avaliar mudanças em escala fina em habitats bentônicos. Métodos de fotogrametria estrutura-de-movimento (SfM) foram recentemente adaptados para produzir ortomosaicos de alta resolução em larga escala e modelos de superfície 3D de habitats subaquáticos 4,5,6,7.
A fotogrametria SfM é um método relativamente barato, simples, não invasivo e repetível que permite a geração de registros em larga escala e alta resolução do ambiente bentônico em ecossistemas aquáticos9. O SfM usa uma sequência de imagens 2D para gerar reconstruções de modelos 3D. Os modelos gerados a partir da SfM podem ser usados para coletar dados sobre a complexidade estrutural (e.g., rugosidade, dimensionalidade)4,5,10,11,12 e estrutura da comunidade (e.g., composição de espécies, demografia populacional)13,14,15 dos ecossistemas bentônicos. Além disso, como esse método é relativamente barato, rápido e repetível, ele pode ser usado por cientistas e não cientistas para coletar informações valiosas e objetivas sobre esses ecossistemas. Portanto, esse método é uma técnica viável para uso em projetos de ciência cidadã onde a padronização do esforço amostral, a minimização de vieses, o engajamento dos participantes e a facilidade de treinamento são vitais para a qualidade dos dados e o sucesso geral16,17.
Este artigo fornece um protocolo detalhado para a realização de pesquisas subaquáticas de SfM. Simultaneamente, o uso de uma câmera DSLR foi comparado com o de uma "câmera de ação" mais econômica, e as vantagens e desvantagens relativas de cada uma são descritas. O objetivo geral é familiarizar cientistas e não-cientistas com métodos de pesquisa bentônica de SfM o mais rápido possível, fornecendo um protocolo simples e comumente usado, por sua vez, promovendo o uso desse método mais amplamente. Para exemplos de estudos que aplicaram variações desse método para estudar comunidades ecológicas subaquáticas, ver Burns et al (2015)4, Storlazzi et al (2016)18, Ventura et al (2016 e 2018)19,20, Edwards et al (2017)14, George et al (2018)21, Anelli et al (2019)22 e Torres-Pulliza et al (2020)10.
O método descrito aqui requer um snorkel de duas pessoas ou uma equipe de mergulho. Depois que o local de pesquisa é selecionado, um carretel de linha (Figura 1A) é colocado no centro do local, e as telhas de calibração (Figura 1B) são distribuídas ~2 m do centro. Uma pessoa (o nadador) nada com a câmera e captura imagens do local, enquanto a segunda pessoa (o assistente) cuida do carretel no centro da parcela (Figura 1C). Primeiro, o nadador conecta a câmera ao carretel através da linha e, em seguida, começa a tirar fotos contínuas dos bentos enquanto nadam de bruços e para frente para relaxar a linha do carretel. O nadador deve manter uma distância vertical de ~1 m acima do substrato em todos os momentos, ajustando sua posição para coincidir com a da topografia enquanto nada. É importante ressaltar que a linha que conecta o carretel e a câmera deve permanecer tensa o tempo todo para criar um espaçamento uniforme na espiral enquanto o nadador examina a trama. O assistente mantém o carretel em uma posição estável e ereta e garante que o carretel não gire e que a linha não fique emaranhada.
Uma vez que a linha foi completamente desenrolada, o nadador pára, vira e nada na direção oposta para recuar a linha ao redor do carretel. À medida que o nadador muda de direção, o assistente gira o carretel para enrolar a linha para dentro, exatamente 180° para evitar a sobreposição exata do caminho de saída. Uma vez que o nadador está o mais próximo possível do centro, a câmera é destacada da linha, e o assistente pega o carretel e a linha e nada para longe da parte central do local. O nadador então termina de imaginar o centro da trama movendo a câmera em uma pequena espiral sobre o centro. Embora existam várias maneiras de obter imagens de uma área de forma eficaz, o método de linha e carretel descrito aqui é robusto mesmo em condições ambientais não ideais, onde águas superficiais agitadas, ondulação ou baixa visibilidade podem impedir a coleta de dados. Nesses cenários, esse método mantém os mergulhadores/mergulhadores conectados e garante alta sobreposição de imagens, mantendo o nadador em um caminho controlado.
1. Materiais
2. Métodos detalhados
3. Limpe o local.
Neste exemplo, o Reef Site 2_7 localizado no Patch Reef 13 em Kāneʻohe Bay, Oʻahu, Hawaiʻi, foi fotografado, e 3.125 fotos JPEG da DSLR e 3.125 capturas de quadros JPEG do vídeo da câmera de ação (Tabela 1) foram usadas como entrada para criar os ortomosaicos e modelos 3D. O fluxo de trabalho geral consistiu em 5 etapas: 1) alinhamento das fotos para gerar a nuvem de pontos esparsa, 2) dimensionamento da nuvem de pontos esparsos e otimização das câmeras, 3) construção da nuvem de pontos densa (mapas de profundidade também foram gerados durante esta etapa), 4) construção do modelo digital de elevação (MDE) e ortomosaico, e 5) geração do modelo 3D e textura. Observe que os estágios 4 e 5 não precisam necessariamente ser feitos nessa ordem, mas devem ser realizados após o processamento da nuvem de pontos densos e mapas de profundidade. O georreferenciamento dos modelos deve ocorrer antes da geração do ortomosaico e do MDE. As configurações usadas para essas etapas e detalhes de processamento estão descritas na Tabela 2 e na Tabela de Materiais, respectivamente.
Para métodos mais detalhados de como gerar modelos 3D e ortomosaicos, ver o Material Suplementar e Suka et al.23. O tempo de processamento foi menor para o modelo derivado da câmera de ação para cada etapa, incluindo geração de nuvem de pontos esparsa, geração de nuvem de pontos densa, renderização de modelo de malha e renderização de modelo texturizado. Isso levou a um tempo de processamento geral significativamente mais rápido para o modelo de câmera de ação (6 h 39 min) do que o modelo DSLR (9 h 14 min). O tempo exato para o processamento do modelo varia de acordo com o poder computacional e configurações de hardware específicas.
O modelo gerado usando imagens da câmera DSLR continha 2.848.358 pontos de nuvens esparsas e 787.450.347 pontos de nuvens densas, enquanto o modelo gerado a partir das imagens da câmera de ação continha apenas 2.630.543 pontos de nuvens esparsas e 225.835.648 pontos de nuvens densas. Isso fez com que os modelos DSLR tivessem mais de 2x mais de resolução do que os modelos de câmeras de ação com resoluções ortomosaicas de 0,442 e 0,208 mm/pixel para os modelos derivados de DSLR e câmera de ação, respectivamente (Tabela 1). Apesar da melhor resolução do modelo DSLR em relação ao modelo de câmera de ação, ambos os métodos foram capazes de produzir modelos de alta qualidade com pouca diferença na representação visual quando a área de ~113m2 do recife foi representada como um modelo digital de elevação de 20 cm 2 (painéis superiores da Figura 2) ou projeção ortomosaica 2D (painéis do meio da Figura 2).
Figura 1: Fotogrametria estrutura-de-movimento. (A) Exemplo de uma plataforma de carretel para controlar a distância do nadador com uma alça e um poste acoplados para posicionamento e manuseio precisos. (B) Telhas de calibração. (C) Um esquema da trajetória de natação com posições relativas do nadador (verde) e do auxiliar (laranja). Clique aqui para ver uma versão maior desta figura.
Figura 2: Comparação visual de modelos digitais de elevação e ortomosaicos. Modelos digitais de elevação (topo) e ortomosaicos (meio) construídos a partir de imagens DSLR (esquerda) e câmera de ação (direita). O painel inferior é um zoom das áreas nas caixas brancas nos ortomosaicos. As escalas do mapa de calor no painel superior representam a distância da superfície da água em metros (m). Clique aqui para ver uma versão maior desta figura.
Canon EOS Rebel SL3 | Herói GoPro 7 | |
Custar | ||
Câmera | ~ $ 600,00 | ~$220,00 |
Alojamento subaquático | ~$1,700.00 | NA |
Custo Total | ~$2,300.00 | ~$220,00 |
Fotos | ||
Formato de arquivo de foto | .jpeg | .jpeg |
Resolução da foto | 24 Megapixels | 12 Megapixels (de vídeo 4K) |
Fotos alinhadas / total de fotos | 3125 / 3125 | 3125 / 3125 |
Métricas de fotogrametria | ||
Pontos de nuvem esparsos | 2,848,358 | 2,630,543 |
Pontos de nuvens densas | 787,450,347 | 225,835,648 |
Faces (modelo 3D) | 11,919,451 | 3,834,651 |
Resolução do modelo digital de elevação (MDE) | 0,831 mm/pixel | 1,77 mm/pixel |
Resolução ortomosaico | 0,208 mm/pixel | 0,442 mm/pixel |
Tempos de processamento | ||
Geração de nuvem esparsa | 1 h 23 min | 1 h 27 min |
Geração de nuvem densa | 4 h | 3 h 11 min |
Renderização do modelo de malha | 3 h 32 min | 1 h 49 min |
Renderização de textura | 19 minutos | 12 minutos |
Tempo total de processamento do computador | 9 h 14 min | 6 h 39 min |
Tabela 1: Informações detalhadas sobre custo de instalação, fotos usadas para construir os modelos, métricas de fotogrametria e tempo de processamento. O processamento foi feito usando as mesmas configurações para ambos os modelos. Observe que o tempo de processamento não inclui o tempo para várias etapas, como edição de fotos, extração de imagens de vídeo, realinhamento de fotos e edição e dimensionamento dos modelos.
Canon EOS Rebel SL3 | Herói GoPro 7 | |
Imagens | ||
Tamanho médio do arquivo | ~ 8,3 MB | ~ 4,7 MB |
Aquisição de fotos | Modo contínuo | Extraído do vídeo 4K |
Correção de cor | Manual | Manual |
Correção de lentes | Não | Sim |
Configurações do processo de fotogrametria | ||
Geração de nuvem esparsa | Precisão: Alta | Precisão: Alta |
Ponto chave: 40.000 | Ponto chave: 40.000 | |
Ponto de empate: 4.000 | Ponto de empate: 4.000 | |
Pré-seleção genérica: Sim | Pré-seleção genérica: Sim | |
Geração de nuvem densa | Qualidade Média | Qualidade Média |
Geração de modelos de malha 3D | ||
Dados de origem: | Mapas de Profundidade | Mapas de Profundidade |
Qualidade: | Média | Média |
Contagem de rostos: | Baixo | Baixo |
Interpolação: | Habilitado | Habilitado |
Calcular cores de vértice: | Sim | Sim |
Geração de textura 3D | ||
Tipo de textura: | Mapa difuso | Mapa difuso |
Dados de origem: | Imagens | Imagens |
Modo de mapeamento: | Genérico | Genérico |
Modo de mistura: | Mosaico | Mosaico |
Tamanho da textura/contagem: | 4096 / 1 | 4096 / 1 |
Modelo digital de elevação (MDE) | Da nuvem densa | Da nuvem densa |
Ortomosaico | Do DEM | Do DEM |
Tabela 2: Informações detalhadas sobre as imagens coletadas e processamento fotogramétrico. O processamento foi feito usando as mesmas configurações para ambos os modelos.
Material Complementar. Clique aqui para baixar este arquivo.
Este estudo demonstra que tanto a câmera DSLR quanto a câmera de ação produzem modelos com resolução superior a 0,5 mm/pixel em menos de 10 h de tempo de processamento em um computador desktop padrão. A principal compensação entre a DSLR e a câmera de ação, além do custo, é uma resolução mais fina versus um tempo de processamento mais rápido, respectivamente. No entanto, os tempos de processamento relatados incluem apenas o processamento computacional. Assim, embora o tempo computacional seja menor para a câmera de ação, há uma quantidade significativa de tempo (10-20 min) investido na extração de imagens dos vídeos que não é necessário com a DSLR. Uma alternativa é usar a câmera de ação no modo de disparo contínuo para evitar a extração de imagem. O modo de disparo contínuo não foi usado neste exemplo, pois a câmera de ação só pode fotografar a 2 fps, o que requer uma taxa de natação significativamente mais lenta para coletar imagens suficientes para construir um modelo completo. Nesse sentido, há uma compensação entre maior tempo em campo usando o modo de disparo contínuo versus maior tempo no computador, extraindo imagens, ao usar o modo de vídeo.
As vantagens da câmera de ação incluem acessibilidade e facilidade de transporte e operação debaixo d'água. A principal vantagem da DSLR é que ela produz imagens de maior resolução; portanto, as câmeras DSLR são recomendadas sobre as câmeras de ação quando a primeira não tem custo proibitivo. Os tipos de questões que um estudo procura abordar também serão importantes para determinar o método utilizado. Por exemplo, uma câmera de ação pode ser preferível em ambientes relativamente homogêneos (por exemplo, bancos de ervas marinhas, habitats de corais mortos/escombros) ou onde apenas métricas amplas da comunidade (como abundância, diversidade) estão sendo avaliadas em grandes escalas espaciais. No entanto, uma câmera DSLR pode ser implantada nos casos em que o rastreamento de mudanças em escala fina em organismos ou substratos individuais é de interesse.
Como este é um método de campo, as saídas do modelo dependerão de vários fatores ambientais, como iluminação, clareza da água, condições de superfície, quantidade de surto e movimento de peixes ou estruturas bentônicas não estacionárias (por exemplo, ervas marinhas). Embora não haja limites absolutos de quando é apropriado usar esse método, dias ligeiramente nublados com alta claridade da água, condições de superfície calmas e pouca onda normalmente produzem os melhores modelos. Além disso, há um limite para a profundidade mínima exigida para esses métodos. Esses métodos não funcionam bem em condições em que há menos de 0,5 m de água devido à baixa sobreposição entre as fotos e menos características distintivas por foto. No entanto, isso destaca outra vantagem da câmera de ação, ou seja, eles são menores e, portanto, são mais fáceis de usar em profundidades mais rasas. Além disso, um carretel de menor diâmetro e maior taxa de quadros (ou lente mais grande-angular) podem melhorar a sobreposição de imagens em condições muito rasas9.
Muitos outros tipos de dados podem ser integrados com essa abordagem. Por exemplo, ortomosaicos têm sido usados para mostrar a densidade espacial de dados moleculares (por exemplo, genes e metabólitos) em corais 24 e humanos 25 usando o software de código aberto 'ili'26. A mesma plataforma também poderia ser usada para mapear as densidades espaciais de animais, microrganismos, vírus e/ou produtos químicos no ambiente. Outros exemplos utilizaram o SfM para anotar espacialmente espécies bentônicas em ortomosaicos utilizando o software de sistema de informação geográfica10. Além disso, os modelos 3D gerados pelo SfM podem ser usados para estimar características do habitat como rugosidade e dimensão fractal. De fato, os métodos aqui descritos foram recentemente utilizados para derivar uma nova teoria geométrica para superfícies de habitat10. Finalmente, ortomosaicos estão sendo usados como superfícies de entrada para modelos computacionais espacialmente explícitos, permitindo que simulações dinâmicas sejam sobrepostas na superfície 3D do modelo. Ser capaz de gerar facilmente grandes imagens e representações 3D de habitats bentônicos permitiu que os cientistas marinhos abordassem questões até então inimagináveis3.
No geral, aqui está um protocolo detalhado para a realização de fotogrametria SfM subaquática com câmeras DSLR ou câmeras de ação mais econômicas. Esses métodos podem ser usados por cientistas para uma ampla gama de propósitos, desde a extração de dados sobre ecossistemas bentônicos até o desenvolvimento de superfícies de entrada 3D para simulações in silico . No entanto, esses protocolos também podem ser usados por não-cientistas como parte dos esforços da ciência cidadã para reunir informações valiosas sobre padrões de biodiversidade, complexidade de habitat, estrutura de comunidades e outras métricas ecológicas.
Os autores não têm interesses financeiros concorrentes ou outros conflitos de interesse.
Agradecemos à Paul G. Allen Family Foundation por financiar esta pesquisa e somos gratos a Ruth Gates pela inspiração para usar a tecnologia para ajudar a conservar os recifes. Agradecemos também à NOAA e a outros colaboradores pela discussão cuidadosa a respeito desses métodos. Por fim, agradecemos a Catie Foley e Patrick Nichols por fornecerem o drone e o vídeo subaquático desses métodos.
Reconhecemos a National Fish and Wildlife Foundation como parceira de financiamento neste trabalho.
Name | Company | Catalog Number | Comments |
Action camera (GoPro Hero7 Black) | GoPro | Could be any waterproof action camera | |
Adobe Lightroom | Adobe | Color correction | |
Calibration tiles ( flat PVC board cut to size for Agisoft targets. Attach a dive weight underneath if expecting waves) | Any negatively buoyant object of known size and color. We recommend using the scale marker templates available from Agisoft Metashape software (v.1.6.0). | ||
DSLR camera (Canon EOS Rebel SL3 ) | Canon | 3453C002AA | Could be any DSLR camera in a underwater housing |
Line (plastic clothes line filament) | Any negatively buoyant line that is strong enough to withstand field use | ||
Micro SDXC memory card (for GoPro) | |||
Oceanic Veo 2.0 | Oceanic | Digital depth gauge | |
SDXC memory card (for DSLR) | Any SDXC memory card should work, so long as there is enough space to hold all the pictures necessary to build the model | ||
Spool (2 inch-long section of 8 inch diameter PVC pipe which was attached to a 3 feet section of 1 inch PVC pipe to form the stem | Any negatively buoyant, round object of the desired diameter | ||
Underwater camera housing for DSLR (Ikelite 200DLM/C Underwater TTL Housing) | Ikelite | 6970.09 | Should be the specific water housing for the DSLR make and model |
Windows 10 desktop computer with an Intel i9-9900K 8-core CPU, two Nvidia GeForceRTX 2070 SUPER GPUs, and 128 GB of RAM. | Processing |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados