Method Article
We demonstrate the utility of remotely sensed data and the newly developed Software for Assisted Habitat Modeling (SAHM) in predicting invasive species occurrence on the landscape. An ensemble of predictive models produced highly accurate maps of tamarisk (Tamarix spp.) invasion in Southeastern Colorado, USA when assessed with subsequent field validations.
A detecção precoce de espécies de plantas invasoras é vital para a gestão dos recursos naturais ea protecção dos processos dos ecossistemas. O uso de sensoriamento remoto por satélite para mapear a distribuição de plantas invasoras é cada vez mais comum, os métodos de software de imagem e classificação no entanto convencionais foram mostrados para não ser confiáveis. Neste estudo, testar e avaliar o uso de cinco espécies de distribuição técnicas de ajuste do modelo com dados de satélite de sensoriamento remoto para mapear tamarisk invasiva (Tamarix spp.) Ao longo do rio Arkansas em Southeastern Colorado. Os modelos testados incluídos impulsionado árvores de regressão (BRT), Aleatório Florestais (RF), ranhuras de regressão multivariada adaptativos (MARS), modelo linear generalizado (GLM) e Maxent. Estas análises foram realizadas utilizando um pacote de software recentemente desenvolvido chamado de Software para Assisted Habitat Modeling (SAHM). Todos os modelos foram treinados com 499 pontos de presença, 10.000 pontos pseudo-ausência e variáveis de previsão acquIred do sensor Landsat 5 Thematic Mapper (TM) ao longo de um período de oito meses para distinguir tamarisk de mata ciliar nativa usando detecção de diferenças fenológicas. A partir das imagens Landsat, usamos bandas individuais e calculados Diferença Normalizada Índice de Vegetação (NDVI), índice de vegetação ajustado ao solo (SAVI) e transformações tampado borlas. Todos os cinco modelos identificados distribuição tamarisk atual sobre a paisagem baseada com sucesso no limiar independente e métricas de avaliação dependentes de limiar com dados de localização independentes. Para explicar as diferenças específicas do modelo, que produziu um conjunto de todos os cinco modelos com saída mapa destacando as áreas de acordo e áreas de incerteza. Nossos resultados demonstram a utilidade de modelos de distribuição de espécies na análise de dados de sensoriamento remoto e o utilitário de mapeamento de conjunto, e mostrar a capacidade de SAHM no pré-processamento e execução de múltiplos modelos complexos.
Ecossistemas ribeirinhos e das zonas húmidas em todo o sudoeste dos Estados Unidos estão sendo ameaçados pela invasão de tamarisk (Tamarix spp.), Um arbusto lenhoso não-nativo introduzido a partir de Eurasia em 1800 1. Tamargueira tem muitos mecanismos fisiológicos que permitem que o género de explorar os recursos hídricos, a concorrência espécies nativas, e alterar ecossistema processa 1-2. distribuições mapeamento tamarisk para avaliação de impactos ambientais e formulação de estratégias de controlo eficazes são altas prioridades para os gestores de recursos. Embora levantamentos de solo permanecem usado regularmente, eles são impraticáveis para extremamente grandes áreas devido aos custos associados de mão de obra, tempo e logística.
sensoriamento remoto por satélite tem desempenhado um papel importante, mas limitado, o papel na detecção e mapeamento de infestações tamargueira. Classificação convencional análises e software de sensoriamento remoto têm tido sucesso marginal 3-5. Vários estudos recentesexploraram abordagens não-tradicionais para detectar plantas invasoras utilizando 1,6 de dados de sensoriamento remoto. Tamargueira, como muitas plantas invasoras, apresenta variação fenológico durante todo o período de crescimento que difere da fenologia das espécies ribeirinhas nativas. Em algumas áreas, por exemplo, tamarisk folha-out até algumas plantas ribeirinhas nativas e tamarisk mantém a sua folhagem mais tempo do que outras espécies nativas. Usando bandas espectrais e índices espectrais derivados de uma série temporal de dados de satélite em toda a estação de crescimento, podemos distinguir tamarisk de plantas nativas com base nessas diferenças fenológicas 1,6. Com base no trabalho de Evangelista et al. 2009 1, neste estudo nós incorporamos bandas individuais 1-7 de um tempo-série de Landsat 5 Thematic Mapper (TM) imagens de satélite e derivados normalizados índice de vegetação por diferença (NDVI), ajustado ao solo índice de vegetação (SAVI), e tampão tasseled transformações destas bandas. differen normalizadaíndice de ce vegetação (NDVI) é um dos índices mais comumente utilizado para a estimativa espectral biomassa vegetal, copado, e área foliar índices de 8-9, e é uma transformação não linear do rácio entre o visível (vermelho) e quase- 10 bandas de infravermelho. Ajustados ao solo índice de vegetação (SAVI) é um NDVI modificado usado para minimizar os efeitos do fundo do solo sobre índices de vegetação 11. transformações cap borlas são ponderados compósitos das seis bandas do Landsat em três bandas ortogonais que medem o brilho do solo (cap tasseled, faixa 1), verdor da vegetação (cap tasseled, faixa 2), e umidade do solo / vegetação (cap tasseled, faixa 3) e são muitas vezes utilizados para distinguir composição da vegetação, classe de idade, e estruturar 12-14. Foram utilizados os coeficientes relatados na Crist (1985) 15 para todas as transformações cap borlas.
Neste estudo, nós testamos cinco modelos de distribuição de espécies com um tempo-série de bandas espectrais e vegíndices etation derivados do Landsat 5 TM para mapear tamarisk ao longo do baixo rio Arkansas, no sudeste do Colorado, EUA. O rio Arkansas, que mede 2.364 km (1.469 mi), é o segundo maior afluente no sistema de Missouri-Mississippi. Sua bacia hidrográfica abrange 435.123 km 2 (168.002 mi 2), com cabeceiras nas Montanhas Rochosas do Colorado. Desde sua origem em 2965 m, o Arkansas cai consideravelmente em elevação, nivelamento para fora perto Pueblo, CO, e sinuoso através das terras agrícolas e de curto grama de pradaria. O rio está sujeita a inundações sazonais e é invocado para o uso da água municipal e agrícola em Rocky Ford, La Junta, e Lamar, antes de continuar em Kansas, Oklahoma e Arkansas, onde ele deságua no rio Mississippi. Tamargueira foi observada pela primeira vez no Rio Arkansas por R. Niedrach em 1913 perto da cidade atual de Lamar 16. Hoje, estima-se que tamarisk abrange mais de 100 km 2 entre Pueblo e do estado de Kansas line, com um adicional de 60 km 2 ao longo dos afluentes do rio Arkansas 17. A área de estudo inclui valas de irrigação, pântanos, terras agrícolas e as confluências de vários afluentes; todos com diferentes graus de infestação tamarisk. A pecuária ea agricultura são a principal terra-usa adjacente aos corredores ripários que consistem amplamente de alfafa, feno, milho e trigo de inverno.
Modelos de distribuição de espécies dependem de ocorrências geo-referenciados (ou seja, latitude, longitude) para identificar relações entre a ocorrência de uma espécie e seu ambiente 18. Os dados ambientais podem incluir a detecção remota múltipla e outras camadas espaciais. Os cinco modelos de distribuição de espécies testadas incluem árvores impulsionaram regressão (BRT) 19, florestas aleatórias (RF) 20, as ranhuras de regressão multivariada adaptativos (MARS) 21, um modelo generalizado linear (GLM) 22, e Maxent 23. Estes cinco model algoritmos estão entre os mais vulgarmente empregues para a modelação de distribuição de espécies e um número de estudos demonstraram a sua eficácia 24-25. Utilizou-se o Software for Assisted Habitat Modeling (SAHM) v. Módulos 2.0 para executar os cinco modelos, que estão contidos no VisTrails v.2.2.2 26 visualização e software de processamento. Existem várias vantagens de usar SAHM para modelagem comparativa. Além da formalização e registro tratável de processos de modelagem, SAHM permite aos usuários trabalhar com vários algoritmos de modelo de distribuição de espécies que, individualmente, possuem interfaces diferentes, software e arquivo de formatação 27. SAHM produz métricas de avaliação limiar independentes e dependentes do limiar consistentes para avaliar o desempenho do modelo. Uma delas é a Área Sob a Curva Receiver Operating Characteristic (AUC), uma métrica independente limiar que avalia a capacidade de um modelo para discriminar a presença de fundo 28. Uma AUC value de 0,5 ou menos indica previsões do modelo não são melhores ou piores do que aleatório; valores entre 0,5 e 0,70 indicam mau desempenho; e valores crescentes 0,70-1,0 indicam progressivamente maior desempenho. Outra métrica é por cento corretamente classificados (PCC), uma métrica dependente limite que pesa sensibilidade e especificidade com base em um limite definido pelo usuário métrica; sensibilidade mede a percentagem de presenças observados classificada como adequada e especificidade mede a percentagem de locais fundo classificada como inadequada. No entanto, outra métrica é Statistic Habilidade True (TSS = sensibilidade + especificidade - 1), o que coloca mais peso sobre a sensibilidade do modelo de especificidade, com valores variando entre -1 e 1, onde valores> 0 indicam um melhor desempenho do modelo que o acaso 29.
Para mapear tamarisk usando a saída do modelo, construímos classificações binárias usando o limiar que equaliza sensibilidade e especificidade para definir o pRESENÇA ou ausência de tamarisk. Estes mapas modelo individual derivados foram então somados para criar um mapa de conjunto 30. mapas Ensemble combinar as previsões de modelos de distribuição de espécies individuais para produzir um mapa classificado que classifica o acordo coletivo dos modelos testados. Por exemplo, um valor de uma célula de um conjunto indica que apenas um modelo classificadas como células que habitat apropriado, ao passo que um valor de cinco indica que todos os cinco modelos classificada a célula como habitat apropriado. Uma vantagem dessa abordagem é que os mapas do conjunto produzir um erro inferior significa que qualquer modelo individual. Ele também permite aos usuários comparar visualmente o desempenho de cada modelo testado. Nosso principal objetivo foi o de fornecer uma descrição detalhada destes métodos que podem ser adaptados para modelar a distribuição atual das espécies na paisagem.
1. Recolha de Dados Campo
2. Variáveis Predictor
Figura 1. Sensoriamento Remoto Índices Derivação Ferramenta GUI.
3. Software para Assisted Habitat Modeling (SAHM) (Figura 2)
Figura 2. Todo o fluxo de trabalho SAHM inclui dados de entrada, pré-processamento, análise do modelo preliminar e decisão, modelos correlativos, e rotinas de saída.
jpg "/>
Figura 3. correlação de covariáveis e seleção de interface SAHM.
Figura 4. VisTrails planilhas pode ser usado para avaliar a saída do modelo. Isto éa comparação dos modelos AUC para os dados de formação; da esquerda para a direita, os modelos são BRT, GLM, MARS, RF, e Maxent, respectivamente.
avaliações estatísticas de BRT, RF, MARS, GLM e Maxent com base no conjunto de dados de teste independente indicado todos os cinco modelos de desempenho relativamente bom na detecção tamarisk; houve pouca diferença entre as métricas independentes e avaliação dependentes limite de limiar entre os modelos. Os valores da AUC foram> 0,88, por cento valores corretamente classificados foram> 77%, sensibilidade e especificidade foram> 0,77, e TSS foram> 0,54 (Tabela 1). Um conjunto de saídas do modelo binário revelou muito modelo de acordo em áreas ao longo do rio Arkansas (Figura 5). O MESS (superfície semelhança ambiental multivariada) mapa saídas para cada modelo indicado o ambiente disponíveis da área de estudo foi bem amostrado (Figura 6), aumentando ainda mais a nossa confiança na abordagem ensemble.
maneiras "> Modelo AUC PCC Sensibilidade especificidade TSS BRT 0,91 85 0,85 0,85 0,70 RF 0,92 85 0,85 0,85 0,70 MARS 0,90 82 0,82 0,82 0,64 GLM 0,88 77 0,77 0,77 0,54 Maxent 0,92 84 0.83 0,84 0,67Tabela 1. Threshold independente (AUC) e dependente limiar (PCC, sensibilidade, especificidade, e TSS) métricas de avaliação para BRT, RF, MARS, GLM, e os modelos MAXENT apto para um teste independente conjunto de dados de presença tamarisk e ausência.
Figura 5. Resultados Ensemble combinando BRT, GLM, MARS, RF, e mapas de saída binários MAXENT no ArcGIS. Áreas são coloridas pelo número de modelos de acordo, de 0 (sem cor) a 5 (vermelho). Observe a área colorida no canto noroeste da previsão; esta linha é um artefato de imagens Landsat; portanto, os resultados do modelo deve ser tomado com precaução nesta região. Por favor clique aqui para ver uma versão maior desta figura.
Figura 6. superfície semelhança ambiental multivariada (MESS) de saída.target = "_ blank"> Clique aqui para ver uma versão maior desta figura.
Dos nove indicadores utilizados, 30 de junho de 2006 Brilho foi a variável mais importante para todos os cinco modelos (Tabela 2). Esta foi a única variável retida pelo GLM baseado em gradual Akaike critério de informação (AIC; este é o padrão para seleção de modelos GLM em SAHM), no entanto, é importante notar que este modelo também incluiu um termo quadrado desta variável. RF e Maxent reter todas as variáveis por padrão.
Predictor | BRT | RF | MARS | GLM | Maxent |
30 de julho de 2006 Brilho | 41.60 | 34.11 | 76,78 | 100 | 67,27 |
31 de agosto de 2006 Banda 4 | 6.35 | 5,87 | 5.16 | 0 | 2,82 |
09 de junho de 2005 SAVI | 13.67 | 14.09 | 9.14 | 0 | 9.75 |
22 de abril de 2005 Brilho | 6.29 | 6,30 | 0 | 0 | 0,43 |
28 de outubro de 2004 NDVI | 5.66 | 8,25 | 0 | 0 | 2,94 |
Tabela 2. Importância relativa dos preditores em cada modelo.
Nossos resultados demonstram BRT montagem, RF, MARS, GLM e Maxent com pontos de presença para tamarisk e uma série temporal de dados de imagens de satélite Landsat de sensoriamento remoto pode distinguir tamarisk na paisagem e é uma alternativa eficaz aos métodos tradicionais de classificação da cena única. É evidente a partir nossos resultados que junho é um momento particularmente importante para a detecção de tamarisk dentro da nossa área de estudo; Isto concorda com Evangelista et al., 2009 1 que indicou junho Wetness era o mais importante preditor para a ocorrência de tamarisco nesta área com base em um modelo apto Maxent com uma série temporal de imagens Landsat.
Os outros índices e bandas espectrais que foram incluídos na BRT, RF, MARS, e os modelos MAXENT pode ainda distinguir tamarisk de substrato de solo, outras árvores de folha caduca, incluindo cottonwood (Populus spp.) E salgueiro (Salix spp.), Ou a agricultura irrigada que é comum na parte inferiorbacia do rio Arkansas. Outras camadas GIS, tais como topografia, tipo de solo, ou dados sobre o clima também pode ser considerado como co-variáveis e incluídos nesses modelos, mas recomendamos manter estes a um mínimo, se o objetivo é detectar a distribuição das espécies atuais sobre a paisagem em vez de prever o potencial ocorrência ou habitat adequado.
Os modelos testados para a nossa pesquisa fornecida forte capacidade analítica e múltiplas opções para avaliação de resultados. Tendo todos esses modelos correlativos dentro de um quadro único, como o SAHM, permite a formalização e registro tratável do processo de modelagem. Pré e pós-processamento de variáveis de resposta e de previsão são padronizados em SAHM, permitindo melhores e eficientes comparações modelo, enquanto os fluxos de trabalho registrar cada passo das análises que facilitam a modificação, iteração e replicação.
mapeamento Ensemble visa combinar os pontos fortes de vários modelos correlativos, minimizando o weakness de qualquer um modelo de 30. Acreditamos que este era o caso em nosso estudo; no entanto, que advertem que os modelos que underperform (ou seja, sub-prever ou excesso de prever) pode enfraquecer os resultados globais. O uso limitado de mapeamento conjunto na literatura teve resultados favoráveis, mas a maioria dessas abordagens têm tentado "prever" a ocorrência de espécies em vez de "detectar". Além disso, o mapeamento conjunto permite uma avaliação visual de incerteza entre os diferentes métodos de modelagem, identificando os níveis de modelo de acordo. Na maioria das vezes é a escolha do método de modelagem (por exemplo, GLM contra BRT), que tem maior impacto quantificável sobre os resultados do modelo, em vez de outras decisões no processo de modelagem, como localização incerteza de dados 31. Apesar de acreditarmos que o nosso melhor mapa tamarisk é o lugar onde todos os cinco modelos estão de acordo, mais testes e usando vários métodos de mapeamento de conjunto é recomendado (por exemplo, ponderada pela AUC) 32 </ Sup>, eo melhor validada através de observações de campo independentes. Em resumo, estes métodos podem ser facilmente adaptados para modelar a distribuição de outras espécies que utilizam variáveis ambientais derivadas de uma região de estudo dadas em SAHM.
The authors have no competing financial interests or conflict of interest.
The authors would like to thank the U.S. Geological Survey, Natural Resource Ecology Laboratory at Colorado State University, Colorado State Forest Service and the Tamarisk Coalition for logistical support, data, use of facilities and expertise. Additionally, we thank Shelly Simmons, Lane Carter, John Moore, and Chandra Reed for their contributions to this work. Thomas J. Stohlgren was partially supported by the Bioenergy Alliance Network of the Rockies (BANR), USDA UV-B Monitoring and Research Program and USDA CSREES/NRI 2008-35615-04666. Any use of trade, product, or firm names is for descriptive purposes only and does not imply endorsement by the U.S. Government.
Name | Company | Catalog Number | Comments |
Earth Explorer | USGS | http://earthexplorer.usgs.gov | Open Access: Yes |
Remote Sensing Indices Derivation Tool | github | https://github.com/rander38/Remote-Sensing-Indices-Derivation-Tool | Open Access: Yes |
Software for Assisted Habitat Modeling | USGS | https://my.usgs.gov/catalog/RAM/SAHM | Open Access: Yes |
ArcGIS v.10.3 | Esri | https://www.arcgis.com/features/ | Open Access: No |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados