ESTIMATIVAS DA ACURÁCIA DO MAPEAMENTO DA COBERTURA DA TERRA PELO PROJETO MAPBIOMAS

ACESSO AO PAINEL DE ESTATÍSTICAS DA COLEÇÃO 5.0

A análise de acurácia é a principal forma de avaliação da qualidade do mapeamento realizado pelo MapBiomas. Além de dizer qual a taxa de acerto geral, a análise de acurácia também revela estimativas das taxa de acerto e de erro para cada classe mapeada. O MapBiomas avaliou a acurácia global e para cada classe de uso e cobertura para todos os anos entre 1985 e 2022.

As estimativas da acurácia foram baseadas na avaliação de uma amostra de píxeis, que chamamos de base de dados de referência, composta por ~71.500 amostras. O número de píxeis na base de dados de referência foi pré-determinado por técnicas de amostragem estatística. Em cada ano, cada píxel da base de dados de referência foi avaliado por técnicos treinados em interpretação visual de imagens Landsat. A avaliação da acurácia foi realizada usando métricas que comparam a classe mapeada com a classe avaliada pelos técnicos na base de dados de referência.

Em cada ano, a análise de acurácia é feita a partir da tabulação cruzada das frequências amostrais das classes mapeadas e reais, no formato da Tabela 1. As frequências ni,j representam o número de píxeis na amostra classificados como classe i, e avaliados como classe j. Os totais marginais de linha representam o número de amostras mapeadas como classe i, enquanto que os totais marginais de coluna representam o número de amostras que foram avaliadas pelos técnicos como classe j. A Tabela 1 é chamada de matriz de erros ou matriz de confusão.

Tabela 1: Matriz de erros amostral genérica

Partir dos resultados da Tabela 1, as proporções amostrais em cada célula da tabela são estimadas por . A matriz de valores é então usada para gerar:

  1. As acurácias do usuário: São as estimativas das frações de píxels do mapeamento, para cada classe, corretamente classificados. A acurácia do usuário está associada ao erro de comissão, que é o erro cometido ao atribuir um pixel à classe i, quando este pertence a alguma outra classe. A acurácia do usuário para a classe i é estimada por e o erro de comissão por  . Essas métricas estão associadas a confiabilidade da de cada classe mapeada.
  2. Acurácias do produtor: São as frações amostrais de píxels de cada classe corretamente atribuídos às suas classes pelos classificadores. A acurácia do produtor está associada ao erro de omissão, que ocorre quando deixamos de mapear um pixel da classe j corretamente. A acurácia do produtor para a classe j é estimada por e o erro de omissão por . Essas métricas estão associadas à sensibilidade do classificador, ou seja, a capacidade de distinguir corretamente determinada classe entre demais.
  3. Acurácia global: É a estimativa da proporção de acerto global dos classificadores. A estimativa é dada por n, a soma da diagonal principal da matriz de proporções. O complementar da acurácia, ou o erro total ainda é decomposto em discordância de área e discordância de alocação. A discordância de área mede a fração do erro atribuída à quantidade de área atribuída incorretamente às classes pelo mapeamento, enquanto a discordância de alocação à proporção de erros de deslocamento.

A matriz também provém estimativas dos diferentes tipos de erros. Por exemplo, é possível ver através dessas a estimativa da composição de área de cada classe mapeada. Assim, além da taxa de acerto da classe mapeada como floresta, por exemplo, estimamos também qual a fração dessas áreas que podem ser pastagens ou outras classes de cobertura e uso da terra, para cada ano. Entendemos que esse nível de transparência informa os usuários e maximiza o potencial do uso do mapeamento pelos vários tipos de usuários.

1- Pontius Jr, R. G., & Millones, M. (2011). Death to Kappa: birth of quantity disagreement and allocation disagreement for accuracy assessment. International Journal of Remote Sensing, 32(15), 4407-4429.

SOBRE OS GRÁFICOS

ESTATÍSTICAS GERAIS

Mostram a acurácia total média anual e o erro decomposto em discordância de área e alocação.

Gráfico 1. Gráfico da Acurácia Total Anual:

Este gráfico mostra a acurácia total e o erro total por ano. O erro total é decomposto em discordância de área e de alocação. A acurácia é plotada na parte superior e os erros na parte inferior do gráfico.

Gráfico 2. Matriz de Erros:

Esse gráfico mostra a acurácia do usuário, do produtor, e as confusões entre classes, para cada ano. O primeiro mostra as confusões de cada classe mapeada. O segundo mostra as confusões de cada classe real.

Gráfico 3. Histórico de Classes:

Esse gráfico permite inspecionar as confusões de uma determinada classe ao longo do tempo. A acurácia do usuário e do produtor para cada classe é exibida, junto com as confusões em cada ano.

ACESSO AO PAINEL DE ESTATÍSTICAS DA COLEÇÃO 5.0