Abstract
A necessidade de informações acerca das dinâmicas de uso da terra tornou estudos relacionados à classificação de uso e cobertura da terra na região Amazônica relevantes no campo científico, com destaque ao uso de classificadores supervisionados. No entanto, o desempenho de um classificador supervisionado é dependente dos dados de entrada utilizados (imagem a ser classificada, definição das classes e coleta de amostras de treinamento), que em muitos estudos não são propriamente avaliados. Para contribuir com o entendimento de como variações nos dados de entrada afetam os resultados da classificação supervisionada, este estudo analisou os resultados de classificações de cobertura da terra em uma região da Amazônia brasileira, considerando diferentes métodos de classificação baseados em pixel, legendas com distintos níveis de detalhe (número de classes) e a sensibilidade dos classificadores à variação das amostras de treinamento (Incerteza) com o uso de uma imagem ótica de média resolução. Para tanto, foram geradas 100 imagens classificadas para três legendas com diferentes níveis de detalhe e diferentes configurações de quatro algoritmos de classificação supervisionados: Máxima Verossimilhança (ML), Máquina de Vetores Suporte (SVM), Ãrvore de Decisão (J48) e k-Vizinhos mais Próximos (K-NN). No total, foram obtidos 111 (3 níveis de legenda x 37 configurações de classificadores) grupos de 100 imagens classificadas, que foram utilizados para gerar imagens combinadas em que cada pixel recebe o rótulo mais frequente nesses grupos de imagens (moda) e mapas da Incerteza associada. De forma geral, a combinação de imagens retornou uma imagem classificada de igual ou maior exatidão que imagens que a compõem, com diferenças menos expressivas em função dos classificador utilizado que ao se considerar os grupos de 100 imagens classificadas, embora a diferença no valor de exatidão seja pequena. A maioria das imagens classificadas mais acuradas foram obtidas utilizando alguma configuração do algoritmo K-NN. No entanto, esse algoritmo apresentou maiores valores de Incerteza quando comparado a ML e SVM. Essa maior variabilidade (maiores valores de Incerteza), em compensação, colabora para a obtenção de melhores resultados da operação da moda, pois permite reclassificar adequadamente pixels de classificação instável. O algoritmo ML apresentou resultados mais consistentes (variam pouco em relação ao conjunto de amostras de treinamento), adequadamente acurados e possui utilização mais simples, já que a etapa de ajuste de parâmetros não é necessária. Quanto menor o nível de detalhe da legenda, maior a exatidão das imagens classificadas e menor sensibilidade das imagens classificadas à variação das amostras de treinamento (Incerteza). A diminuição do nível de detalhe da legenda resulta também em diferenças menos sutis na exatidão das imagens classificadas por diferentes algoritmos na configuração ótima.