全球土地覆盖地图追踪了过去一个世纪土地利用空前的变化,为了解人类住区对环境的影响提供了重要见解。中山大学的研究人员创建了大规模遥感注释数据集,以支持对地观测研究,并为全球土地覆盖的动态监测提供新的见解。
在发表在《遥感杂志》上的研究中,该团队研究了全球土地利用/土地覆盖(LULC)如何随着工业化和城市化的进步而发生巨大变化,包括森林砍伐和洪水。
中山大学教授石谦表示:“ 我们迫切需要对土地利用和覆盖率进行高频次、高分辨率的监测,以减轻人类活动对气候和环境的影响。”
全球土地利用和覆盖率监测依赖于自动分类算法,逐像素对卫星遥感图像进行分类。数据驱动的深度学习方法从遥感图像中提取内在特征并估计每个像素的 LULC 标签。
近年来,研究人员越来越多地将一种称为语义分割的方法用于全球土地覆盖制图深度学习中的遥感图像分类任务。语义分割不是将图像作为一个整体进行分类,而是使用某些标签对每个像素或元素进行分类。
“与识别图像中的商业场景或住宅场景不同,语义分割网络可以描绘场景中每个土地对象的边界,帮助我们了解土地的使用方式,”石说。
如果没有每个像素的上下文信息,就无法实现这种高级语义理解;地理物体与周围场景紧密相连,可以为每个像素的预测提供线索。例如,飞机停泊在机场,轮船停靠在港口,红树林通常生长在海岸边。
然而,语义分割的性能受到训练数据数量和质量的限制,现有的标注数据通常在数量、质量和空间分辨率方面不足。
最重要的是,数据集通常是在区域内采样的,缺乏多样性和可变性,使得数据驱动的模型难以在全球范围内扩展。
为了解决这些缺陷,研究团队提出了一个大规模标注数据集Globe230k,用于遥感图像的语义分割。该数据集具有三个优点:
规模——Globe230k 数据集包括 232,819 张带注释的图像,具有足够的尺寸和空间分辨率;
多样性——标注图像取自全球范围内覆盖面积超过6万平方公里的地区,具有较高的变异性和多样性;
多模态特征——Globe230k 数据集不仅包含 RGB 波段,还包含地球系统研究的其他重要特征,例如植被、海拔和极化指数。
该团队在几种最先进的语义分割算法上测试了 Globe230k 数据集,发现它能够评估对表征土地覆盖至关重要的算法,包括多尺度建模、细节重建和泛化能力。
“我们相信Globe230k数据集可以支持进一步的地球观测研究,并为全球土地覆盖动态监测提供新的见解,”石说。
该数据集已公开,可作为推动全球土地覆盖制图和语义分割算法开发进一步发展的基准。
免责声明:本文由用户上传,如有侵权请联系删除!