本数据集基于MCD19A2、MERRA-2、ERA5_land数据集,通过数据预处理、数据上采样、时空匹配将气溶胶光学厚度(AOD)、波长指数(AE)、气象参数等多种数据提取,将AERONET地面站点观测值作为目标真值,利用机器学习算法LightGBM训练模型,反演2018年至2022年“一带一路”沙漠地区的逐日1公里分辨率陆地沙尘气溶胶光学厚度。本次沙尘气溶胶光学厚度数据集为“一带一路”地区的沙尘研究提供基础数据。
采集时间 | 2018/01/01 - 2022/12/31 |
---|---|
采集地点 | 亚洲“一带一路”沙漠地区 |
数据量 | 588.0 GiB |
数据空间分辨率(/米) | 1° |
数据时间分辨率 | 日 |
坐标系 |
1. MCD19A2数据:从美国MODIS官方网站(https://modis.gsfc.nasa.gov//)下载。
2. MERRA-2 tavg1_2d_aer_Nx数据:从美国宇航局戈达德地球科学数据和信息服务中心(https://disc.gsfc.nasa.gov/)下载。 (该数据需要下载全球范围)
3. ERA5-Land数据:从欧洲中期天气预报中心(https://cds.climate.copernicus.eu/)下载。 (该数据需要下载东经0°-东经150°,北纬81°-南纬11°的范围)
1. 遥感数据预处理:MERRA-2(0.5°×0.625°)和ERA5-Land(0.1°×0.1)分别通过双线性插值采样至1公里分辨率,其中ERA5-Land在此之前还需通过最近邻插值填补缺失值,按照最近点像素的方式时空匹配,提取所需数据。将研究范围内的AERONET地面站点观测数据,筛选出波长指数(AE)<1 的气溶胶光学厚度(AOD)作为沙尘AOD的目标真值。
2. 反演方法:采用最终采用LightGBM模型分别训练两个模型:(1)完整模型,即各项预测因子均未缺失作为输入训练的模型(MCD19A2数据存在大量缺失,针对非缺失部分);(2)非完整模型,即MCD19A2存在数据缺失的部分,仅采用由MERRA-2、ERA5-Land数据提取的预测因子为输入训练的模型。两个模型的输出需要与经降尺度后的MERRA-2的沙尘AOD数据取均值处理,才作为最终反演结果。
参考文献:Ke G, Meng Q, Finley T, et al. Lightgbm: A highly efficient gradient boosting decision tree[J]. Advances in neural information processing systems, 2017, 30.
数据精度:取AERONET站点经匹配后未用于训练的数据作验证。平均绝对误差(MAE)为0.0515;均方根误差(RMSE)为0.0805;平均偏差(MBE)为-0.0252;相关系数(R)为0.8559;落在期望误差(EE)为81.74%。
# | 编号 | 名称 | 类型 |
1 | 2022YFF0711702-04 | 沙漠、沙尘数据融合制备技术及长时序高质量数据制备 | 国家重点研发计划 |
# | 标题 | 文件大小 |
---|---|---|
1 | AOD |
©2024 中国科学院西北生态环境资源研究院 备案号:陇ICP备2021001824号-34
兰州市东岗西路320号 730000 电话:0931-4967592, 0931-4967596