该数据集包含 PM 的研究领域、特征重要性、空间和时间模式2.5和 PM10,以及估计年死亡率的不确定性。 在这项工作中,开发了一种基于光梯度提升机 (LightGBM) 的简单结构化、高效且稳健的模型,以融合多源数据并估计印度长期 (1980-2022) 历史每日地面 PM 浓度 (LongPMInd)。LightGBM 模型在样本外、场外和年外交叉验证 (CV) 测试中显示出良好的准确性R2值分别为 0.77、0.70 和 0.66。PM 之间的性能差距较小2.5训练和测试(delta RMSE 为 1.06、3.83 和 7.74微克 m−3) 表示过拟合风险较低。具有很强的泛化能力,可公开访问、长期、高质量的每日 PM2.5和 PM10然后重建产品(10 公里,1980-2022 年)。这表明印度在印度恒河平原 (IGP) 经历了严重的 PM 污染,尤其是在冬季。自 2000 年以来,大多数地区的 PM 浓度显著增加。 转折点发生在 2018 年,当时印度政府启动了国家清洁空气计划,PM2.5大多数地区的浓度下降。重度 PM2.5污染导致归因过早死亡率持续增加,从 2000 年的 0.73 (95 % 置信区间 (CI) [0.65, 0.80]) 增加到 2019 年的 1.22 (95 % CI [1.03, 1.41]),特别是在 IGP 中,归因死亡率从 36 万增加到 60 万。LongPMInd 有可能支持空气质量管理、公共卫生倡议和应对气候变化工作的多种应用。
采集时间 | 1980/01/01 - 2022/12/31 |
---|---|
采集地点 | 印度 |
数据量 | 8.5 GiB |
数据格式 | nc |
坐标系 |
PM2.5和PM10的地面观测2018-2022年期间在印度的数据采集是从 CPCB 空气质量监测网络收集的(https://www.cpcb.nic.in)。 由于极值会影响模型稳健性,因此排除了底部和顶部 0.01% 的观测数据。使用了涵盖 1980-2022 年的第五代 ECMWF 大气再分析数据集 ERA5-Land。根据特征的相对重要性选择特征,而相对重要性则根据它们的增益计算,并包括几个相对重要性较高的气象因素。还收集了涵盖 1980-2022 年的现代研究和应用回顾性分析第 2 版 (MERRA-2) 的数据产品,数据包括气溶胶光学厚度和气溶胶成分和前体(黑碳、有机碳、硫酸盐、灰尘和二氧化硫)。
模型构建:在这项研究中,LightGBM是一种高效的梯度提升决策树(GBDT),用于估计PM2.5和PM10,使用网格搜索交叉验证(CV)方法来选择最佳超参数。设计了超参数选择算法(增补中的算法 S1)来保证模型的泛化能力。执行循环以增加模型复杂性,然后在模型预测的RMSE没有显着降低或训练和预测的RMSE 之间的差异没有显着增加时结束循环并返回超参数。根据特征的相对重要性来选择特征。10个气象特征、6个与排放相关的特征和总气溶胶消光用于训练LightGBM和估计PM浓度。
MERRA-2 是由 NASA 发布和维护的全球空气污染再分析数据集;它已广泛用于印度地区的 PM 污染研究,其可靠性已得到广泛分析(Gueymard 和 Yang,2020 年;Navinya等人,2020 年;Buchard等人,2017 年)。对于 MERRA-2 AOD,使用 AERONET 观测的评估表明,MERRA-2 在大多数地区的表现优于哥白尼大气监测服务 (CAMS)(Gueymard 和 Yang,2020 年)。Kumar 等人(2023 年)预测了地面 PM2.5仅使用 MERRA-2 和机器学习方法在印度的浓度,证明了 MERRA-2 数据的可靠性。
# | 标题 | 文件大小 |
---|---|---|
1 | code.zip | 483.1 KiB |
2 | pm25_arr_10km_1980_daily.nc | 195.5 MiB |
3 | pm25_arr_10km_1980_monthly.nc | 6.4 MiB |
4 | pm25_arr_10km_1981_daily.nc | 194.9 MiB |
5 | pm25_arr_10km_1981_monthly.nc | 6.4 MiB |
6 | pm25_arr_10km_1982_daily.nc | 194.9 MiB |
7 | pm25_arr_10km_1982_monthly.nc | 6.4 MiB |
8 | pm25_arr_10km_1983_daily.nc | 194.9 MiB |
9 | pm25_arr_10km_1983_monthly.nc | 6.4 MiB |
10 | pm25_arr_10km_1984_daily.nc | 195.5 MiB |
# | 时间 | 姓名 | 用途 |
---|---|---|---|
1 | 2024/11/19 07:13 | 匿名 [27.155.194.* ] |
[开放下载]
|
2 | 2024/09/04 17:56 | 匿名 [123.127.143.* ] |
[开放下载]
|
# | 类别 | 标题 | 作者 | 年份 |
---|---|---|---|---|
1 | 论文 | Reconstructing long-term (1980--2022) daily ground particulate matter concentrations in India (LongPMInd) | S,Wang,M,Zhang,H,Zhao,P,Wang,S,H,Kota,Q,Fu,C,Liu,H,Zhang | 2024 |
©2024 中国科学院西北生态环境资源研究院 备案号:陇ICP备2021001824号-34
兰州市东岗西路320号 730000 电话:0931-4967592, 0931-4967596