近年来,细颗粒物(PM2.5)和环境臭氧(O3)的健康风险已得到广泛认可。对 PM2.5 和 O3 暴露的准确估计对于支持健康风险分析和环境政策制定非常重要。本数据集研究旨在构建高性能的随机森林模型,以 1 km × 1 km 的空间分辨率估算 2005-2017 年中国PM2.5 日平均浓度和臭氧日最大 8 h 平均浓度(O3-8 hmax)。模型变量包括气象变量、卫星数据、化学传输模型输出、地理变量和社会经济变量。建立了基于 10 倍交叉验证的随机森林模型,并进行了时空验证以评估模型性能。根据我们基于样本的划分方法,测试数据集的 PM2.5 日、月和年估计值的平均模型拟合 R2 值分别为 0.85、0.88 和 0.90;O3-8 hmax 的R2 值分别为 0.77、0.77 和 0.69。气象变量及其滞后值会显著影响 PM2.5 和 O3-8 hmax 的估计值。2005-2017 年期间,PM2.5 浓度总体呈下降趋势,而环境 O3 浓度则呈上升趋势。2005 年至 2017 年期间,PM2.5 和 O3-8 hmax 的空间模式几乎没有变化,但时间趋势具有空间特征。
采集时间 | 2005/01/01 - 2017/12/31 |
---|---|
采集地点 | 中国 |
数据量 | 1004.2 MiB |
数据格式 | csv |
坐标系 | WGS84 |
本研究使用的模型变量主要包括用于 PM2.5 建模的 Aqua AOD、用于 O3 建模的 GEOS-Chem 化学传输模型输出以及 PM2.5 和 O3共享的一些变量。PM2.5 和 O3 共享的变量:13 个气象变量(包括边界层高度、表面气压、2 米露点温度、蒸发、反照率、低云量、中云量、高云量、总降水量、10 米 U 型分量、10 米 V 型分量、 此外还有地理和社会经济变量,如数字高程模型(DEM)、归一化差异植被指数(NDVI)、人口、国内生产总值(GDP)、公路网和虚拟变量(包括季节、月份和省份)。简而言之,大多数模型变量都是在 ArcGIS 10.2 和Python 2.7 中使用插值方法(如反距离加权和双线性算法)将其处理为基于标准网格的 1 km × 1 km 分辨率。AOD 由 ENVI 5.3+IDL 处理,使用 ArcPy 提取到标准网格,然后进行反距离加权插值,得到 1 km×1 km 分辨率的数据。对于长期变量,每天分配相应的月度和年度水平值。
本研究的模型变量包括 2013-2017 年的气象变量、地理变量、社会经济变量、卫星数据和化学传输模型输出。获得了 2013-2017 年 1479 个站点的 PM2.5 日均浓度和 O3 日最大8 小时平均浓度(O3-8 hmax)监测数据。在全国(35.55°N 至43.12°N,112.95°E 至 120.35°E)建立了 1 km × 1 km 的标准网格,共 9495025 个网格单元。网格坐标系为 WGS-84,网格投影为阿尔伯斯投影。我们构建了高性能随机森林模型(时间分辨率:日;空间分辨率:1 km × 1 km),并估算了 2005-2017 年中国的网格日均PM2.5 浓度和 O3-8 hmax 浓度。
交叉验证结果表明,估算的 PM2.5 和 O3-8 hmax 浓度与观测到的 PM2.5 和 O3-8 hmax 浓度匹配合理,拟合检验-R2 值较高。根据基于样本的划分方法,PM2.5 日、月和年估计浓度的检验-R2 值分别为 0.85、0.88 和 0.90 同样,估算的每日、每月和每年 O3-8 hmax 浓度的检验-R3 值分别为 0.77、0.77 和 0.69。PM2.5 的日均均方根误差和最大均方根误差分别为 17.72μg/m3 和 9.37μg/m3;O3-8 hmax 的日均均方根误差和最大均方根误差分别 为 23.10μg/m3 和 15.43μg/m3。在省/市层面,上海、北京、湖北、河北和四川的 PM2.5 估算结果以相对较高的检验 R2(≥ 0.90)排名前五,而西藏、青海、甘肃、安徽和云南的PM2.5 估算结果则以相对较低的检验 R2 值(< 0.70)排名较后。北京、重庆、上海、天津和河南的 O3-8 hmax 估测结果的检验 R2 值相对较高(≥ 0.83),排名前五;而甘肃、安徽、黑龙江、贵州和西藏的 O3-8 hmax 估测结果的检验 R2 值相对较低(< 0.62),排名较差。
# | 标题 | 文件大小 |
---|---|---|
1 | 2005_pm.rar | 33.9 MiB |
2 | 2006_pm.rar | 33.9 MiB |
3 | 2007_pm.rar | 34.0 MiB |
4 | 2008_pm.rar | 34.1 MiB |
5 | 2009_pm.rar | 33.9 MiB |
6 | 2010_pm.rar | 33.8 MiB |
7 | 2011_pm.rar | 33.9 MiB |
8 | 2012_pm.rar | 34.0 MiB |
9 | 2013_pm.rar | 34.0 MiB |
10 | 2014_pm.rar | 33.8 MiB |
# | 时间 | 姓名 | 用途 |
---|---|---|---|
1 | 2024/05/21 03:38 | 朱*良 |
Paper title:基于深度学习的中国连续空间覆盖PM2.5浓度预报
Paper abstract:PM2.5作为研究的样本数据和精度检验数据
Paper type:期刊论文
Tutor:王翔
|
2 | 2024/03/13 00:42 | 王* |
全球荒漠化风险数据集(2001-2018 年)
中国内陆地表水(ISWDC) 数据集(2000-2016年)
基于多变量随机森林模型的中国1公里日环境PM2.5和O3浓度全覆盖数据集(2005-2017 年)
全球初级生产总值长期变化的改进估计数据集(1982-2017年)
中国月地面太阳辐射数据集(2000-2017年)
|
3 | 2023/11/24 04:41 | 徐* |
查看是否是我论文所需要的数据集,如果能够使用,一定会鸣谢
|
4 | 2023/10/13 23:51 | 王*葳 |
生态学在读研究生进行学习和研究,想要进一步了解中国近些年的臭氧动态
|
5 | 2023/10/11 07:14 | Zh*****Zhu |
我们的研究项目考察交通对环境污染的影响,因此需要用到此处的数据。
|
6 | 2023/10/08 04:22 | 匿名 [210.77.67.* ] |
[开放下载]
|
# | 类别 | 标题 | 作者 | 年份 |
---|---|---|---|---|
1 | 论文 | Full-coverage 1\,km daily ambient PM$_{2.5 | R,Ma,J,Ban,Q,Wang,Y,Zhang,Y,Yang,S,Li,W,Shi,Z,Zhou,J,Zang,T,Li | 2022 |
©2024 中国科学院西北生态环境资源研究院 备案号:陇ICP备2021001824号-34
兰州市东岗西路320号 730000 电话:0931-4967592, 0931-4967596