国家重点研发计划数据汇交流程分为 7 个阶段,如图所示。
流程 1:科学数据汇交计划制订
要求
科学数据提交方应在项目立项阶段按照科技计划项目管理方的相关规定,编制科学数据汇交计划,提出质量控制的手段和方法,明确科学数据开放时间及共享方式等内容。数据汇交计划编制完成后需将其提交至科技计划项目管理方,经科学数据管理方审查并由科技计划项目管理方审批后实施。
时间
编制科学数据汇交计划应在重点研发计划项目申报立项阶段进行。
立项阶段没有制定科学数据汇交计划的项目,应根据项目管理方要求补充完成并获其批准。
流程
编制科学数据汇交计划的具体流程如图所示。
流程说明
- 科学数据提交方在项目立项阶段,按照科技计划项目管理方的要求,对照项目任务书中的相关指标,编制科学数据汇交计划,明确汇交数据内容、质量控制方法、共享发布条件和技术方案。《科学数据汇交计划》详细要求参见附件 重点研发计划汇交方案模板;
- 科学数据管理方对照科技项目申报材料、任务书和其他项目材料审查《科学数据汇交计划》,如存在问题应反馈科学数据提交方修订而后重审。通过审查的《科学数据汇交计划》,应由科学数据管理方给出审查意见,交科技计划项目管理方审批;
- 科技计划项目管理方对《科学数据汇交计划》的内容与数据管理方审查意见进行审批,审批通过的汇交计划为科学数据汇交审核的主要依据,三方存档后按计划实施后续工作。如汇交计划存在问题,应退回整改后重新提交。
阶段性成果
审核通过后的《科学数据汇交计划》。
常见问题
- 1、 问:未经审核通过的科学数据汇交计划有效力吗?
- 答:科学数据汇交计划既是项目考核指标在科学数据维度的具体体现,也是科学数据管理方开展数据审核、出具凭证的主要依据,必须得到提交方,数据管理方和项目管理方的共同认可。
- 2、 问:科学数据汇交计划怎么改都审核不通过?
- 答:应对《科学数据管理办法》中“开放为常态,不开放为例外”等要求加深理解,认识到数据共享发布是项目工作意义的延伸体现,落实任务书相关指标,合理开放共享,不人为设置障碍阻止数据共享。
- 3、 问:科学数据汇交计划如何变更?
- 答:随着项目进行,实际数据产出可能与汇交计划不完全一致,应在项目结题前,按实际产出对汇交计划进行修改,并重新提交数据管理方审查,项目管理方审批后,重新备案。
- 4、 问:没有科学数据汇交指标,是否需要制定科学数据汇交计划?
- 答:科技项目没有与数据相关的考核指标,过程中也不产生任何具有汇交意义数据的,可以提请项目管理方、项目责任专家等共同议定,然后把共识性结论书面提供给数据管理方。
流程 2:科学数据制备
要求
科学数据汇交计划通过审查后,科学数据提交方应遵照科学数据汇交计划和相关标准规范,进行规范化的科学数据实体采集生产与加工整理,按规定格式形成科学数据的数据元信息。科学数据管理方应对科学数据的制备工作提供指导。
时间
随重点研发计划研究工作的进行,适时开展科学数据制备工作。
流程
科学数据制备流程如图所示。
流程说明
- 科学数据提交方在科技项目开展工作中按计划采集、生产数据;
- 如相关领域存在通用数据规范、质量标准,科学数据管理方应提出相关的标准化建议,或提出可供用户理解的数据元信息描述要求,如数据字典,数据元注册等;
- 数据提交方按相关标准进行数据标准化处理,或为便于共享用户使用,对原始数据进行产品化加工处理,形成规范化可共享数据实体;
- 数据提交方按数据管理方的要求填写规范的数据元描述信息。
阶段性成果
规范化数据实体、数据元描述信息。
- 1、 问:为何需要对数据进行规范化加工整理?
- 答:某些特定研究领域可能存在各方共同遵守的数据交换标准,数据是否符合相关标准是数据能否复用的关键。即使不需要参照数据交换标准,内部使用的数据往往也存在大量共享用户不易理解的潜台信息,如默认省去的字段,不易理解的代码等,这些信息在进行共享前,都需要加以改造,或提供数据元描述信息,以便数据共享用户使用。
- 2、 问:什么是数据元描述信息?
- 答:最简单来说,对于关系型数据库,数据元描述信息就是其数据字典;对于数据文件,数据元信息是其存储结构、数据类型和内容方面的描述。数据元侧重于从内容和形式两个层面对数据集进行描述,从而帮助共享用户理解和使用数据集。
流程3:科学数据提交
要求
科学数据提交方应按照科学数据汇交计划,对计划汇交的科学数据进行汇总整理,对科学数据质量进行自查,编制科学数据质量信息报告,并将科学数据提交至科学数据管理方。
时间
流程
科学数据提交原则上应在项目执行期按照项目开展情况及时提交,并在科技项目验收结题前全部完成。
流程
科学数据提交流程如图所示。
流程说明
- 科学数据提交方对照科学数据汇交计划,负责对可共享数据,及其数据元描述信息汇总整理;
- 数据提交方项目承担单位对数据质量总体情况进行自查,并编制《科学数据质量报告》,由项目负责人签署,做出质量承诺。关于数据质量报告的详细要求,参见附件 科学数据质量报告模板;对自查不合格的数据,由项目承担单位组织整改;
- 数据管理方根据科学数据汇交计划,为数据提交方开放专用的数据提交渠道,分配存储空间,配置相应的数据描述信息注册系统;
- 数据提交方通过指定渠道向数据管理方提交数据实体,并通过数据描述信息注册系统注册数据集元数据、数据元描述信息、数据质量报告等相关信息。
阶段性成果
可共享数据实体、数据集元数据、科学数据质量报告等。
常见问题
- 1、 问:科学数据提交和存储的费用如何计算?
- 答:目前凡重点研发计划项目科学数据汇交,指定国家冰川冻土沙漠科学数据中心作为科学数据管理方的,数据存储、管理和开放共享均不收费。
- 2、 问:什么是元数据?
- 答:元数据是关于数据的数据,对重点研发计划项目科学数据汇交而言,为了支持共享用户发现、了解、访问和使用数据,需要为每个数据集填写一条相应的数据集元数据信息。关于数据集元数据的详细要求参见附件 数据集元数据信息模板。
- 3、 问:数据集元数据应符合什么标准?
- 答:在国家冰川冻土沙漠科学数据中心提交数据,默认应按照《GB/T 30523-2014 科技平台资源核心元数据》填写数据集元数据,数据提交方所在行业领域存在其他元数据标准的,也可按相关元数据标准提交元数据,由国家冰川冻土沙漠科学数据中心实现在不同元数据标准间的映射转换。
流程4:科学数据审核
要求
科学数据管理方按照科学数据汇交计划和科学数据质量控制体系要求进行形式审查,通过组织开展科学数据质量同行评议等方式对科学数据质量进行评估。当审核通过时,科学数据管理方应出具审查报告作为汇交凭证,并将其提交至科技计划项目管理方,由科技计划项目管理方审批后进行汇总。若提交的科学数据存在问题,科学数据提交方应及时进行修改并重新提交。科学数据管理方可协助提供便于对科学数据进行在线访问、下载、预览、校验等功能的审核环境、工具及相关权限管理。
时间
科学数据形式审核原则上应在科学数据管理方收到全部提交数据后的一周内完成。
科学数据质量同行专家评议原则上应在科学数据管理方收到全部提交数据后的一个月内完成。
流程
科学数据审核流程如图 6 所示。
流程说明
- 科学数据管理方收到提交方提交的科学数据后,对照科学数据汇交计划和科学数据质量说明,对汇交数据实体、相关描述型信息和软件工具进行形式审查,形式审查原则上应在一周内完成;形式审查不合格的,应向数据提交方反馈问题信息,指导其进行修改后重新提交;
- 形式审核合格后,数据管理方负责准备可供在线访问、下载、预览和校验提交数据的审核环境,邀请一定数量的数据专家和同领域专家,对数据内容进行同行专家评议,评议数据样本数量、抽样规则等由专家决定,数据管理方负责样本抽取并组织相关元数据信息等审核材料;
- 同行专家通过试用,对照科学数据汇交计划等材料评审数据内容的质量并给出评审意见。同行专家质量评议原则上应在数据管理方收到汇交数据的一个月内完成。半数(含)以上同行评议认定数据质量不达标时,数据管理方向数据提交方反馈质量问题并指导其修改后重新提交;如有两位以上同行专家认为存在证据确凿的数据造假行为,数据管理方应向项目管理方举报;
- 同行专家评议合格的,由担任数据管理方的国家科学数据中心汇总评审评议意见,开具《科学数据汇交凭证》 ,反馈至数据提交方 ;
- 项目管理方接收《科学数据汇交凭证》并进行审批,合格者将被认定为完成数据汇交,可以继续进行科技项目验收后续工作。
阶段性成果
《科学数据汇交凭证》。
- 1、 问:形式审核主要检查什么?
- 答:形式审核着重于合规性和一致性,即对照科学数据汇交计划,检查实际提交的数据和数据描述信息是否符合相关标准要求,是否与汇交计划一致,对数据质量不做深入研究。
- 2、 问:什么是科学数据同行专家评审?
- 答:数据资源很难像论文一样,在同行专家提出修改意见后,仍然可以进行大幅度深入的修改,对科学数据的同行评议更多地是对其内容质量进行检查,确保数据质量达到一定的水平。
- 问:从制订科学数据汇交计划到获得汇交凭证最短需要多长时间?
- 答:从以往的经验来看,数据汇交的时间大多数花费在不恰当汇交计划的整改,数据规范化加工和形式审核不合格的修改工作上,通常需要一个月以上的时间。
流程5:科学数据汇总
要求
科学数据管理方在接收科学数据后,应对通过审核的科学数据进行分类、编目、标识、保存、加工、整理及管理与维护。
时间
数据管理方接受汇交数据并完成同行评议后。
流程
科学数据汇总流程如图所示。
流程说明
- 数据管理方应建立科学、系统的资源分类体系,对汇交数据实施分类分级管理;对新接收的汇交数据,管理方应将其妥善纳入当前的分类体系当中;
- 数据管理方基于提交数据的数据集元数据,构建资源目录,基于元数据的多维度数据集搜索功能,支持实现汇交项目数据的资源发现;
- 国家冰川冻土沙漠科学数据中心支持按 CSTR、DOI 等标准为已发布的汇交数据集赋予永久唯一标识;
- 数据管理方按照汇交方在科学数据汇交计划中确定的权限要求,发布时间和长期保存需求,进行数据集保存和共享服务。
阶段性成果
唯一标识;数据资源目录、数据长期保存和开放共享服务。
常见问题
- 1、 问:为何要分配唯一标识?
- 答:CSTR、DOI 等唯一标识是在全球范围内永久唯一性地授予特定数字资源的标识符,授予的同时数据资源的元数据也被提交至授予机构保存,从而确保无论数据实体是否仍然存在,科技项目产生的科学数据和相关汇交行为都被永久地记载下来,同时,唯一标识也是追踪科学数据被引用、被使用和社交媒体传播等的重要依据,具有十分重要的作用。
- 2、 问:为何要对汇交数据进行分类分级?
- 答:出于长期保存的目的,基于重要程度,是否进行在线共享等因素,对不同数据的保存策略是不一样的,如共享需求较弱的数据可以保存在响应速度不太高的磁带存储中,重要的关键数据需要建立多个异地备份,防止数据意外丢失损坏,实现长期保存的目的。
流6:科学数据发布与共享
要求
科学数据管理方负责保障科学数据安全,经由科技计划项目管理方审批后对外公布科学数据及目录。按照开放为常态、不开放为例外的原则,根据科学数据的开放条件、开放对象和审核程序等,在保障科学数据安全的前提下向社会开放共享。为了便于科学数据的开放共享,科学数据管理方应建设运营科学数据共享发布系统,提供数据快速发现、访问、下载甚至在线分析利用等服务。
时间
项目管理方审批后进行。
流程
科学数据发布与共享流程如图所示。
流程说明
- 数据管理方建立用于汇交数据共享发布的系统,提供基于元数据的数据目录,以及实体数据的在线获取,访问和下载等服务;
- 数据管理方依据科学数据汇交计划说明的共享策略、权限要求等导入数据资源,并配置相应的审核和获取流程;
- 项目管理方审批同意数据发布后,数据管理方按发布策略,发布提交数据各类共享服务。
阶段性成果
汇交数据在线服务
汇交数据在线服务
- 国家冰川冻土沙漠科学数据中心在哪里发布重点研发计划数据?
- 答:国家冰川冻土沙漠科学数据中心的门户服务站点改版后,将全面支持科技项目科学数据汇交,以及汇交数据的在线发布,同时,汇交数据的元数据也将同步提交至国家基础条件平台门户站点。
- 2、 问:国家冰川冻土沙漠科学数据中心可以提供怎样的数据发布共享服务?
- 答:新版国家冰川冻土沙漠科学数据中心将为每个重点研发计划项目生成相对独立的子站点,按照提交方设定的发布权限配置共享权限和审批流程,实现分类分级共享。除提供统一的多维度元数据搜索外,还支持数据实体的访问,下载,接口服务,以及常见数据格式的在线可视化等。
流程 7:科学数据使用与维护更新
要求
科学数据管理方应做好科学数据的管理与维护工作,对科学数据共享应用情况进行统计,并将统计结果反馈至科技计划项目管理方。鼓励各科学数据提交方对所提交的科学数据进行持续更新与归档。科学数据使用者应遵守知识产权相关规定,在论文发表、专利申请、专著出版等工作中注明所使用和参考引用的科学数据。
时间
按需进行,定期汇总。
流程
科学数据使用与维护更新流程如图所示。
流程说明
- 科学数据管理方对提交数据共享服务的情况进行跟踪统计,采集访问量、下载量、论文引用、媒体热度等综合数值;
- 科学数据管理方开放相关注册服务,支持数据提交方对提供数据服务支持重大应用的典型案例进行填报和发布;
- 数据管理方定期汇总相关统计信息,形成报告,向项目管理方反馈;
- 对于有更新需求的数据,由数据提交方提出申请,由数据管理方开放相关环境支持,并组织审核,参见相关提交与审核流程。
阶段性成果
数据资源应用情况跟踪统计。
常见问题
- 国家冰川冻土沙漠科学数据中心目前可以进行哪些统计?
- 答:国家冰川冻土沙漠科学数据中心的服务系统目前可以进行资源量,访问量、下载量的自动统计,以及典型服务案例信息的注册。