数据策略
定义
数据集是一组文件,构成与单个研究活动或项目相关的离散数据集,或支持一个或多个研究出版物。数据集将包括数据文件和支持文档。数据集可以包括软件代码。
集合是一组一个或多个数据集。大型或多阶段的项目,或产生了多个出版物的研究,可能包括多个数据集,这些数据集可以作为集合组合在一起。
数据集和集合可以存储在存档中,也可以保存在其他地方。数字数据集可以保存在其他在线数据档案或存储库中,也可以通过其他方式发布,例如作为期刊文章的补充材料。非数字数据集可以存储在机构档案或其他存储服务中。
每个数据集或集合都有一个关联的元数据记录。
访问
可以控制对数据集中文件的访问。存放于存档的文件可能具有以下访问设置:
- 开放的:不受限制地开放获取的;
- 注册用户:仅对具有大学帐户的工作人员和研究生成员访问。这是一个临时设置,可用于内部同行评审;
- 受限:仅提供给请求访问数据并经授权代理授权访问数据的注册用户;
- 禁运下:在一段固定的时间内禁运,并在禁运期结束时以开放、注册用户或受限制的方式提供。
开放数据文件是在知识共享许可下提供的。开放的软件文件是在多种标准软件许可协议之一下提供的。默认推荐的数据文件license为知识共享署名(CC BY).
查阅受限制的数据文件须经权利持有人授权,并按权利持有人所指明的条款进行。授权代理可以是档案管理员和/或其他指定的个人,授权代理可以要求查阅这些文件。
数据可在保存之日起12个月内不对外公开。在此日期之后,必须提供数据文件,除非有充分的理由继续拒绝对数据的访问。
每个数据集将包括至少一个文档文件,该文件应该是公开可用的。
访问级别由存款人在将数据文件上传到Archive时指定。
使用
根据知识共享署名或标准开源许可条款提供的数据和软件文件通常可以是:
- 以任何格式或媒介复制、展示或表演予第三方及储存于资料库;
- 未经事先许可或收费,用于个人研究或学习、教育、非营利或商业目的;
提供:
- 提供对数据集的引用,至少包括必需的最低元数据,即元数据记录的创建者、标题、数据出版商、出版年份和DOI/URL;
- 给出了原始版权声明和许可/权利许可声明。
根据所使用的许可类型,可对源自数据文件的任何材料的商业用途和许可规定额外的限制。这些和其他许可选项的详细信息可以在知识共享和choosealicense.com网站。
限制访问文件可以在权利持有人指定的特定许可条款下提供。在这种情况下,将随数据集一起提供许可文件,或者授权代理在授予数据文件访问权限时提供使用条款。
机器人不能从归档中获取数据集文件。
保存
存放在档案中的数据集将根据档案无限期保留保护政策,除非档案馆根据任何适用政策或针对已证实的投诉被要求撤回数据。