公开和公平的数据
该大学和许多公共资助方都希望得到支持研究结果的数据公开可用的只要有可能。根据开放的定义,开放数据”可以自由使用、修改和共享通过任何人为任何目的”。
但是,如果没有查找、访问和使用数据的手段,仅有许可是不够的。开放数据还必须是:
- 明确识别并正式录入网络公共记录,以便准确引用和发现;
- 可访问的,使它们可以打开,阅读和处理;
- 以一种能够被理解和使用的方式呈现和记录。
这些可用性条件在公平原则的数据,根据其中的数据必须可发现的,可访问的,可互操作的而且可重用的.2016年,一群来自学术界、产业界、资助机构和学术出版商的利益相关者首次提出了FAIR原则。这些原则特别强调机器自动查找和使用数据和/或相关元数据的能力,此外还支持个人重用。
《公平原则》自首次发表以来已得到广泛接受,并被采纳为数据管理、基础设施开发和服务交付的标准。
开放数据,要做到最大程度的开放,也必须是公平的。(但请注意,FAIR数据不一定是开放的:限制访问的数据可能是公平的,前提是描述它们的元数据是开放的。)
重要的是要从研究的一开始就考虑使数据公平,因为这可能会影响到您收集和记录数据的方式、存储数据的格式、如何保存和共享数据,以及如何授权重用数据。
使用数据存储库
为了使数据公开和公平,数据应该存放在数据存储库中。数据存储库是一种服务,用于保存和提供对研究数据的访问。它是一种不受未来影响的工具,可以确保数据在长期内保持可访问性和可用性。
使用数据存储库要优于将数据作为已发表文章的补充文件共享,或通过基于云的文件存储和共享服务(如Dropbox或开放科学框架)共享,或在私有存储中维护数据并仅按要求共享。这些共享数据的方式都不是完全公平的。
数据存储库执行一些特定的FAIR功能:
- 它积极地为长期生存能力保存数据,例如复制和验证数据文件,迁移到保存格式;
- 它发布机器可读的元数据以支持在线发现;
- 它为数据集分配持久唯一标识符(例如DOIs)并使其可引用;
- 它对数据集进行质量控制并增强元数据,例如通过应用标准词汇表(不是所有的存储库都这样做);
- 它管理对数据的在线访问,以便其他人可以使用这些数据;
- 它适用许可证通知,使使用条款和归属要求明确。
数据资料库的例子包括:学科数据中心及其组成的数据库,例如NERC数据中心和数据库欧洲生物信息学研究所;机构数据存储库,例如雷丁大学研究数据档案;以及通用的数据共享服务,如Zenodo而且figshare.
我们提供以下指导为您的数据寻找合适的存储库.