雷丁大学的cookie政策

我们在reading.ac.uk上使用cookie来改善您的体验,监视网站性能并为您定制内容。

阅读我们的cookie策略以了解如何管理您的cookie设置。

在哪里存档数据

选择合适的地方来归档数据是很重要的,因为这将决定数据的归档程度可查找、可访问、可互操作和可重用公平).在大多数情况下,数字数据存储库是合适的,但根据数据的类型和性质,可能需要不同的服务。大容量和非数字数据将需要其他解决方案。

数字数据

作为一项规则,数字数据应该归档到合适的公共数据存储库中。数据存储库将通过执行以下功能来确保你的数据集是FAIR的:

  • 它积极地为长期生存能力保存数据,例如复制和验证数据文件,迁移到保存格式;
  • 它发布机器可读的元数据以支持在线发现;
  • 它为数据集分配持久唯一标识符(例如DOIs)并使其可引用;
  • 它对数据集进行质量控制并增强元数据,例如通过应用标准词汇表(不是所有的存储库都这样做);
  • 它可以在线访问数据,这样其他人就可以使用这些数据;
  • 它适用许可证通知,使使用条款和归属要求明确。

我们提供以下指导选择合适的数据存储库

源代码

支持已发布结果的软件代码(例如用于生成输出数据的模型代码,或为统计分析目的编写的代码)应该归档到公共数据存储库中,这样它就可以保存在与报告结果相关的特定版本中,并可以被DOI引用。GitHub提供了一个易于使用的函数将代码文件归档到Zenodo数字存储库中.代码文件也可以存放在大学的研究资料档案,或任何其他通用存储库。

在需要发布源代码以便其他人可以下载和运行它,并为其正在进行的开发做出贡献的地方,它也应该作为公共代码存储库提供。代码存储库将提供版本控制、代码审查、bug跟踪、文档、用户支持和其他功能。大学提供GitLab代码存储库服务;其他受欢迎的平台有GitHub而且Bitbucket都

限制数据

有些数据可能不适合公众访问,例如,因为其中包含不易删除的机密信息(如生物识别数据或视频/图像数据),或者因为修改数据以删除敏感或机密信息将大大降低其价值。这并不意味着数据不能被存档并提供给其他人。

一些存储库可以在受控的访问过程中管理敏感数据。这可能需要潜在的数据用户提出应用程序来查询特定的数据集,数据所有者或指定的数据管理员可以拒绝或批准该应用程序。请求者可能还需要满足某些条件才能获得对数据的访问权,例如签署保密协议。查阅个人资料亦须得到资料当事人的同意,因此在研究的规划和招募阶段须考虑到这一点。参见大学指南数据保护与研究更多信息。

提供受控访问过程的存储库包括英国数据服务ReShare存储库,它有一个“受保护的数据”选项,以及欧洲基因组-表型档案

大学的研究数据档案也提供限制数据集选择。受限制的数据集可以安全地保存在大学的基础设施中,并允许隶属于研究机构的授权研究人员访问,但须经数据访问委员会(包括原始研究的PI或指定的代表)批准,并根据大学与接收组织之间的数据访问协议条款。

大容量数据

如果您生成了大量的数据,在100g (GB)或TB (TB)的规模上需要存档,那么可能会有实际和成本限制限制您的选择。大多数数据存储库不能有效地处理这种大小的数据集,尽管情况并非总是如此。例如,NERC CEDA数据中心通常管理TB级别的数据集。大学的研究数据档案接受不超过20gb的免费数据存储,由于实际原因,我们不建议存储超过20gb的数据集。免费使用的数据共享服务提供更大的容量:Zenodo接受最高50gb的标准存款,并将考虑更大的存款;figshare将接受任何大小的公共数据集存储,并提供一个FTP上传工具

请记住,您不一定需要归档或维护项目中收集或生成的所有原始数据。关于这个有更多的信息数据选择web页面。

如果您的数据没有合适的数据存储库,您可能有各种选择:

  • 一些研究设施,如钻石光源,提供了一个存档设施,以收集他们的仪器上的原始数据。在这种情况下,你不需要自己存档数据,因为这将作为设施操作程序的一部分来完成。
  • 您可以通过您的系或研究小组访问大学网络存储基础设施。可以将这一分配的一部分预留出来,作为指定的单独归档区域。但本地网络存储的容量可能是有限的。通过DTS提供的存储研究数据存储服务是在持续的基础上收费的,所以这不太可能是一个可行的长期选择。
  • 机构云存储选项提供免费的大容量存储。您的大学帐户为员工用户提供5 TB的存储标准免费,并附带25 TB的存储。虽然补贴很慷慨,但这些云服务并不是作为长期存储解决方案设计的,也不是存储和使用大量数据的最佳方案。上传和检索时间可能较慢,并且团队中的大目录可能会导致问题。存储在OneDrive中的数据都保存在个人账户中,因此,为了确保这些数据易于访问,数据应该由多个人检索。例如,数据的副本可以存储在另一个OneDrive账户或项目团队成员可以访问的办公室内的外部硬盘驱动器上。
  • 外部硬盘提供了便宜的存储解决方案,不过您需要确保按照3-2-1规则备份数据:3份副本,在2种不同的介质上,一份副本在单独的位置。这些数据还需要至少有两个人可以访问。数据需要定期迁移到新媒体,例如每五年迁移一次。

如果数据存储在个人管理下,除了确保至少两个人可以访问/检索数据外,还需要一些移交策略,以便如果数据所有者或主要数据管理员离开了大学,数据仍可以在大学或其他地方继续访问。

通过上述任何一种方式归档的数据都应该进行写保护,这样一旦它们以确定的形式存储,就不能进一步修改。建议在研究小组或部门中有一个指定的归档数据管理员,他维护归档数据集的注册表、它们的位置和负责的所有者。

在上面描述的每种情况下,您都应该在大学的数据库中创建一个元数据记录研究资料档案描述数据和访问数据的方法,以便其他人能够发现数据并请求访问数据。如收到查阅资料的要求,可邀请索取者到现场查阅资料(如可行),或安排(由索取者自费)送出载有有关资料副本的硬碟。

非数字(离线)数据

非数字资料应存放在安全的学校或系档案或办公室。至少有一个同事(例如,部门管理员)应该有数据在哪里以及如何访问数据的记录。理想情况下,这些信息应保存在学院或系所维护的信息资产登记册中;如果没有这样的登记册存在,您可能希望建立一个,即使只是与您的研究小组。

你应该创建一个元数据记录在大学研究资料档案描述数据和访问数据的方法,以便其他人能够发现数据并请求访问数据。

如果数据是在你的权限下存储的,而你离开了大学,如果你留下了数据,你必须把它们转交给同事;如果你带走了数据,你必须提供转发联系人。

联系我们

电子邮件

罗伯特•达比,研究数据经理

researchdata@reading.ac.uk

0118 378 6161

Baidu
map