雷丁大学的cookie政策

我们在reading.ac.uk上使用cookie来改善您的体验,监视网站性能并为您定制内容。

阅读我们的cookie策略以了解如何管理您的cookie设置。

数据选择

在开始保存和共享数据之前,您需要确定需要保存什么。你不太可能需要保存你在研究过程中收集或创建的所有数据。因此,您需要选择有价值的数据,并处理剩余的数据。

对数据进行系统的价值评估可以帮助您对保存的内容做出明智的决定。我们提供了一套评估标准数据选择和评估清单(PDF)。本文件旨在供大学研究数据档案的潜在存款人使用,但评估标准适用于任何保存选择活动。这些标准是根据NERC数据值检查表,由nerc资助的研究人员使用。更详细的为策展工作评估和选择研究资料的指南由数码策展中心提供。

下面着重介绍了在考虑选择要保存的数据时需要注意的一些关键问题。

验证已发表的研究结果

如果研究成果已被公开发表,例如发表在研究文章或纳入博士论文中,需要什么数据来验证这些成果?测试数据、失败的实验结果和来自故障仪器的数据显然是需要处理的对象。处于中间处理阶段的数据通常会超出需求,因为保存原始数据和处理记录更为重要,它们是通过这些记录从一种状态转换到另一种状态的。以最终处理的格式保存数据也很有用。请记住,用于生成、处理和分析数据的代码文件可能构成验证结果所需材料的一部分。

价值

数据的内在价值是什么?例如,环境数据在其所处的时代和地点是独一无二的,作为历史记录的一部分具有固有的价值。如果这些东西丢了,就再也找不回来了。理论上,实验可以重复进行,数据也可以复制,尽管这样做的成本可能很高。

数据对于其他利益相关者的重用也可能具有特定的价值,例如,因为它们对研究有用,或者因为它们可能在产品或服务中重用。

体积

一些研究可能产生大量的数据,在100g (GB)或几TB (TB)的规模。在这些尺度上产生数据的研究例子可能包括大规模高分辨率成像和视频记录,以及复杂系统的计算机模拟,原始输出可以达到TB。许多数据存储库将没有能力处理非常大的数据集。如此规模的数据的储存、保存和转移在技术和财政方面都面临挑战,因为有意义地保存和分享这种数据产出的成本可能超过任何可能的收益。特别是在计算机模拟的情况下,保存个别的输出可能不那么重要,重要的是模型代码和输入参数,通过它们可以再现一组结果。

资助者认识到,对某些数据的保存可能存在实际的限制。UKRI承认,“可能在某些情况下,保存研究数据可能不可能或不具成本效益。这将取决于数据的类型和规模,它们在验证已发表的结果中的作用,以及它们对进一步研究的预测长期有用性”(参见该指南)数据政策的一般原则第4页)。

即使在不希望或不可能在数据存储库中存储大量数据输出的情况下,您可能仍然希望保留它们,以供自己持续使用,和/或为了能够在请求时与他人共享它们。在这种情况下,您需要将数据存储在个人存储解决方案中(具有适当的备份),并将它们注册到大学档案中,以便其他人能够找到关于它们的信息以及如何访问它们。欲了解更多信息,请参见网页在哪里存档数据

不能共享的数据

对于哪些数据可以共享,有法律/道德/合同限制吗?在许多情况下,这并不意味着数据根本无法共享。可能需要对数据进行编辑,例如删除机密或商业机密信息,或需要以某种方式限制对数据的访问。

作为一般规则,您应该只保存匿名数据。例如,你可以保留匿名的笔录,但丢弃原始的采访录音;你可以保留来自观察研究的匿名量化数据,但不可以记录可以识别个体参与者的数据。

如果机密信息或个人数据不能从数据中删除(例如生物识别数据),或者如果披露造成伤害或苦恼的风险很大,则可以使用封闭存储在限制访问的基础上保存数据。一些数据仓库,例如英国数据服务ReShare库的欧洲基因组-表型档案,可以管理对敏感/机密数据的受控访问。大学的研究数据档案也可以提供受限访问选项.如果您想讨论这个问题,请与我们联系。

联系我们

电子邮件

罗伯特•达比,研究数据经理

researchdata@reading.ac.uk

电话:0118 378 6161

Baidu
map