雷丁大学的cookie政策

我们在reading.ac.uk上使用cookie来改善您的体验,监控网站性能并为您定制内容。

阅读我们的cookie政策以了解如何管理您的cookie设置。

组织数据

实施一个逻辑和一致的系统来组织您的数据文件,使您和其他人能够有效地定位和使用它们,并有助于保持数据的完整性。

数据组织有三个主要要素:

  • 一个文件系统
  • 文件命名规则;
  • 一个版本控制政策。

下面将讨论这些元素。在考虑如何组织数据时,请牢记以下原则:

  • 如果现有的惯例和程序满足您的需求,请使用它们。你的研究小组或实验室可能已经有了标准的协议。
  • 确保参与项目的每个人都了解并遵守政策。如果一项策略没有得到遵守或应用不一致,那么它就没有什么价值。
  • 经常检查您的政策和实践。不要让文件没有排序,挂在顶级文件夹下;定期清理和整理文件夹,删除多余的文件。
  • 您可能想要维护一个保留计划,为指定的文件设置保留和审查期。如果您正在收集个人数据,则这一点尤其重要,因为当不再需要时,需要合法处理和安全地销毁这些数据。简单的电子表格可以作为留存计划。

这些原则适用于任何形式的信息,无论是物理的还是数字的。

下面的指南主要是针对数字信息的存储。有关良好实践的进一步信息,请参阅英国数据服务而且麻省理工学院图书馆

文件系统

使用逻辑的、层次结构的文件夹结构来存储文件,将文件按类别分组,并从广泛的高级类别降序到这些类别中更具体的文件夹。做到这一点没有唯一正确的方法;重要的是结构要合乎逻辑,易读,对其目的有意义。例如,您可以根据任务(例如工作包,实验)将文件组织到文件夹中,然后是重要的定义属性(例如位置,样本号,运行,公司名称)或数据类型(例如原始,处理,最终)。您可能会为数据、管理文档、出版物等设置单独的高级文件夹。

不要让你的文件夹结构变得太复杂,避免在你的层次结构中有太多的层(3层是合适的;理想情况下,最多不要超过4个)。

机密信息,例如参与者记录,应该存储在单独的文件夹中,并有适当的访问控制。大学网络上文件共享的所有者可以管理对其中的文件共享和文件夹的个人访问权限。有关更多信息,请参阅IT指南(需要登录)。

原始数据和里程碑文档版本应该保存为只读文件,最好保存在单独的文件夹中。如果您需要协助管理文件权限,请联系IT部门。

文件命名

智能地使用文件命名使您和其他人能够轻松地识别文件的内容,并可用于组织和版本控制文件。无论你是存储数字材料还是物理材料,这个原则都适用。如果您正在生成大量的文件,例如通过一些自动化过程,这可能是非常重要的。

你不必强迫所有的文件都遵循一个严格的约定,但是如果你采用一些基本的标准,它们将帮助你找到和组织文件。例如,通过始终以YYYMMDD格式编写日期,您将能够按时间顺序对文件进行排序。以下建议可能会帮助您开发一个可用的文件命名协议:

  • 使用简短但有意义的文件名,使用重要元素,例如ABCProject_Interview_P012_2014-06-18(其中P012是参与者ID号)。您应该能够通过查看文件名来判断文件中有什么。您可能使用的一些属性包括:项目标识符、数据收集方法或工具、数据类型、位置、主题、日期、版本号。
  • 不要让文件名太长(32个字符应该是最大值)。避免文件名和路径中的冗余信息。
  • 文件名中避免空格;你可以使用_或-来分离元素,或者使用CamelCase一起运行它们。
  • 考虑文件的排序顺序,因为这将有助于识别和检索。文件将根据名称中使用的字符类型进行排序,首先是特殊字符(例如@),然后是数字,然后是字母字符。例如,文件datafile.txt,如果重命名,将按照以下顺序排序@_datafile.txt, 001_datafile.txt, 20190731_datafile.txt。
  • 从大单位到小单位倒序书写日期(例如20140618),按时间顺序排序;使用前导零(如001,002等,而不是1,2等)来写数字排序;
  • 在相关的文件名中嵌入版本控制:日期和时间或版本号将能够准确识别文件的当前版本和以前的版本。

版本控制

版本控制或版本控制是记录一个文件或一组文件随时间变化的系统。在处理数字项目时,这一点在任何时候都很重要,因为数字项目很容易被修改。如果你在一个研究小组工作,并在你们之间共享和修改文件,这是必不可少的。由不同的人修改的文件的不受控制的版本很容易扩散,导致您失去对数据及其所经历的转换的跟踪。在最坏的情况下,这可能会损害数据的完整性——例如,如果原始数据文件被覆盖。

您可以做一些简单的事情来实施有效的版本控制。下面这些并不都需要使用。这取决于工作的性质和数据所经历的处理过程。更详细的指导版本控制可从英国数据服务部获得。

  • 只允许授权用户修改文件。在文件/存储区域中使用访问控制和读/写权限,将修改文件的能力限制为仅授权用户。
  • 原始数据文件、主版本和里程碑版本的文件应该是只读的,并在指定的权限下存储在单独的指定位置。
  • 将非当前版本的文件存储在单独的文件夹中。您可能不需要保留文件的所有旧版本,但保留里程碑版本或旧主文件可能是一个很好的实践;
  • 使用Dropbox或谷歌Drive等文件共享服务来同步存储在多个位置的文件版本,或使用版本控制软件,例如Subversion (SVN), MS SyncToy;
  • 文档中的版本控制表中的文档更改。这应该包含版本号,作者,目的/变更和日期的标题;
  • 使用文件名来标识版本,例如draft, final, v_001。
联系我们

电子邮件

罗伯特•达比研究数据经理

researchdata@reading.ac.uk

电话:0118 378 6161

Baidu
map