“域”和“数据集”的区别

 

“域”和“数据集”这两个术语在 CDISC 的命名法中很常用,在研究数据制表模型 (SDTM) 中也经常出现。例如,SDTM v1.8 包含 134 个“域”实例,并指出“特定主题的观察结果集合被视为域”。该模型包含 78 个数据集实例,模型中的某些结构称为“数据集”而不是“域”。域和数据集之间有区别吗?

 

CDISC 词汇表对这些术语的定义如下:

 

:一组具有共同特定主题的逻辑相关观察结果,通常为临床调查中的所有受试者收集。注意:关系的逻辑可能与数据的科学主题或其在试验中的作用有关。示例域包括实验室测试结果 (LB)、不良事件 (AE)、伴随用药 (CM)。[SDTM 实施指南版本 3.2 之后,CDISC.org] 另请参阅一般观察类别。


数据集:单个文件中结构化数据的集合。[CDISC、ODM 和 SDS] 与分析数据集、制表数据集比较。
用更通俗的话来说,域是一组相关的观察结果,而数据集是与该组观察结果相关的数据结构。域和数据集使用相同的命名法,这就是为什么它们经常被混淆的原因。

 

域和数据集之间的区别在提交中将一般观察类域拆分为多个数据集的情况下最为明显。常见示例包括根据大小拆分实验室测试结果 (LB) 域、按问卷拆分问卷 (QS) 域以及按父域拆分事件或干预结果 (FA) 域。

但是,由于在大多数情况下,概念域与基于该概念域的数据集之间存在一对一的关系,因此这些词在标准中可互换使用,因此大多数用户也会交替使用。被称为“关系数据集”的结构之所以被赋予这个名称,是因为它们是连接不同数据集中表示的信息的机制,而不是关于研究对象的观察。请注意,没有一个关系数据集包含变量域。但是,在提交中,这些数据集需要数据集名称,并且这些名称中使用的字符串包含在 CDISC 代码列表中,称为“SDTM 域缩写”。

 

总之,“域”和“数据集”的含义有明显的区别,但鉴于这两个术语的命名约定相同,在许多情况下它们可以被视为可互换的。

创建时间:2024-12-09 13:12
浏览量:0
首页    法规资讯    “域”和“数据集”的区别