国家科技图书文献中心

引文描述和引文关系元数据描述规范

  • 修订历史

    2022-02-21

    在数据描述样例中,增加了样例数据下载入口。

    2021-12-22

    根据使用反馈与实际数据处理需求,将ref-list出现频次与统一文献元数据标准3.1保持一致。

    2021-12-7

    (1)归一关系计算是引文关系计算的中间过程,不做数据交互。

    (2)引文描述元数据结构图中增加了article-id-group。

    (3)修订了数据描述样例。

    2021-10-28

    引文描述元数据增加了process-group元素集。

    2020-4-13

    “引文关系元数据标准”名称改为“引文描述和引文关系元数据标准”。

  • 1 概述

    引文描述和引文关系元数据规范分为引文描述数据规范、引文关系数据规范两部分。引文描述元数据原附属于统一文献元数据标准,为了数据交互的便利,增加可独立的引文描述数据规范,作为数据交互的首选方案。

    引文关系数据规范描述文献之间的被引关系和耦合关系。被引关系描述一篇文献被后来的一篇或多篇文献引用的情况,如图1中文献C被文献A引用,也被文献B引用。耦合关系描述两篇文献共同引用一篇或多篇文献的情况,如图1中文献A和B共同引用了C、D、E、F四篇文献。

    图1 引文关系

  • 2. 术语和定义

    2.1 原始文献

    原始文献是指作者以本人的研究或研制成果为依据而创作的文献,在本规范中是指与参考文献对应的来源文献。

    2.2 参考文献

    参考文献是为撰写或编辑论文和著作而引用的有关文献资源信息,也被称为被引文献。

    2.3 施引文献

    施引文献是指引用了参考文献的那篇文献。

    2.4 被引关系

    被引关系描述一篇文献被后来发表的一篇或多篇文献引用的情况。

    2.5 被引频次

    以一定数量来源期刊为基础而统计的文献被来源期刊所引用的总次数。

    2.6 耦合关系

    耦合关系描述两篇文献共同引用了一篇或多篇相同文献的情况。

    2.7 耦合数

    耦合数是两篇文献共有的参考文献的篇数。

  • 3. 引文描述数据规范

    引文描述数据规范用来描述参考文献的详细信息,复用统一文献元数据标准中的参考文献元素集,并复用统一文献元数据标准中的单篇文献唯一标识符article-id,将单篇文献与引文元数据关联起来。增加辅助性元素article-id-group将article-id封装起来。如图2所示。

    图2 引文描述元数据

  • 4. 引文关系元数据规范

    引文关系数据规范包括被引关系、耦合关系。

    (1)被引关系

    被引关系描述一篇文献被后来发表的一篇或多篇文献引用的情况。被引关系的主体是参考文献,描述该篇文献作为参考文献在后来发表的文献中出现的情况。

    被引关系以cited-by为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括文献唯一标识符、施引文献数量即文献被引频次、施引文献唯一标识符、操作日期信息。如图3所示。

    图3 文献被引关系

    计算被引关系,首先要将同一篇文献的不同表达形式识别出来,包括参考文献与原始文献的归一,也包括参考文献与参考文献的归一。若参考文献与原始文献归一上,则文献唯一标识符为原始文献唯一标识符,即单篇文献唯一标识符article-id或来源唯一标识符source-id。 若文献数据库中无原始文献,或参考文献未与原始文献归一上,则文献唯一标识符为参考文献标识符pub-id。

    文献被引频次通过citings中的属性count描述。施引文献为实际引用该篇文献的文献。施引文献唯一标识符为单篇文献唯一标识符article-id@pub-id-type=“nstl_spec”或来源唯一标识符source-id@source-id-type=“nstl_spec”, 来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据。由于一篇文献可能被一篇或多篇施引文献引用,因此,施引文献唯一标识符可能有1个或多个。

    (2)耦合关系

    耦合关系描述两篇文献共同引用了一篇或多篇相同文献的情况。耦合关系的主体为施引文献。如果A和B两篇施引文献共同引用了一篇或多篇参考文献,或者说它们共同具有一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。

    耦合关系以coupling为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括两篇施引文献的唯一标识符、共同的被引文献数量即耦合数、共同的被引文献唯一标识符、操作日期信息。如图4所示。

    图4 文献耦合关系

    归一也是耦合关系的基础,两篇施引文献的唯一标识符来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据中的单篇文献唯一标识符article-id或来源唯一标识符source-id,两两组合为article-id与article-id、article-id与source-id、source-id与article-id、或者source-id与source-id。文献耦合数通过citeds中的属性count描述。被引文献唯一标识符来自于归一识别出的原始文献唯一标识符,为单篇文献唯一标识符article-id、来源唯一标识符source-id,或参考文献标识符pub-id。

    耦合关系可通过计算两篇施引文献的参考文献的交集得到,交集数量为耦合数。文献耦合反映的文献间的关系是一种固定的长久的关系,文献耦合数固定不变。

     

  • 5. 元素、属性定义

    参见统一文献元数据标准中元素、属性定义。

  • 6. 数据描述样例

    6.1 引文描述数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示

    6.2 引用关系样例

    (1)文献被引关系描述样例

       1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

       2)样例xml内容展示

    此第一个样例描述唯一标识符为C2ART20190516080937031WX77YSSFLR的文献被引用情况,样例中该文献被引用次数为6次,与之相对的是6个施引文献唯一标识符。

    第二个样例描述文献数据库中没有原始文献或没与原始文献归一上的参考文献C2REF20190105181048701F80T3SPM6T的被引频次,被引频次为5次,与之相对的是5个施引文献唯一标识符。

    (2)文献耦合关系描述样例

       1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

       2)样例xml内容展示

    此第一个样例描述唯一标识符为C2ART20190516040138897DA174EKJML和C2ART20190516012402536F9DPO4Z2OL的文献耦合情况,样例中耦合数为3,与之相对的是3个被引文献唯一标识符。被引文献是归一上的原始文献。

    第二个样例描述唯一标识符为C2ART201809061502258517S36SNJCVR和C2ART20180223085832707HOWVNLTV4L的文献耦合情况,样例中耦合数为4,与之相对的是4个被引文献唯一标识符。被引文献包括2个归一上的原始文献、2个文献数据库中没有原始文献或没有与原始文献归一上的参考文献。