国家科技图书文献中心

引文描述和引文关系元数据标准

  • 修订历史

    2020.4.13 “引文关系元数据标准”名称改为“引文描述和引文关系元数据标准”
  • 1 概述

    引文描述和引文关系元数据标准分为引文描述元数据标准和引文关系元数据标准两部分。引文关系元数据标准制订的目的是描述文献之间的归一关系,以及文献之间的引用关系。引文关系元数据标准遵循《NSTL统一文献元数据标准》的规定,为满足引文关系数据描述,以及为便于引用关系数据交互,将该标准中的归一关系、引用关系独立成单个标准。

    归一关系数据标准用来描述同一篇文献的不同表达形式信息。引用关系数据标准包括被引关系、耦合关系。被引关系描述一篇文献被后来的一篇或多篇文献引用的情况。耦合关系用来描述两篇文献共同引用一篇或多篇文献的情况。引文关系元数据标准结构如图1所示。

    图1 引文关系元数据标准

    引文描述元数据标准原附属于文献描述元数据标准,为数据交互的便利,增加了可独立的引文描述元数据标准,可作为数据交换的首选方案。

  • 2. 术语和定义

    2.1 原始文献

    原始文献是指作者以本人的研究或研制成果为依据而创作的文献,在本标准中是指与参考文献对应的来源文献。

    2.2 参考文献

    参考文献是为撰写或编辑论文和著作而引用的有关文献资源信息,也被称为被引文献。

    2.3 施引文献

    施引文献是指引用了参考文献的那篇文献。

    2.4 归一关系

    归一关系描述同一篇文献的不同表达形式信息。

    2.5 被引关系

    被引关系描述一篇文献被后来发表的一篇或多篇文献引用的情况。

    2.6 耦合关系

    耦合关系描述两篇文献共同引用了一篇或多篇相同文献的情况。

    2.7 耦合强度

    耦合强度用来描述具有耦合关系的文献在学科内容上存在某种联系或相关性的程度,量度单位是两篇文献共有的参考文献的篇数。

  • 3. 归一关系数据标准

    归一关系数据标准用来描述同一篇文献的不同表达形式信息。包括参考文献与原始文献的归一,也包括参考文献与参考文献的归一。

    (1)参考文献与原始文献的归一关系

    参考文献与原始文献的归一关系是在识别参考文献与原始文献为同一篇文献后,通过标识符的形式将两者关联起来。如图2所示。以same-as为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括原始文献唯一标识符、参考文献标识符、操作日期信息。

    图2 参考文献与原始文献的归一关系

    其中,原始文献唯一标识符是单篇文献唯一标识符article-id@pub-id-type=“nstl_spec”或来源唯一标识符source-id@source-id-type=“nstl_spec”。原始文献唯一标识符为article-id,表示文献为期刊论文、会议论文、学位论文、科技报告等。原始文献唯一标识符为source-id,表示文献为专著、丛书等,此类文献没有article-id。原始文献唯一标识符来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据。若多篇参考文献与一篇原始文献归一上,则采用多个same-as描述。

    (2)参考文献与参考文献的归一关系

    参考文献与参考文献的归一关系是在文献数据库中没有原始文献或参考文献未能与原始文献准确识别关联的情况下,将认为是同一篇文献的参考文献关联起来。如图3所示。同样以same-as为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括用作关联的参考文献标识符pub-id@pub-id-type=“internal_id”、被关联的参考文献标识符pub-id@pub-id-type=“internal_id”、操作日期信息。

    图3 参考文献与参考文献的归一关系

    其中,用作关联的参考文献标识符从归一上的参考文献标识符中选择一个,与其它归一上的参考文献标识符进行关联。若参考文献未与其它参考文献归一上,则与自身进行归一。参考文献标识符均来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据。若多篇参考文献归一上,则采用多个same-as描述。

     

  • 4. 引用关系数据标准

    引用关系数据标准包括被引关系、耦合关系。

    (1)被引关系

    被引关系描述一篇文献被后来发表的一篇或多篇文献引用的情况。被引关系的主体是参考文献,描述该篇文献作为参考文献在后来发表的文献中出现的情况。被引关系以cited-by为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括文献唯一标识符、施引文献数量即文献被引次数、施引文献唯一标识符、操作日期信息。如图4所示。

    图4 文献被引关系

    归一关系是被引关系的基础,若参考文献与原始文献归一上,则文献唯一标识符为归一关系中的原始文献唯一标识符,即单篇文献唯一标识符article-id或来源唯一标识符source-id。 若文献数据库中无原始文献,或参考文献未与原始文献归一上,则文献唯一标识符为归一关系中的参考文献标识符pub-id。

    文献被引次数通过citings中的属性count描述。施引文献为实际引用该篇文献的文献。施引文献唯一标识符为单篇文献唯一标识符article-id@pub-id-type=“nstl_spec”或来源唯一标识符source-id@source-id-type=“nstl_spec”, 来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据。由于一篇文献可能被一篇或多篇施引文献引用,因此,施引文献唯一标识符可能有1个或多个。

    (2)耦合关系

    耦合关系描述两篇文献共同引用了一篇或多篇相同文献的情况。耦合关系的主体为施引文献。如果A和B两篇施引文献共同引用了一篇或多篇参考文献,或者说它们共同具有一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。

    耦合关系以coupling为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括两篇施引文献的唯一标识符、共同的被引文献数量即耦合强度、共同的被引文献唯一标识符、操作日期信息。如图5所示。

    图5 文献耦合关系

    归一关系也是耦合关系的基础,两篇施引文献的唯一标识符来自于进行引文关系计算的基础数据即遵循统一文献元数据标准格式的XML原始文献数据中的单篇文献唯一标识符article-id或来源唯一标识符source-id,两两组合为article-id与article-id、article-id与source-id、source-id与article-id、或者source-id与source-id。文献耦合强度通过citeds中的属性count描述。被引文献唯一标识符来自于归一关系中的原始文献唯一标识符,为单篇文献唯一标识符article-id、来源唯一标识符source-id或参考文献标识符pub-id。

    耦合关系可通过计算两篇施引文献的参考文献的交集得到,交集数量为耦合强度。文献耦合反映的文献间的关系是一种固定的长久的关系,文献耦合强度固定不变。

  • 5. 引文描述元数据

    引文描述元数据标准用来描述参考文献的详细信息,复用统一文献元数据标准中的参考文献元素集,并复用统一文献元数据标准中的单篇文献唯一标识符article-id或来源唯一标识符source-id,将单篇文献或来源(均表示原始文献)与引文元数据关联起来。如图6所示。

    图6 引文描述元数据

  • 6. 元素、属性定义

    参见统一文献元数据标准中元素、属性定义。

  • 7. 数据描述样例

    (1)归一关系示例

    1)参考文献与原始文献归一关系描述示例

    C2ART201809061502258517S36SNJCVR是原始文献唯一标识符,与之相对的是归一上的参考文献标识符。

    2)参考文献与参考文献归一关系描述示例

    B3REF20170404143546766T49G2FAN5F是从参考文献标识符中选取的一个,在与之对应的参考文献标识符中具有相同的标识符及其它归一上的标识符。

    (2)引用关系示例

    1)文献被引关系描述示例

    此示例描述唯一标识符为C2ART201809061502258517S36SNJCVR的文献被引用情况,示例中该文献被引用次数为5次,与之相对的是5个施引文献唯一标识符。

    2)文献耦合关系描述示例

    此示例描述唯一标识符为C2ART201809061502258517S36SNJCVR和C2ART20180223085832707HOWVNLTV4L的文献耦合情况,示例中耦合强度为4,与之相对的是4个被引文献唯一标识符。

    (3)引文描述元数据示例