国家科技图书文献中心

  • 修订历史

    2024年1月24日修订内容 (1)元素修订:修改source-title频次,由1改为1..*。source-subtitle增加属性specific-use。 (2)明确属性值定义:当描述source-title时,specific-use ="pref"表示正题名,specific-use ="alternative"表示变异题名,specific-use="distinct"表示识别题名;当描述source-subtitle时,specific-use ="pref"表示副题名,specific-use="part-no"表示分辑号,specific-use="part-name"表示分辑名。 (3)增加沿革关系描述。 (4)说明:NSTL统一元数据标准3.1中source-title频次为1,对应联目元数据source-title@specific-use ="pref";source-subtitle对应联目元数据source-subtitle@specific-use ="pref"。
  • 一、联合目录元数据设计需求分析

    NSTL联合目录元数据规范是根据中心资源特征的描述需求而设计的一套旨在从多个维度体现资源对象所涉及的特征属性以及它们之间的关联、层级关系的中心资源描述元数据规范,旨在促进各成员馆书目的关联融合与资源发现。中心资源描述主要有两大关键点:

    1. 文献资源描述对象特征复杂

    从文献类型上看,NSTL联合目录系统2.0收录资源主要有期刊、会议录、科技丛书、科技报告、文集汇编、工具书和科技专著七种,需要对不同文献类型的资源的特征信息进行描述,如期刊的期刊沿革信息、会议录的会议信息、丛书的丛编信息等。

    从采集方式上看,中心之前资源工作的重点为印本保障,资源载体形式主要为印本,近几年中心加大了电子资源的采集力度,现有电子资源有以印本方式订购的E-only资源(单品种订购电子资源)、OA资源、全国开通回溯期刊资源、全国开通现刊资源、成员馆捆绑订购的数据库资源等,需要对不同采集来源的资源的获取方式、使用权益等信息进行描述,从而保证资源获取的可靠性和使用的合法性。

    从媒介类型上看,电子资源又可以区分出Online、CD、USB、Email几种,不同媒介类型的资源在描述信息源的选取和服务方式上各有不同。

    2. 遵循NSTL统一文献元数据标准

    2016年7月11日,NSTL统一文献元数据标准发布实施。NSTL联合目录系统作为中心业务系统,将启用NSTL统一文献元数据标准,并基于此进行个性化补充完善。根据NSTL统一文献元数据标准,资源母体描述的对象是单一物理本或数字资源中一个论文集合,因此NSTL联合目录元数据规范需要在常规的品种描述的基础上,建立基于单册的母体管理,对每一物理本的外部特征、馆藏信息、获取信息等进行详细描述。即使用同一套元数据规范对资源的品种和物理本信息分别进行描述。

  • 二、联目元数据设计思路

    1. 使用同一套元数据方案对不同书目层级、不同文献类型、不同载体类型、不同采集方式的文献进行统一描述。

    2. 单册书目著录对象为同品种、同载体、同媒介类型、同采集方式的资源,同种资源不同载体、媒介、采集方式分别建立独立书目。期刊除单册著录外,书目分分散数据和融合数据两个层次,并相互关联。

    3. 通过核心元素集对资源的基本书目信息、馆藏信息、关联资源信息、馆藏信息和管理信息进行描述。在此基础上,根据资源的书目层级、文献类型、载体类型、采集方式等,建立不同的书目数据,从不同维度选用对应的特征元素集对资源特征进行揭示。

    4. 扩展丰富元数据,包括来源、馆藏/获取信息,支撑相关业务系统数据需要。

    5. 尽量减小对上下游系统与本地编目工作的影响,保证历史数据的完备性和一致性。

  • 三、术语解释

    单册书目:一个物理本对应的书目。对非刊文献而言,即一般意义上对每一本非刊文献著录的结果。对期刊而言,指期刊的某一卷期对应的书目,是由一般意义上的“期刊书目 签到数据”组合而成的书目。不同载体类型、不同媒介类型、不同采集来源的单册均分别进行描述,形成单册分散书目,同时建立不同单册之间的关联,汇聚成单册融合书目。

    期刊品种书目:一般意义上的期刊书目,按品种对期刊的出版频率、沿革历史等信息进行描述。期刊品种书目也分为分散书目和融合书目,不同载体、媒介、采集方式的期刊品种对应不同的期刊品种分散书目,同一种期刊的分散书目之间进行关联,汇聚成期刊品种融合书目。

    期刊规范书目:期刊规范记录,即在期刊品种融合书目的基础上对期刊历史沿革关系进行规范管理,给有沿革关系的资源赋予相同的逻辑ID,形成期刊规范记录。通过逻辑ID,将一个有历史沿革的期刊,其所有的书目都关联。

  • 四、元数据模型结构

    参照最新发布的《NSTL统一文献元数据标准》,结合NSTL联合目录资源描述需求特征,设计了与其相关的6个元素集,即来源元素集、贡献者/机构元素集、主题/分类/关键词元素集、操作信息元素集和获取管理元素集。包括有描述性元素、辅助性元素和元素属性。其中,大部分元素集和元素是复用《NSTL统一文献元数据标准》,来源元素集和获取管理元素集有少量扩展。元素集之间的关系可以概括为:一个来源可以有一个或多个贡献者(isCreatedBy/isEditedBy),可以由一个或多个机构出版(isPublishedBy),可以有一个或多个主题/分类/关键词(hasSubject),可以有零个或多个会议信息(isPublishedAt),可以有一个或多个获取管理信息(isAvailableAs),可以有一个或多个操作信息(hasOperation),一个贡献者可以属于一个或多个机构(AffiliatedInstitution)。

  • 五、属性取值

    《NSTL联合目录元数据规范》的元素集和元素均复用自《NSTL统一文献元数据》,主要通过对属性取值进行限定的方式来进行扩展,来满足联目系统多类型多层级资源描述的需要。

    例如:

    source-id-type

    当source-id-type="single_volume_id"表示联目单册书目id,source-id-type="separate_id"表示联目分散书目id,source-id-type="conbined_id"表示联目融合书目id,source-id-type="order-no"表示中图刊号,source-id-type="conf_no"表示会议文献号,source-id-type="report-no"表示科技报告号,source-id-type="oa_id"表示OA系统号, source-id-type="wz_id"表示文综系统资源id, source-id-type="order_id"表示中心唯一订购号,source-id-type="local_record_id"表示本地书目id,source-id-type="local_issue_id "表示本地签到id,source-id-type="nstl_source_spec "表示联目资源ID。

    specific-use

    当描述source-title时,specific-use ="pref"表示正题名,specific-use ="alternative"表示变异题名,specific-use="distinct"表示识别题名;

    当描述source-subtitle时,specific-use ="pref"表示副题名,specific-use="part-no"表示分辑号,specific-use="part-name"表示分辑名;

    当描述ISSN时,specific-use="pref"表示规范的ISSN,specific-use="wrong"表示错误的ISSN,specific-use="invalid"表示废止的ISSN;

    当描述source-id时,使用属性specific-use ="a",a为对应馆藏机构的institution-id,用以区分各成员馆的本地书目ID;

    当描述volume、issue时,specific-use="format"表示规范的卷、期信息。

    当描述institution时,specific-use="host"表示主办者,specific-use="organizer"表示承办者,specific-use="publisher"表示会议录的出版者。

    publication-format

    当描述记录时,publication-format="print"表示资源对象媒介类型为印本,publication-format="online"表示资源对象媒介类型为网络版,publication-format="DVD"表示表示资源对象媒介类型为DVD,publication-format="CD"表示资源对象媒介类型为CD,publication-format="Email"表示资源对象媒介类型为Email,publication-format="USB"表示表示资源对象媒介类型为USB;

    当描述ISSN、ISBN时,publication-format="print"表示印本标准号,publication-format="electronic"表示电子标准号,publication-format="series"表示丛书ISSN。

    date-type

    当描述期刊出版日期时,date-type="start"表示起始年,date-type="end"表示终止年。

    abstract-type

    当abstract-type="preface"时表示前言,abstract-type="abstract"时表示摘要,abstract-type="reviews"时表示书评,abstract-type="database"时,表示数据库简介。

    notes-type

    当notes-type="editor_recommendation"表示编辑推荐,notes-type="frequency"表示出版频率,notes-type="edition"表示版本,notes-type="ISSN_change"表示ISSN变更附注,notes-type="turn_OA"表示转OA出版时间附注,notes-type="turn_Eonly"表示转E-only出版时间附注,notes-type="publish_volume_range"时表示期刊的出版卷期范围,notes-type="oa_type"时表示资源或平台OA类型,notes-type="available_time"时表示资源或平台获取时限,notes-type="access_volume_range"时表示期刊的获取卷期范围,notes-type="holding_volume_range"时表示期刊的馆藏卷期范围,notes-type="fund_source"时,表示经费类型,经费类型取值可以为NP(NSTL经费支持的印本资源,NSTL-funded Printed Resources),OA(开放获取资源,Open Access),E-only(以印本方式订购的电子资源,E-only),BD(成员馆捆绑订购的数据库资源,Bundled),NC(全国开通现刊资源,Nationl-licensed Current Issues),NB(全国开通回溯资源,Nationl-licensed Back Issues),SP(书评,ShuPing),LC(本地自有经费,Local)。

    class-group-type

    当class-group-type="CLC"表示中图分类号,class-group-type="DDC"表示杜威分类号,class-group-type="LASC"表示科图分类号,class-group-type="NSTL"表示NSTL统一分类体系,class-group-type="LC"表示国会图书馆分类号。

    contrib-type

    当contrib-type="author"表示作者,contrib-type="editor"表示编辑。

    contrib-id-type

    当contrib-id-type="nstl_union"表示NSTL联目系统贡献者id。

    conf-id-type

    当conf-id-type="nstl_union"表示NSTL联目系统会议id。

    conf-name-type

    当conf-name-type="parent"表示父会,conf-name-type="child"表示子会。

    conf-num-type

    当conf-num-type="session" 表示序数词形式的会议届信息,conf-num-type="session-num" 表示基数词形式的会议届信息,conf-num-type="times-num"表示会议次信息。

    access-type

    当access-type="holding"表示印本馆藏,access-type="E-only"表示以印本方式订购的E-only资源,access-type="open access"表示开放获取资源,access-type="National-licensed Current issues"表示NSTL全国开通现刊资源(NC),access-type="National-licensed Back issues"表示NSTL全国开通回溯资源(NB),access-type="Bundled"表示成员馆捆绑订购的数据库资源(BD),access-type="source"表示多来源数据。

    institution-id-type

    当institution-id-type="nstl_union"表示NSTL联目系统机构id。

     

    其他未特别说明,但是联合目录元数据规范中使用到的属性,均遵从《NSTL统一文献元数据》的有关规定。

  • 六、沿革关系描述

    期刊 沿革信息通过沿革关系元数据单独输出,沿用NSTL统一文献元数据标准定义的元素和属性,以relation为根节点,根节点的属性包括status(数据状态),属性取值为normal(正常)或delete(删除),默认为正常。根节点的元素包括文献唯一标识符、关系类型即具体关系说明和相关文献唯一标识符、操作日期信息。

    期刊沿革信息交互时,沿革关系数据仅单向输出,主语为后刊,使用的关系词为:

    属性值 关系说明

    continues

    继承

    continues_part

    部分继承

    absorbed

    吸收

    absorbed_part

    部分吸收

    merge

    由…与…合并而成

    separated from

    分自

     

  • 七、元数据描述样例

    1. 期刊品种书目数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示

    2. 期刊单册书目数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示

    3. 非刊单册书目数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示

    4. OA非刊单册书目数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示

    5. 沿革关系数据样例

    (1)样例xml下载

        提供xml样例数据查看和下载,样例数据内容同下。

    (2)样例xml内容展示