国家科技图书文献中心

  • 一、联合目录元数据设计需求分析

    NSTL联合目录元数据规范是根据中心资源特征的描述需求而设计的一套旨在从多个维度体现资源对象所涉及的特征属性以及它们之间的关联、层级关系的中心资源描述元数据规范,旨在促进各成员馆书目的关联融合与资源发现。中心资源描述主要有两大关键点:

    1. 文献资源描述对象特征复杂

    从文献类型上看,NSTL联合目录系统2.0收录资源主要有期刊、会议录、科技丛书、科技报告、文集汇编、工具书和科技专著七种,需要对不同文献类型的资源的特征信息进行描述,如期刊的期刊沿革信息、会议录的会议信息、丛书的丛编信息等。

    从采集方式上看,中心之前资源工作的重点为印本保障,资源载体形式主要为印本,近几年中心加大了电子资源的采集力度,现有电子资源有以印本方式订购的E-only资源(单品种订购电子资源)、OA资源、全国开通回溯期刊资源、全国开通现刊资源、成员馆捆绑订购的数据库资源等,需要对不同采集来源的资源的获取方式、使用权益等信息进行描述,从而保证资源获取的可靠性和使用的合法性。

    从媒介类型上看,电子资源又可以区分出Online、CD、USB、Email几种,不同媒介类型的资源在描述信息源的选取和服务方式上各有不同。

    2. 遵循NSTL统一文献元数据标准

    2016年7月11日,NSTL统一文献元数据标准发布实施。NSTL联合目录系统作为中心业务系统,将启用NSTL统一文献元数据标准,并基于此进行个性化补充完善。根据NSTL统一文献元数据标准,资源母体描述的对象是单一物理本或数字资源中一个论文集合,因此NSTL联合目录元数据规范需要在常规的品种描述的基础上,建立基于单册的母体管理,对每一物理本的外部特征、馆藏信息、获取信息等进行详细描述。即使用同一套元数据规范对资源的品种和物理本信息分别进行描述。

  • 二、联目元数据设计思路

    1. 使用同一套元数据方案对不同书目层级、不同文献类型、不同载体类型、不同采集方式的文献进行统一描述。

    2. 单册书目著录对象为同品种、同载体、同媒介类型、同采集方式的资源,同种资源不同载体、媒介、采集方式分别建立独立书目。期刊除单册著录外,书目分分散数据和融合数据两个层次,并相互关联。

    3. 通过核心元素集对资源的基本书目信息、馆藏信息、关联资源信息、馆藏信息和管理信息进行描述。在此基础上,根据资源的书目层级、文献类型、载体类型、采集方式等,建立不同的书目数据,从不同维度选用对应的特征元素集对资源特征进行揭示。

    4. 扩展丰富元数据,包括来源、馆藏/获取信息,支撑相关业务系统数据需要。

    5. 尽量减小对上下游系统与本地编目工作的影响,保证历史数据的完备性和一致性。

  • 三、术语解释

    单册书目:一个物理本对应的书目。对非刊文献而言,即一般意义上对每一本非刊文献著录的结果。对期刊而言,指期刊的某一卷期对应的书目,是由一般意义上的“期刊书目 签到数据”组合而成的书目。不同载体类型、不同媒介类型、不同采集来源的单册均分别进行描述,形成单册分散书目,同时建立不同单册之间的关联,汇聚成单册融合书目。

    期刊品种书目:一般意义上的期刊书目,按品种对期刊的出版频率、沿革历史等信息进行描述。期刊品种书目也分为分散书目和融合书目,不同载体、媒介、采集方式的期刊品种对应不同的期刊品种分散书目,同一种期刊的分散书目之间进行关联,汇聚成期刊品种融合书目。

    期刊规范书目:期刊规范记录,即在期刊品种融合书目的基础上对期刊历史沿革关系进行规范管理,给有沿革关系的资源赋予相同的逻辑ID,形成期刊规范记录。通过逻辑ID,将一个有历史沿革的期刊,其所有的书目都关联。

  • 四、元数据模型结构

    参照最新发布的《NSTL统一文献元数据标准》,结合NSTL联合目录资源描述需求特征,设计了与其相关的6个元素集,即来源元素集、贡献者/机构元素集、主题/分类/关键词元素集、操作信息元素集和获取管理元素集。包括有描述性元素、辅助性元素和元素属性。其中,大部分元素集和元素是复用《NSTL统一文献元数据标准》,来源元素集和获取管理元素集有少量扩展。元素集之间的关系可以概括为:一个来源可以有一个或多个贡献者(isCreatedBy/isEditedBy),可以由一个或多个机构出版(isPublishedBy),可以有一个或多个主题/分类/关键词(hasSubject),可以有零个或多个会议信息(isPublishedAt),可以有一个或多个获取管理信息(isAvailableAs),可以有一个或多个操作信息(hasOperation),一个贡献者可以属于一个或多个机构(AffiliatedInstitution)。

  • 五、属性取值

    《NSTL联合目录元数据规范》的元素集和元素均复用自《NSTL统一文献元数据》,主要通过对属性取值进行限定的方式来进行扩展,来满足联目系统多类型多层级资源描述的需要。

    例如:

    source-id-type

    当source-id-type="single_volume_id"表示联目单册书目id,source-id-type="separate_id"表示联目分散书目id,source-id-type="conbined_id"表示联目融合书目id,source-id-type="order-no"表示中图刊号,source-id-type="conf_no"表示会议文献号,source-id-type="report-no"表示科技报告号,source-id-type="oa_id"表示OA系统号, source-id-type="wz_id"表示文综系统资源id, source-id-type="order_id"表示中心唯一订购号,source-id-type="local_record_id"表示本地书目id,source-id-type="local_issue_id "表示本地签到id,source-id-type="nstl_source_spec "表示联目资源ID。

    specific-use

    当描述source-title时,specific-use ="pref"表示正题名,specific-use="key"表示识别题名;

    当描述source-subtitle时,specific-use="part-no"表示分辑号,specific-use="part-name"表示分辑名;

    当描述ISSN时,specific-use="pref"表示规范的ISSN,specific-use="wrong"表示错误的ISSN,specific-use="invalid"表示废止的ISSN;

    当描述source-id时,使用属性specific-use ="a",a为对应馆藏机构的institution-id,用以区分各成员馆的本地书目ID;

    当描述volume、issue时,specific-use="format"表示规范的卷、期信息。

    当描述institution时,specific-use="host"表示主办者,specific-use="organizer"表示承办者,specific-use="publisher"表示会议录的出版者。

    publication-format

    当描述记录时,publication-format="print"表示资源对象媒介类型为印本,publication-format=&qu