-
修订历史
2023年3月17日修改内容 将附录C 数据源机构或系统名称表中的archives取值修改为nstlgkdb,并增加nstlxkdb取值。同时对Schema的data-source属性、ext-link-type属性取值进行了相应调整。 在辅助性元素access-group中增加了database取值为nstlgkdb的数据示例。 2023年2月9日修改内容 将附录C 数据源机构或系统名称表中的OA取值修改为nstloadb,同时对Schema进行了调整 在辅助性元素access-group中增加了access-type取值为open access的数据示例 2022年8月23日修改内容 附录A中NSTL现有业务系统标识里增加了B8(NSTL新数据加工系统),Schema做相应修改 2022年8月18日修改内容 为便于历史数据处理,语种名称代码中增加了3个旧版中的语种 2022年7月25日修改内容 附录C 数据源机构或系统名称表,增加了OA取值 2022年6月27日修改内容 1. 正文-规范性引用文件,以及相关标准栏目,增加了ISO 3166-1-2020 世界各国和地区名称代码文件及excel表格下载。 2022年4月21日修改内容 1. 正文-规范性引用文件,以及相关标准栏目,增加了语种名称代码、世界各国和地区名称代码(GB/T 2659-2000)excel表格下载。 2. 增加了附录E-世界各国和地区名称代码-2字母代码,及附录F-语种名称代码第1部分-2字母代码。 3.1版本相较于3.0版本修订内容: 1. 增加了oases、oas两个辅助性元素;增加了is_OA、type两个属性 2. 修改了获取管理元素集结构图 3. 修改了Schema,根据元数据标准文本内容,对于属性取值进行了枚举。并将上述两条修改体现在Schema中。 -
1 导言
国家科技图书文献中心(以下简称NSTL)面向全国用户提供全面的科技文献数据检索和原文传递服务。经过多年的发展,NSTL已经形成了从科技信息采集、加工、发布到服务的数字化业务流程,各个子系统相互协同、相互依赖,共同为用户提供服务。而NSTL原有的元数据标准仅能满足印本时代数据库建设的需要,无法满足描述复合资源和数字资源的需要。建设NSTL统一文献元数据标准,支持多种数据的统一描述,形成一致的数据描述体系,对各个层面业务系统和服务系统的建设在数据层面进行规范,将为NSTL数据集成融合、数据分析和数据挖掘,以及不同应用服务系统间的互操作建立统一的数据基础。
本标准的编制遵循文献元数据制订指南(以下简称指南)的要求,基本流程包括:(1)功能需求分析(2)领域模型构建(3)设计元数据记录(4)编制使用指南(5)计算机描述语言做形式化描述。在编制过程中,分析了NSTL系统建设和服务的功能需求,构建了满足需求功能的领域模型。确定了13个元素集,包括来源、单篇文献、主题/分类/关键词、贡献者/机构、会议、项目、操作信息、获取管理、全文文件、图、表、附加资料和参考文献元素集。不计重复元素和属性,本标准共包含97个描述性元素、55个辅助性元素、51个属性以及4个特殊字符元素。编制了指导描述性元素内容选取和著录需要的使用指南,最后采用XML语言和DTD分别对标准进行了形式化描述,支持在线的数据验证和解析。元数据记录由元素和属性共同构成,通过元素和属性的灵活组合来描述多样化、多层次的资源。部分元素复用了ANSI/NISO Z39.96-2015,期刊文档标签集(JATS 1.1版本)中的元素定义。
-
2 功能需求分析
2.1 愿景
NSTL十三五发展战略明确了从文献保障为主向知识服务基础支撑保障转型的发展方向。统一文献元数据标准的设计要充分考虑NSTL未来五年或更长时间的发展需求,数据标准规范不仅要支持文献的发现的需求,也要支持基于数据的分析评价和知识服务的需求。为NSTL建成国际一流的科技文献信息发现系统,实现从信息服务向知识服务的转型,提供基础的数据标准规范,保证NSTL发展战略目标的实现。
统一文献元数据标准具体的目标是满足NSTL数字业务系统中各个系统应用的需要。涵盖所有NSTL购买、交换、赠与等方式获取的科技类信息资源,包括对期刊、会议录、科技丛书、科技专著、文集汇编、工具书、科技报告、期刊论文、会议论文、学位论文、开放课程、开放课件等文献的统一描述和组织,并具有扩展性,可描述更多的文献类型。可统一描述文献的印刷版本、数字版本,统一描述文献对象各个层次的信息,满足NSTL数字业务流程中文献数据采集、管理和服务的需求。
2.2 基本原则
2.2.1 模块化设计
模块化是现代元数据设计最重要的特征,根据实体关系方法分析抽象出资源对象的实体关系模型,对资源的描述就是对模型中不同实体进行描述,再组合而成。领域模型中具有共同特点的实体对象可复用描述不同层面的数据对象,例如机构实体,实际上可以是研究者所在机构,也可以是出版机构、资助机构和学位授予机构,机构的元素构成是一致的,成为一个公用的实体模块在描述中使用。也为数据管理规范打下基础。
2.2.2 最小粒度原则
统一文献元数据标准确定的数据描述粒度尽可能细致到最小层面,按最小粒度设计元素或属性,以满足分析评价和知识服务的需要。例如机构字段,可细分为一级机构名称、二级机构名称、所在国家、城市、地址等,这样描述为精确定位机构和统计分析机构的产出建立了基础。在统一文献元数据标准的设计中,最小粒度原则贯穿各个层面,尽可能细致地描述文献对象的各个层面信息,为数据的分析评价打下基础。
2.2.3 协同化原则
统一文献元数据标准的设计目的是满足NSTL数字业务系统中各个子系统应用的需要。各个子系统可以基于自己的管理需要描述文献对象的不同深度的内容,但需要遵循同样的数据标准,为后续数据的复用和深入加工建立良好的基础。例如对一篇期刊论文的描述,数据格式应是统一的,编目系统的描述和数据加工系统的描述应协同一致。统一文献元数据标准在数据模型和数据描述上支持各个子系统协同管理的需要,各个子系统通过协同达到最大的数据管理效益。
2.2.4 与国际相关标准兼容
文献数据的管理已有较成熟的数据标准和规范,设计的文献元数据标准应与国际上主流的相关国际标准兼容,以便融入国际数据大环境。特别是充分借鉴DCMI、主流文献服务公司的数据标准和ANSI/NISO Z39.96等,为下一步广泛利用外部数据建立良好的基础,同时在元数据的设计上不仅考虑揭示文献的基本信息,也考虑揭示全文层面的图表和公式等信息,同时预留了全文描述字段内容,充分考虑服务的扩展和发展的需要。
2.3 需求分析
文献检索,包括:①按类型检索文献;②根据文献主题和内容检索文献;③根据文献特征和特定条件检索文献。
文献识别,包括:①根据文献特征识别;②识别文献作者及其所在机构;③通过全球通用的DOI识别文献;④通过本地通用的Local ID识别文献;⑤识别全文的版本和载体形式。
全文获取,包括:①支持用户获取全文;②支持对各种载体和版本全文的获取,提供能够链接到全文的多种选择;③支持对开放获取全文文献的获取。
文献分析评价,包括:①支持引文关系的描述和计量名称识别;②支持人名、机构、资助者和项目的产出分析评价;③支持面向学科的文献分析评价。
获取管理,包括:①文献的印本馆藏信息和网络版本获取授权方式;②来自作者、出版社和其它各个方面的开放获取资源的授权信息。
数据管理,包括:①数据产生、更新、删除等时间责任人记录;②描述数据状态和数据层次;③支持数据审计。
2.4 用例分析
通过用例图分析与数据标准相关的人员和需求,见图1:需求用例。
图1 需求用例
各类人员的需求是不同的,最终用户和数据分析人员的需求是引领式的需求,确定了需求的方向,核心需求为检索文献,识别文献,获取文献,基于数据的分析评价需求,系统用户的需求为通过接口检索访问数据。数据处理人员、数据管理人员的需求源自用户的需求,并将用户的需求具体化到数据描述过程和管理过程中,系统开发人员则根据各方的需求设计合适的数据结构和数据访问方式。在用例中最终用户的需求驱动了数据描述和数据结构的细化。
-
3 规范性引用文件
本标准引用了下列文件以支持标准的应用。
GB/T 4880.1-2005 语种名称代码第1部分:2字母代码(ISO 639-1) (excel下载)
GB/T 2659-2000 世界各国和地区名称代码,2字母代码(ISO 3166-1) (excel下载)
ISO 3166-1-2020 世界各国和地区名称代码,2字母代码 (excel下载)
GB/T 12406-2008 表示货币和资金的代码,3大写字母代码(ISO 4217)
GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法(ISO 8601)
GB/T 18391.3-2009 信息技术元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性(ISO/IEC 11179-3)
REC-