国家科技图书文献中心(以下简称NSTL)面向全国用户提供全面的科技文献数据检索和原文传递服务。经过多年的发展,NSTL已经形成了从采购、加工、发布到服务的数字化业务流程,各个子系统相互协同、相互依赖,共同为用户提供服务。目前,NSTL各系统元数据方案不尽相同,获取的第三方来源元数据遵循标准各有差异,对资源的共享和利用造成障碍。
在大数据时代,资源组织颗粒度细化,资源灵活挖掘与整合日益重要。建设NSTL统一文献元数据规范,支持多种数据的统一描述,形成一致的数据描述体系,对各个层面业务系统和服务系统的建设在数据层面进行规范,将为NSTL数据集成融合、数据分析和数据挖掘,以及不同应用服务系统间的互操作建立统一的数据基础,从而为科学决策和知识服务提供支撑。
本标准确定了13个元素集,包括来源、单篇文献、主题/分类/关键词、贡献者/机构、会议、基金、操作信息、获取管理、全文文件、图、表、附加资料和参考文献元素集。并确定了NSTL统一文献元数据的数据唯一标识符生成规则。不计重复元素和属性,本标准共包含97个描述性元素、50个辅助性元素、49个属性以及4个特殊字符元素。
本标准的目标是为NSTL建成国际一流的科技文献信息发现与知识发现系统,实现从信息服务向知识服务的转型,提供基础的数据标准规范,保证NSTL发展战略目标的实现。本标准的作用主要是支持NSTL发现系统的建设,支持数据挖据、分析评价功能的实现,支持数据重用和利用的标准化,减少数据传递损失,保证系统之间数据交互的可靠性,增强系统协同能力。
本标准适用的文献对象,涵盖所有NSTL购买、交换、赠与等方式获取的科技类资源,包括期刊、会议录、科技丛书、科技专著、文集汇编、工具书、科技报告、期刊论文、会议论文、学位论文、开放课程、开放课件等。本标准可统一描述文献的印刷版本、数字版本,统一描述文献对象各个层次的信息,满足NSTL数字业务流程中文献数据采集、管理和服务的需求。