前言

来自NSTL-Specification
跳转至: 导航搜索

  国家科技图书文献中心(简称NSTL)网络服务系统面向全国用户提供全面的科学技术文献数据检索和原文传递服务。NSTL的文献数据库建设主要包括期刊论文、会议论文、学位论文、科技报告、标准、专利等多种文献类型。数据加工规模庞大,每年加工的题录、文摘和引文数据量数以千万条计,并且还在以比较快的速度增长。NSTL文献数据加工工作由9家成员馆共同承担。
  NSTL自成立以来,一直十分重视数据加工的标准化和规范化建设,2001年正式发布了《国家科技图书文献中心-文献数据加工细则》,来规范和约束数据加工的格式和内容,以提高数据加工的标准化和规范化水平。2002-2006年NSTL组织协调的《我国数字图书馆标准规范建设项目》,先后完成并推出了与数字图书馆建设相关的一系列标准和研究报告,其中多项标准涉及到NSTL现有建设的多种数据资源。2008年,为进一步提高数据库建设的标准化和规范化水平,NSTL适时启动了文献数据加工细则的修订工作,遵循数字图书馆标准规范项目的相关标准和其他研究成果,以数字图书馆资源组织和现代网络信息服务的角度,重新修改和细化NSTL的数据加工规范。
  为此,NSTL专门成立了文献数据加工规范修订小组,修订小组的成员由各成员单位具有丰富数据加工经验的管理人员、元数据研究人员、编目人员、信息技术人员等共同构成。修订小组详细调研了文献数据加工领域的国内外的研究进展,深入研究了DC和相关元数据的研究成果,分析了国内外同类文献信息服务系统,包括Pubmed、Web of Science、Inspec、NTIS、ScienceDirect等的数据格式和相关样例。听取了NSTL成员单位的数据加工人员、服务人员和系统开发人员对数据的要求,围绕数据元素的必要性、全文服务的要求、系统发布的需求等各方面因素,对数据格式和数据元素进行了多次深入的讨论。经过充分的文献调研和集体讨论,确定以我国数字图书馆标准规范项目的相关数据标准为基础,适当扩展服务中需要的数据元素,参考DC元数据的数据组织体系,组织和撰写新的NSTL文献数据库数据加工规范。 按照元数据框架和数字图书馆元数据标准的规定,突出了各类型文献数据元素的特点并尽可能复用,建立了各类型文献的元数据层次结构,让使用者易于理解和执行。比如,根据期刊文献的特点将元数据结构分为母体文献层、馆藏信息层、篇名数据层、参考文献层,每一层次都确定一个数据元素集,每个数据元素都按照ISO11179标准,详细著录其标签、名称、定义、必备性、可重复性、注释、示例等元素项。
  最后形成的数据加工规范文档结构为:按文献类型分别组织,首先概述每一种文献类型的内涵和外延,其次说明该类型文献的数据结构和数据关系,再次分别定义该类型文献每一层次数据元素集和数据元素列表。列举完所有文献类型后,最后将所有数据元素按字顺排列详细说明。文献数据加工规范确定的数据交换格式为业界通用的XML格式,各类型文献的XML Schema详见本规范的正文部分。XML Schema主要用于NSTL业务系统之间的数据交换,以及NSTL与外部系统之间的数据交换。
  文献数据加工规范的修订工作是NSTL一项基础性的工作,NSTL袁海波主任、沈仲祺副主任确立了修订的原则与目标,NSTL办公室数据库建设部主任孟连生研究馆员参与了规范的修订工作。修订小组由中国科学院国家科学图书馆的张建勇研究馆员和曾燕副研究馆员牵头,中国科学技术信息研究所吕洲、机械工业信息研究院杨增秀、中国农科院农业信息研究所金晨、中国计量科学院文献馆阳彩军,中国科学院国家科学图书馆曾燕、刘筱敏、朱学军、王聚梅等人,分别撰写了文献数据加工规范的各文献类型的元数据描述部分。中国科学院国家科学图书馆曾燕、董智鹏撰写了各类型数据XML Schema和文献数据唯一标识符的生成规则,中国科学院国家科学图书馆博士研究生林芳撰写了特殊符号的转写规则。文献数据加工规范最后由张建勇、曾燕、刘筱敏,朱学军、孟连生审校和统稿。NSTL数据加工工作组全体成员、NSTL网管中心乔晓东、毕军荣、梁冰、郝春云等专家参与了相关讨论,并提出了重要建议。
  本数据加工规范主要用于在NSTL文献数据库建设过程中对各类型文献数据加工和管理的指导与规范,支持数据在NSTL数据加工系统、数据仓储系统、数据发布系统之间的传递与管理。现将规范公开出版,希望能够对其他单位或系统数据加工的规范化建设起到一定的参考作用和借鉴价值。也期待能与国内外同仁作更为广泛的交流,得到相关领域专家的批评和指导。 鉴于时间和水平所限,不妥之处在所难免,敬请谅解与指正。