期刊论文描述元数据规范

来自NSTL-Specification
跳转至: 导航搜索

连接到首页.

概述

  期刊论文是指经专家委员会或同行评议认可后发表在期刊上的论文。 论文从形式上来说,通常包括题名、关键词、文摘、正文以及作者信息等几个部分。 从内容上说,期刊论文阐述了特定主题的研究目的、研究内容及结果。
  期刊论文描述元数据规范通过定义系列描述元素集,说明期刊论文内容主题、 提供查找和定位特定论文所需信息以及期刊的一些服务性信息。 这组描述元素集包括论文描述元素集、论文作者描述元素集、期刊描述元素集、 期刊卷期描述元素集、期刊收藏单位信息描述元素集、参考文献描述元素集以及管理信息描述元素集。

期刊论文元数据描述集中各元素集关系

pic

图 期刊论文描述集中各元素集关系

  期刊论文描述集中共有7个元素集,其关系如上图所示。论文元素集和作者元素集构成了描述集的核心。引文元素集是对期刊论文参考文献的描述。期刊元素集、卷期元素集主要用来对期刊论文进行定位,馆藏元素集主要用于帮助发现期刊存放的物理位置。管理元素集可用于实际加工系统建设,帮助对加工过程的管理。
  期刊论文描述集以论文元素集为主体,论文是数据交互的基本单位,不同论文可以通过唯一标识符区分。在这种状况下,一篇论文所对应的上述7个元素集的必备及可重复性情况如下:

元素集名称 必备性 可重复性
论文元素集 必备 不可重复
作者元素集 可选 可重复
期刊元素集 必备 不可重复
卷期元素集 必备 不可重复
引文元素集 可选 可重复
馆藏元素集(针对期刊卷期而言) 可选 可重复
管理元素集 可选 不可重复

论文描述元素集

  论文描述信息是期刊论文描述元数据规范的主体部分。它描述的内容包括论文题名、关键词、文摘和正文等几个部分。

表 1 论文描述元素集简表
序号 标签 名称 必备性 可重复性
1 记录号 paper_id 必备 不可重复
2 题名 title 必备 不可重复
3 其他语种题名 alternative 可选 可重复
4 文摘 abstract 可选 不可重复
5 其它语种文摘 abstract_alternative 可选 可重复
6 关键词 keyword 可选 可重复
7 其它语种关键词 keyword_alternative 可选 可重复
8 主题词 subject_heading 可选 可重复
9 主题词表 thesaurus 可选 可重复
10 分类号 classification 可选 可重复
11 分类法 classification_scheme 可选 可重复
12 正文语种 language 必备 不可重复
13 其它语种 other_language 可选 可重复
14 起页 start_page 必备 不可重复
15 止页 end_page 可选 不可重复
16 总页数 total_page_number 必备 不可重复
17 论文参考文献总数 total_reference_number 可选 不可重复
18 文献号 paper_no 可选 可重复
19 本地唯一标识符 local_doi 必备 不可重复
20 DOI doi 可选 不可重复
21 论文类型 paper_type 可选 不可重复
22 资源类型 type 必备 不可重复

论文作者描述元素集

  期刊论文可由一人或多人撰写,这些人员可以来自一个或多个机构。论文作者是指期刊论文撰写者及其所属机构信息。

表 2 论文作者描述元素集简表
序号 标签 名称 必备性 可重复性
1 作者顺序 author_sequence 必备 不可重复
2 作者姓名 author_name 必备 不可重复
3 其它形式作者姓名 author_name_alternative 可选 不可重复
4 作者所属机构 affiliation 可选 可重复
5 其它形式机构 affiliation_alternative 可选 可重复
6 作者Email 地址 email 可选 可重复

期刊描述元素集

  期刊是指以定期或不定期方式连续出版,一般各册载明序号,而拟无限期继 续出版的印刷或非印刷形式的出版物。通常按出版频率可分为周刊、半月刊、月刊、双月刊、季刊、年刊等。
  期刊是期刊论文的载体,是查找特定期刊论文必不可少的信息。

表 3 期刊描述元素集简表
序号 标签 名称 必备性 可重复性
1 母体数据源编号 catalog_code 必备 不可重复
2 订购号 subscription_number 可选 不可重复
3 ISSN issn 可选 不可重复
4 EISSN eissn 可选 不可重复
5 CODEN coden 可选 不可重复
6 国内统一书刊号 cn 可选 不可重复
7 母体文献名称 host_title 必备 不可重复
8 其他语种母体文献名称 host_title_alternative 可选 可重复
9 语种 host_language 必备 可重复
10 母体文献分类号 host_classification 可选 可重复
11 出版地 publishing_place 可选 可重复
12 出版者 publisher 可选 可重复
13 起始年 start_year 必备 不可重复
14 终止年 end_year 可选 不可重复

期刊卷期描述元素集

  期刊卷期是指单册期刊标明的序号信息。对于印刷型期刊而言,期刊特定卷期是帮助定位期刊论文的关键信息。

表 4 期刊卷期描述元素集简表
序号 标签 名称 必备性 可重复性
1 出版年 year 必备 不可重复
2 卷信息 volume 可选 不可重复
3 期信息 issue 可选 不可重复

期刊收藏单位描述元素集

  是指收藏期刊并对外提供服务的单位。期刊收藏单位信息通常包括单位名称以及该单位赋予特定期刊的馆藏号信息。期刊收藏单位信息有助于用户在一个大信息环境下获取特定期刊及其论文。

表 5 期刊收藏单位描述元素集简表
序号 标签 名称 必备性 可重复性
1 馆藏机构代码 library_code 必备 不可重复
2 馆藏号 holding_number 可选 不可重复
3 登到时间 checkin_time 必备 不可重复

论文参考文献描述元素集

  为了对前人研究成果表示尊重,期刊作者一般在期刊正文之后附有引用和参考前人成果的著作文章列表信息,期刊论文参考文献著录内容通常包括主要责任者、题名、版本项、出版项以及获取和访问路径等信息。
  期刊论文参考文献描述信息元数据是期刊论文描述元数据规范的可选内容。通常,期刊论文参考文献信息可以让用户从作者研究脉络的角度查找到一组相关文献。

表 6 论文参考文献描述元素集
序号 标签 名称 必备性 可重复性
1 引文类型 citation_type 必备 不可重复
2 引文原始信息 citation_orig_info 必备 不可重复
3 引文第一作者 citation_author1 可选 不可重复
4 引文第二作者 citation_author2 可选 不可重复
5 引文第三作者 citation_author3 可选 不可重复
6 引文题名 citation_title 可选 不可重复
7 引文出处 citation_sourcetitle 可选 不可重复
8 引文出版年 citation_year 可选 不可重复
9 引文卷号 citation_volume 可选 不可重复
10 引文期号 citation_issue 可选 不可重复
11 引文页 citation_page 可选 不可重复
12 引文主编 citation_editor_in_chief 可选 不可重复
13 引文出版者 citation_publisher 可选 不可重复
14 链接地址 citation_url 可选 不可重复

管理信息描述元素集

表 7 管理信息描述元素集
序号 标签 名称 必备性 可重复性
1 记录创建时间 create_time 必备 不可重复
2 记录最新修改时间 update_time 必备 不可重复
3 加工方式 processing_mode 必备 不可重复
4 加工深度标识 record_level 必备 不可重复
5 加工机构 processing_unit 必备 不可重复
6 全文标识 fulltext_flag 必备 不可重复