文集汇编描述元数据规范
来自NSTL-Specification
连接到首页.
概述
文集汇编,即文献的汇集。按统一格式、体例和开本,将某个作者的部分或全部作品,或多个作者属于同一题材的作品汇集后以单本或多卷丛书形式出版的图书; 也可以描述为按一定的要求把某一专题或某一知识部门的作品或文件资料选编汇集而成的出版物。
文集汇编元数据描述集中各元素集关系
文集汇编描述集中共有5个元素集,其关系如上图所示。论文元素集和作者元素集构成了描述集的核心。图书元素集主要用来对文集汇编母体文献进行定位,馆藏元素集主要用于帮助发现文献汇编母体文献存放的物理位置。管理元素集可用于实际加工系统建设,帮助对加工过程的管理。
文集汇编描述集以论文元素集为主体,论文是数据交互的基本单位,不同论文可以通过唯一标识符区分。在这种状况下,一篇论文所对应的上述5个元素集的必备及可重复性情况如下:
元素集名称 | 必备性 | 可重复性 |
---|---|---|
论文元素集 | 必备 | 不可重复 |
作者元素集 | 可选 | 可重复 |
图书元素集 | 必备 | 不可重复 |
馆藏元素集 (针对图书而言) | 可选 | 可重复 |
管理元素集 | 可选 | 不可重复 |
论文描述元素集
文集汇编描述元数据规范通过定义系列描述元素集,说明文集汇编论文内容主题、提供查找和定位特定论文所需信息以及文集汇编的一些服务性信息。这组描述元素集包括论文描述元素集、论文作者描述元素集、文集汇编母体描述元素集、收藏单位信息描述元素集以及管理信息描述元素集。
论文描述信息是文集汇编描述元数据规范的主体部分,它描述文集汇编的析出文献,描述的内容包括论文题名、关键词、文摘和正文等几个部分。
- 表 1 论文描述元素集简表
序号 | 标签 | 名称 | 必备性 | 可重复性 |
---|---|---|---|---|
1 | 论文记录号 | paper_id | 必备 | 不可重复 |
2 | 题名 | title | 必备 | 不可重复 |
3 | 其他语种题名 | alternative | 可选 | 可重复 |
4 | 文摘 | abstract | 可选 | 不可重复 |
5 | 其它语种文摘 | abstract_alternative | 可选 | 可重复 |
6 | 关键词 | keyword | 可选 | 可重复 |
7 | 其它语种关键词 | keyword_alternative | 可选 | 可重复 |
8 | 主题词 | subject_heading | 可选 | 可重复 |
9 | 主题词表 | thesaurus | 可选 | 可重复 |
10 | 分类号 | classification | 可选 | 可重复 |
11 | 分类法 | classification_scheme | 可选 | 可重复 |
12 | 正文语种 | language | 必备 | 不可重复 |
13 | 其它语种 | other_language | 可选 | 可重复 |
14 | 起页 | start_page | 必备 | 不可重复 |
15 | 止页 | end_page | 可选 | 不可重复 |
16 | 总页数 | total_page_number | 必备 | 不可重复 |
17 | 论文参考文献总数 | total_reference_number | 可选 | 不可重复 |
18 | 文献号 | paper_no | 可选 | 可重复 |
19 | 本地唯一标识符 | local_doi | 必备 | 不可重复 |
20 | DOI | doi | 可选 | 不可重复 |
21 | 论文类型 | paper_type | 可选 | 不可重复 |
22 | 资源类型 | type | 必备 | 不可重复 |
论文作者描述元素集
- 表 2 论文作者描述元素集简表
序号 | 标签 | 名称 | 必备性 | 可重复性 |
---|---|---|---|---|
1 | 作者顺序 | author_sequence | 必备 | 不可重复 |
2 | 作者姓名 | author_name | 必备 | 不可重复 |
3 | 其它形式作者姓名 | author_name_alternative | 可选 | 不可重复 |
4 | 作者所属机构 | affiliation | 可选 | 可重复 |
5 | 其它形式机构 | affiliation_alternative | 可选 | 可重复 |
6 | 作者Email 地址 | 可选 | 可重复 |
文集汇编母体文献描述元素集
- 表 3 文集汇编描述元素集简表
序号 | 标签 | 名称 | 必备性 | 可重复性 |
---|---|---|---|---|
1 | 母体数据源编号 | catalog_code | 必备 | 不可重复 |
2 | 订购号 | subscription_number | 可选 | 不可重复 |
3 | ISBN | isbn | 可选 | 不可重复 |
4 | ISSN | issn | 可选 | 不可重复 |
5 | EISBN | eisbn | 可选 | 不可重复 |
6 | EISSN | eissn | 可选 | 不可重复 |
7 | 母体文献名称 | host_title | 必备 | 可重复 |
8 | 其它语种母体文献名称 | host_title_alternative | 可选 | 可重复 |
9 | 语种 | host_language | 必备 | 可重复 |
10 | 分类号 | host_classification | 可选 | 可重复 |
11 | 文集编者 | host_editor | 可选 | 可重复 |
12 | 出版者 | publisher | 可选 | 可重复 |
13 | 出版地 | publishing_place | 可选 | 可重复 |
14 | 出版年 | year | 必备 | 不可重复 |
文集汇编收藏单位描述元素集
是指收藏文集汇编并对外提供服务的单位。文集汇编收藏单位信息通常包括单位名称以及该单位赋予特定文集汇编的馆藏号信息。文集汇编收藏单位信息有助于用户在一个大信息环境下获取特定文集汇编及其论文。
- 表 4 馆藏描述元素集简表
序号 | 标签 | 名称 | 必备性 | 可重复性 |
---|---|---|---|---|
1 | 馆藏机构代码 | library_code | 必备 | 不可重复 |
2 | 馆藏号 | holding_number | 可选 | 不可重复 |
3 | 登到时间 | checkin_time | 必备 | 不可重复 |
管理信息描述元素集
- 表 5 管理信息描述元素集
序号 | 标签 | 名称 | 必备性 | 可重复性 |
---|---|---|---|---|
1 | 记录创建时间 | create_time | 必备 | 不可重复 |
2 | 记录最新修改时间 | update_time | 必备 | 不可重复 |
3 | 加工方式 | processing_mode | 必备 | 不可重复 |
4 | 加工深度标识 | record_level | 必备 | 不可重复 |
5 | 加工机构 | processing_unit | 必备 | 不可重复 |
6 | 全文标识 | fulltext_flag | 必备 | 不可重复 |