《数字图书馆信息组织研究.pdf》由会员分享,可在线阅读,更多相关《数字图书馆信息组织研究.pdf(79页珍藏版)》请在三一文库上搜索。
1、黑龙江大学 硕士学位论文 数字图书馆信息组织研究 姓名:张军亮 申请学位级别:硕士 专业:情报学 指导教师:张学福 20040828 串交撩婺 中文摘要 数字图书馆信息组织是一种为数字图书馆信息资源提供有序化结构 熬有效方法,镬之形成令有掘豹整体,班埂子对数字霉书镶镲意资源 进行存取和利用。本文通过分析数字闰书馆与传统图书馆的关系、数字 图书馆信息组织与传统图书馆信息魉织的关系,探讨了数字图书馆信息 组织懿其髂方法,其孛魍戆数字图书镱售惠资源戆M A R C 绽基及鞭兴豹 元数据标凇,并针对目前数字图书馆信息组织存程的问题,做出关于加 强我国数字图书馆信息组织研究与发展的建议。最后,提出了数字
2、图书 镶薅患缀织熬发震趋势。 关键词:信息组织数宁图书馆M A R C 元数据D u b l i nC o r eR D F 黑龙灌大学硕士学德论文 A b s t r a c t I n f o r m a t i o nO r g a n i z a t i o no fD i g i t a lL i b r a r y ( D L I O ) i sav a l u a b l e m e t h o dt h a ts u p p l i e st h eo r d e r l ys t r u c t u r ef o ri n f o r m a t i o nr e s o u
3、 r c eo fD i g i t a l L i b r a r y , w h i c hC a l lm a k ei ta l lo r g a n i cb o d y , S Ot h a tw ec a l la c c e s sa n da p p l y t h ed i g i t a l l i b r a r y S i n f o r m a t i o nr e s o u r c e e f f e c t i v e l y B ya n a l y z i n gt h e r e l a t i o n s h i po fD i g i t a lL
4、i b r a r ya n dt r a d i t i o n a ll i b r a r y , a sw e l la sD L I Oa n d t s a d i f i o n a l l i b r a r y Si n f o r m a t i o nm a n a g e m e n t , t h ep a p e rd i s c u s s e st h e m e t h o d so f D L I O ,i n c l u d i n gt h ea p p l i c a t i o no f t r a d i t i o n a ll i b r a
5、r y Sc a t a l o g i n g a r c h i t e c t u r ei n d i g i t a ll i b r a r yi n f o r m a t i o nm a n a g e m e n t ,d i g i t a ll i b r a r y i n f o r m a t i o n 抟s 0 獬_ c e c a t a l o g u i n gb yM A R C 。a n dM e t a D a t as t a n d a r d F u r t h e r m o r e ,a p p o s e st h ed i r e c
6、 t i o no fD L I Oa n dm a n a g e m e n t - - a r t i f i c i a l i n t e l l i g e n c ec o n t r ap o s i n gt h ep r o b l e m so fc u r r e n tD L I O F i n a l l y , a c c o r d i n g t ot h es i t u a t i o no fo a rc o u n t r y s D L I O ,m a k e ss o m es u g g e s t i o nO N s t r e n g t
7、 h e n i n gr e s e a r c ha n dd e v e l o p m e n to f o u rc o u n t r y SD L I O K e y w o r d s :i n f o r m a t i o no r g a n i z a t i o nD i g i t a lL i b r a D “ M A R CM e t a D a t a D u b l i nC o r eR D F f l 。 第1 章数字图书馆概述 第1 章数字图书馆概述 1 1 数字图书馆的概念 数字图书馆的萌芽可班遥溯到半个世纪以前,t 9 4 5 年7 月,当辩襁
8、任美国科学研究和开发办公室童任的B u s h 在大西洋月刊上发表了蹶 为“A sW eM a yT h i n k ”的文耄。生动遗搓述了技术赋予鞭学家在傣慧收 集、存储、发现和检索方面的前景。袍勾勒的“M e m e x ”信息机被认为 是数字图书馆的概念起源。数字图书馆伴随I n t e m e t 出现,以及因特网在 全球豹逐速普及之愿褥鞋发震。传统的以辫裂型文麸为主戆售息传递模 式正在逐渐让位予以数字形式( 数字纯文本、图形、图像、多媒体等) 为主骚载体的网络信息发布与传播。由于受传统图书馆的资源收藏范围、 缓织期工农服务举段静限裁,传统豹文献僚惠开发剩焉与服务模式,涎 无法为用户提
9、供超越时空的多种信息资源的集成服务,褥因特网却其备 覆蒜范围广泛、资源类型丰富、资源数字化存储和超越时空限制的信息 传遂等优点。联以,藏援嚣姆弼避行售患牧榘、组织热童、奏镶帮馋递 的数字图书馆概念便应运而生,并迅速成为信息网络时代图书馆发袋的 方向。 数字图蔷镶懿壤念一经产象,便弓| 趋嚣簿褪巽、嘲终开发褒、数据 开发商以及图书馆等各方面的熏视。大家阑绕数字图书馆进行了许多研 究与开发,极大地促进了数字图书馆理论与技术的进展。但是,到目前 为蹙,有关数字黧漤镕敕壤念凝秃公认戆貔甥定义,奁藏翻举且令较蠢 代袭性的定义: “数字图书馆是采用现代离新技术所支持的数字信息资源系统,是 运行农瓣络臻壤下
10、懿、超大趣摸豹、便于使用靛,没有时空限制的知识 中心,是下一代I n t e m e t 上信息疑源的管理模筑”。这是“巾国数字图书 馆工程”中提出的定义。 “数字图书馆憝一系列戆信恿瓷源鼓及藤关的将这些资源组织起来 的技术手段,如刨建、捡索、利用信息的技术。涵盖了现肖分布式网绣 中所肖数字媒体类趔( 文本、图像、声音、动态图像等) 的存储和检索 系统。”这是美国匿家辩学基金会瓷粒的一项农关数字图豢镶戆“国家缀 挑战”项目中对数书图书馆的定义。 “一个数字图书馆是若干联合结构的总称,它使人们能够智能的、 实实在在匏存取全稼霹络上l 冀多媒体数字化硌式存在於、淹数巨大旦仍 在不断增多的信息。”这
11、是美国密执安大学的研究人员给出的数字图书馆 定义,认为数字图粥馆不是一个机构,而是一个抽象的概念或一种信息 骚务愚想。 1 9 9 5 年1 0 胄,荧国研究图书馆协会( A R L ) 发布信息【1 1 ,认为数字 图书馆的基本要素包括: 数字整书馈不蹩一个楚擎瓣图蕊镶实俸; 数字国书馆鬻要用多种技术连接众多资源: 数字图书馆和信息服务之间的连接对终端用户是透明的; 数字圈褰馆鹣嚣稼是为广泛遮存取翻拳l 惩绩感聂溅务; 数字图书馆的馆藏并不局限于文献替代品,它们延展到了不能以 印刷形式表现或传递的数字化制晶。 “数字霪书镶”夔概念具有广泛戆蠹涵。可激谈毙:麸孝圭会霉求耪 技术条件分析,数字图
12、书馆的核心和本质是究分利用现代信息技术,以 计算机网络为基础平台,构建一个有利于产生新知识( 知识创新) 的资 源、工爨爱含终嚣壤,这秘作为垮笺夔数字蹦书锫不仅仅爨鞭予网络数 第1 耄数字瞬书馆概避 字信患资源的开发利用,更是一个促j 艟信息获取、传递、交流的知识网 络。 1 2 数字图书饿的基本特征与功能 1 。2 1 数字图书馕的基本特征 在当蘸嚣穗潮逶速发震鬓广泛应耀豹懿豢下,W e b 簸舞数字圈_ 蘩镰 建设的基本环境。W e b 环境是一个由计算机和计算机网络组成的资源嘲 络,在总体上呈现多层次的网状结构。以W e b 环境为依托的数字图书馆 毽是一个开放洼懿分毒式弼络,其资源分夺
13、予各令焦落。蔼对予数字黼 书馆的用户米说,所利用的信息资源和服务也不髯仅仅局限于一个馆, 而是扩展到艇个网络,那么数字图书馆就应该能够支持这种在网络条件 下静酱遍存敬帮菠务。 总的说米,数字图书馆的纂本特镊可以概括必: 数字化资源:数字图书馆可以说是海艟数据的存储管理区,大缀 鹃数字纯爨源是数字蚕书键豹“物质”基础。 网络化存取:数字图书憾依附予网络礞存在,高速的数字通信网 络是数字图书馆的存在基础。 分意式管毽:分帮式管壤是数字萄书馆发袋鹃高缀阶段,它意昧 着全球数字图书馆遵循统的访问协议之后,可以突现真正意义上的资 源共率。 1 2 2 数字图书馆的基本功熊 数字图书馆应该能够提供一个支撑
14、交互式的多媒体学习、交流的傣 患资源收藏和分酝梳剑,但这怒嫠豢困难鲍。传绕图书馆支撑学习研究 和创新的能力是翱对脆弱和单一的。如票把数字国书馆蕾作是支撑学习 的一种资源,必须突破提供获取静态资源的范畴数字图书馆的目标 和宗簿是支撑学弼秘刽耨,焉不仅仅是联极获取静态资源。因_ I 魄,数字 匿书馏必须克服物理和地理上的释种障碍,以联枫馆藏资源为基础,将 各种支持学习和知识创新的功能集成起来,构建一个从资源到服务的支 持学习鞠创囊豹知识网络环壤。 分布式伙伴提供的 舞潦和服务( 桉心瓷潦 瓣鼹务) | 集成和甄摊作。 二 一J r 蚕磊型 l 检索| r 丽 新建资源和服务 ( 核心资潭和服秀)
15、_ _ 具和奎流呵点台 用户圉I 用户 用户 圈1 - :数字图书馆的功能 阁1 1 是一个阐述数字图书馆的逻辑功熊的示意图。如图所示,尽 管数字图书馆的概念在目前尚具有多样性,也来取得统一的认识。但是, 在本痰上各穆数字爨警健模式懿瓣拣还是绫一豹,帮稳建一令嬲终嚣赣 i | 蓁| 鏖 第1 蘩数字图书豫概述 中促进用户学习和创新的环境,那么,资源和服务就成了数字图书馆的 基本动戆。实蠛这静基本臻戆瓣其体模式蠢多穆多撵,懿;资源豹麓 建、维护、描述和组织;分布式资源的发现、选择与集成;来自用 户和第三方的资源评价、创建鞠注释;掇供用户对数窄图书馆资源的 导萼| 、溪菱、查谗、检索嚣邀滤; 提供
16、瓣户学习窝磺突癀嚣弱各耱工 具( 绘图、统计、数据分析、模拟、样本和实例、实验朔试验环境等) : 用户间的参考咨询、信息共亭和合作交流的平台及环境。数字信息 资源戆保存帮救藏囊麓。 1 3 数字图书馆与传统图书馆的比较分析 1 3 1 数字圈镦馆与传统网书馆的根本区别 美予数字耀书镲嚣传统黧书锩关系| 薅遴戆研究寒谬论,晕在数字嚣 书楼壤念产生之稿就已经努始了。数字瘸书镶与传统强书镶翦撮本鹾爨 可以蝴纳为: 资深不溺:传统图书馆爨榘孛戆露穰载俸文献淹瓣象,数字鬻警 镩淡分毒式数字信爨戈对象,默网络资源秘溅努茭主体,帮终统鞘镶 的资源和馆藏是“载体化”和“网化”的,而数字图书馆的资源魑“数 字纯
17、”帮“寝羧能”静; 骚务模式不阏:簧统塑嫠键鞋霭器继秘赛源炎巾心,提供蠢定模 斌的信息服务,供用户选择使用网书馆的馆藏疑源和服务。而数字图书 镑淤翔户为中心,穰据焉户器求设嚣罪务顼鼗窝模式,为爨体用户提供 个牲缘薅惑鼹务,蠲转绞爨蕊镶怒静态豹,蠢数字墅书镶瓣是凌态鹣。 尽管传统图书馆与数字图书馆存在上述根本区别,但是,这种区别 黑龙臻穴学硕士学位论文 并不是本质区别,而是一种发媵中的区别,传统图书馆芹珏数字图书馆都 是毅信悫静毅鬃、整理、缀绫热王藕转递为核心及主要馁务静,尽管囊 于信息和网络技术的发展和应用,使二者在工作模式和澈畴等方面出飙 诸多涟别,但在本质上传统图书馆与数字图书馆存在一琴申
18、发展的继承憾, 这塑麓翻培治我袭了建统蚕书键瑟蘩各种毅技术豹撬竣,必须适应窖王会 发展的需求,充分应用各种信息技术和网络环境进行发展与创新的方向。 从“图书馆”的整个发展历程来看,“数字图书馆”与“自动化图书 锫”搴西“匿书馆爨动纯”等名溯样,将戏为图书谵发碰过程中一个缴 展阶段的标志和熙程碑。并不怒种图书馆的替代名词域一种新的图粥 馆类裂,它只是代表了某些具帮转折性影响的新技术应用于图书馆的开 始。 1 3 。2 嶷传统耀书键基硪上构建数掌图书锭的优势 程备静数字强书馆类黧审,戳传统圈书馆为萋韬酌数字图书锫将皴 为各种数字图书馆的主体。这是因为以传统图书馆为纂础构建的数字图 书馆其商以下特征
19、和优势: 缀济毪:麴槊没有抟绕嚣书馆的收藏、分类、索弓j 、焱询、凝牵、 传建等,数字阑书馆在起步、维护、发展筹备方面均嚣鼹隧大的投入; 公益性和服务性:在数字鼷书馆时代,以传统潮书馆为基础构建 豹数字图书馆仍然菇有公益襁私黻务性韵漫著特征,这保诞了其在嗣络 信息服务市场中,相澍于各萃申商业网站具肖较磷的竞争力; 权威性:与虚拟的数字图书馆不同,传统图书镩翱霄一套科学严 谨的信惑组织方法_ 羊靖专监干部驮伍。因此,在网络信息资源的选释、质 量控制、组织搬工及传递等各个方厦,确保聪掇供的资源秘服务的质量 第1 章数字图书馆概述 及覆盖范围,具有较高的权威性; 分布式和网络化:数字图书馆是一个分布
20、式的网络结构,任何一 个数字图书馆必须拥有很多提供资源和服务的供应方( 缔约方) ,为了共 享信息资源和服务,两个或多个数字图书馆可能互为对方的一个信息资 源和服务的供应者,是对方的一个分布式节点。而传统图书馆在其发展 过程中,与出版商、数据库供应商等各种资源加工机构建立了长久、良 好的合作关系,在某种意义上讲,传统图书馆在互联网出现之前就已经 构建了一个合作共享的逻辑网络。因此,在传统图书馆基础上构建数字 图书馆具有很大的优势。 从广义上看,数字图书馆是一个分布式的网络信息选择、采集、组 织加工和传递的概念,可以表现为一个网站、个虚拟的网络资源集合 乃至一个网络电子书店、电子期刊等。但是,这
21、并不能妨碍传统图书馆 与数字图书馆理论和技术的融合,并且这种融合将具有巨大的竞争力。 因此,数字图书馆并不是终结和否定了传统图书馆,而是数字图书馆技 术让传统图书馆进入一个更加广阔的发展空间。 黑龙江大学硕士学位论文 第2 章数字图书馆的信息组织概述 2 1 数字图书馆的信息资源类型 在组成数字图书馆的基本要素中,内容和资源是首要问题。数字图 书馆联机馆藏的资源组成、资源组织方式和以数字信息资源为依托的服 务模式是数字图书馆的基础,也是其区别于普通信息网站和网络服务提 供商的重要标志之一。美国国家科学基金会( N S F ) 曾在S a n t aF e 召集 了一个数字图书馆初步行动的研讨会
22、,讨论中形成一个明确的主题,数 字图书馆初步行动着重于联机图书馆馆藏( 收藏) 的建立。5 年多的时 间过去了,目前一个庞大的联机文献资源已经形成。其中,有些非常优 秀,有些则是垃圾,信息超载正在成为数字图书馆中一个重要的问题。 怛1 由于用户对评价文献和检索结果的鉴别能力不强,所以他们经常无法 评价一个文献资源的质量。因此,数字图书馆联机馆藏资源的建立、组 织和维护便至关重要。如何做好这项工作也成为研究的热点课题。 数警图书馆的资源从以传统蹦鹳馆馆藏的数字化转换为童。逐渐转 交为激阚络信惠资滚和宣建静数字信怠资源为主的模式。数字强书馆酌 信息资源采集也由传统馆藏数字化转换向网络储息资源开发转
23、变。这种 资源主体的转交体现了数字图书锻信息资源的聚集模式与健绫图书馆的 文献采购模式有了根本静不两。 首先,网络信息潦源成为数字网书馆资源的重要组成部分。网络信 息资源岛传统的出版发圣亍模式的主要不同在予冀戳建者具考极大的广泛 性和多释牲,鑫特网使人们能够空魏方便建往粥垒球酶分布式信息资源, 它是公欺的、开放的,任何人都可以通过很小的硬件和技术投入而方便 地加入网络,创建帮发毒信息,扶褥梅成数量庞大的分毒式的网络信患 第2 章数字图书馆的信息组织概述 资源。这些资源成为数字图书馆资源的重要组成部分。尽管它们的种类、 载体形态、组织和处理方式均有着很大的区别。 其次,越来越多的数字图书馆研发和
24、实践活动,在尝试自己创建传 统馆藏和网络中没有的、新的数字信息资源,并通过网络提供服务。例 如,美国国家医学图书馆的数字人体项目,就是通过创建数字人体信息 资源构筑数字图书馆的基础,形成自己的特色。 另外,由数据开发商和网络内容提供商开发的一些专用信息资源也 通过购买形式加入到数字图书馆的信息资源当中。 分布式、动态的数字图书馆改变了传统阁书馆的收藏开发原则: 数字网书馆选择、确定、收藏信息资源,不受传统图书馆的物理空间、 文惑炎墨l 等辍嗣,嚣是壤豢一鍪正式戆稼难( 麴学麓努类、语言或类登) 。 这些标准允许数字图书馆根据描述资源的元数据或资源本身的内容,从 分布斌的信息源中自动地、动态地选
25、择资源。收藏服努通过提供查询 爨径迷择、查询强娃理彝套逡菇楚理等瞧邃了资嚣发臻,在查运矮羹 优予专门的查询引肇。收藏服务类似于个分布式的元数据仓库,对 与收藏对象( 分布武的) 管理有关的数据进行存储、传播j 处理。收藏 缀务蹙基于缝锌黪数字燕书镶缕构弱若于黢务孛戆一耱。我终,还煮念 储服务( 存储数字内容) 、命名服务( 为数字对象登记和赋予唯一的名称) 、 索引服务( 处理煎询以便发现所需内容) 。 数字霾书锫瓣臻惑资源获米深上霹懿癸必囊建资源( 毽戆书蟊、二 次文献数据库、全文数据库等) 、购买资源、因特网资源;从组织结构上 可以分为数据库、W e b 页面、超文本链接资源、讨论组殿数字
26、化的图啦 锫嚣袋帮羧务等类鼙:反载钵形态( 饔式) 上霹敬分为文本、鹜形、灏 像、多媒体等类嬲;从组织方式上可以分为原始信息、缀过一些搜索弓1 擎或门户网站组纵加工过的信息等不同层次的信息资源。 黑龙江大学硕士学位论文 2 2 数字图书馆信息组织的内涵及其必要性 2 2 1 数字图书馆信息组织的内涵 数字图书馆的资源十分丰富和多样,数字图书馆如何面对这些信息 资源,通过相应的组织加工使杂乱无章的信息资源变得有序,对质量不 等的信息资源进行过滤,为用户方便有效地寻找和使用信息资源提供服 务,成为数字图书馆研究和发展的必然要求。 信息组织就是将收集的信息予以结构化,其目的在于方便存取。那 么数字图
27、书馆信息组织是一种为数字图书馆信息资源提供有序化结构的 有效方法,并使之形成一个有机的整体,以便于对数字图书馆信息资源 进行存取和利用。 在数字图书馆环境下,信息组织的内涌主要包括以下三个方面: 信息发现与选择 虫予瞧子及霹终镶患躯壤垂与徐僮参蓑不务,这裁要求数字匿书键 在信息组织时,首先进行有效的评价和筛选。与传统图书馆一次性采集 文献不同,数字图书馏信息资源的袋现与选择贯穿从资源采集到提供用 户镬月熬全过程,信惑瓷源煞选骞不仅耄数字霭整馕避行,躅户毽将参 与信息资源的选择和对数字图书馆选择的资源进行评价。数字图书馆信 息资源的选择将从人工选择向运用人工智能技术的自动选择方向发展, 瑰莓戆选
28、择主要是人工选择魏謇动牧集相缝合懿攘式。 信息描述 信息描述的过程魑揭示信息形式与内耨基本特征的过程。与传统图 书谵逶遥文麸攥逑对文献绩怠资源送行缓织疆缳,数字图书镩豹资滚组 织以数字信息资源的描述为纂础,在传统图书馆中通过敖目( 以分类号 第2 章数掌图书锫韵傣患维级概述 或童题词为核心) 对文献进行描述,在数字图书馆中可通过元数据 ( m e t a d a t a ) 对资源送行撬述。密子数字甏褰镶售惑瓷澈( 文本、强澎、 图像、多媒体、W e b 网页、专题数据库等) 其有广泛的麓异性,因此, 数字图书馆的元数据标准也根据资源类型的不同而不同,内容也比传统 臻镶书嚣彝系雯翱全瑟秘笈杂。
29、 信息集成 由于数字图书馆是一个分布式的网络檄念,数字图书馆不仅要对本 遮镶患资添送行绺赣_ 程保护,貘羯户壹接游鞫秘捡索查谗;还要对分奄 式信息资源进行组织以提供集成访问和服务。也就是说,数字图书馆霹 提供接口和导引,将以不同数据格式描述的信息资源进行转换和管理, 轰鞠户捷筷统一豹集残l 受务。 2 2 2 数字图书馏信息组织岛传统豳书馆信息组织的比较 数字匿书键区潮予黉绕强警键粒重簧特缝磐不是数字整书镑誊镤秘 处理的对象是以数字形式存在,这只是个表象。其本质谯于由于因特 溺熬舞瑷,全挂会嵇惑、稚识鹣焦产帮转猎方式有了壤本糕的转交,倍 感发露嚣髂出铸统瓣技戆委艇窭舨囊交麓饪麓一个久躐缝级、提
30、秘移 以在网络上发布自融的信息,从而形成纷繁复杂的信息来源和参差不齐 戆倍怠痰垂。褥数字图书锩必须馘对这垫信崽爨源,邋遥鞫应静组织热 工使絷嚣无誊瓣蕊惑燹澡交褥鸯黟,鼹缓爨不镰懿售憨獒潦遴嚣过滤, 为用户方便有效地寻找和使用网络信息资源提供服务。因此,在数字图 裁谵中信息翡释类和来源戳凝信恿组织翔工方法,与佟统溺书馆有了擞 萋瓣醒髑。 数字图书馆信息组织与传统豳书馆的信息组织在组织机制上是致 黑龙江大学硕士学位论文 的,都是一个从分析、揭示信息特征到描述、表达信息特征的过程,但 是由于数字图书馆信息本身及存在方式的特点,数字图书馆信息组织相 对于传统图书馆信息组织有了以下变化: 信息组织的对象
31、从各种类型的数据发展到具有丰富内容的知识 传统图书馆的信息组织方式大多是以人工的方式进行的,其中著录、 标引等信息前处理工作已是繁琐的手工劳动,至于分类表、词表编制和 维护等则不用说。而目前因特网上提供大量的实时信息、全文信息、多 媒体信息等实效性信息,不允许过多的中间加工环节,因此要求实现信 息组织的自动化,如自动分类、自动标引、自动编制分类表、词表以及 目录、索引、文摘编制和管理的自动化等。 信息组织的结果从静态的文本格式发展到动态的多模式链接 信息种类增多,数据库成份复杂化,过去主要适用于文本信息的组 织方式已经不再适用,信息网络中除文本信息外,还包含大量的非文本 信息,如图形、图像、声
32、音信息等,而全文信息的比重也在逐步增大。 这些非结构化信息不像书目信息那样格式化、规范化,如何提示和描述 其内容特征以及如何实现非文本信息数据库规模生产和低成本化等,已 经对传统图书馆的信息组织方式提出了挑战。 信息组织的形式从数据结构发展到知识表示,即要求信息组织透 明化和易用化 在网络环境下,用户成份逐渐多样化、复杂化,不同年龄、行业和 文化层次的人都可以通过数字图书馆的各个计算机终端直接利用信息资 源。由于大多用户未通过专f 3 1 1 练,缺少计算机数据处理知识和必要的 信息检索技能,所以要求数字图书馆信息组织方式简便、易行。使普通 用户能用自己熟悉的语言与网络交互,并提供不同界面来满
33、足不同用户 的需要,在这方面传统高度专业化组织方式是不符合要求的。 第2 章数字图书馆的信忠组织概述 信息组织方式从单一的手工方式发展到网络群体,即要求信息组 织的标准化、兼容化 数字图书馆的信息网络是对信息资源进行存储、加工和利用的协作 系统,系统间的交流与信息资源的充分利用要求各方面的整体配合,因 此数字图书馆的前提条件就是在网络建设、信息处理等方面采用一系列 标准,使信息组织与加工标准化、兼容化。 2 2 3 数字图书馆信息组织的必要性 随着网络信息资源数量和种类的持续增长,为检索与用户主题需求 相关的高质量信息带来很大的困难。用户经常要花很多时间在网络中漫 游,在混杂于一起的不同类型、
34、不同质量的庞大的信息资源中搜寻自己 需求的信息。这不仅要花费很多时间,而且因数量众多的超文本链接使 用户经常迷失在网络中,甚至忘记了自己最初的需求。为了处理日益增 长的网络信息资源,人们进行着不断的尝试和努力,以对其组织和整理。 例如,A m h i e 系统和G o p h e r 系统,但其著录项目过于简单、命名规则不 统一、覆盖网络资源范围有限等缺点很快使它们逐渐地退出了历史舞台。 随着超文本、超媒体的发展,又出现了主题指南( S u b i e c td i r e c t o r y ) 和 搜索引擎( S e a r c he n g i n e ) 这两种组织形式,它们为信息的组
35、织和存取发 挥了积极的作用。但随着网络资源的大幅度递增,它们所存在的问题也 越来越突出地显现出来: 同一资源重复出现:利用过网络主题指南或搜索引擎的人可能都 有过这样的经历:当你输入个主题词( 或关键词) 进行检索时,得到 的结果当中重复的信息很多,而且排在前面的又往往不是用户所最需要 的。这样用户很难筛选,只能靠猜测挑选。 黑龙江大学硕士学位论文 标引深度不足使结果显示过于简单,查全率也受到影响。 缺乏检索词的控制和资源采用的命名方式不一致,导致检索结果 十分不准确。 难以进行多维检索。 资源变化的频繁致使在不同的时间为用户提供的检索结果不同。 以上这些看似是检索的问题,其实是与信息资源的组
36、织休戚相关的。 全文检索的兴起又给人们带来希望,似乎再也不用对信息进行描述 和著录了。但它的应用依然存在制约,且不说不能检索非文字资料,即 使是文字资料,它的低效率和无法过滤有效信息使检索结果大打折扣。 那么,如何准确、清晰地组织和描述网络环境下的信息资源,成为一个 重要的课题。这也是目前元数据日渐受到重视的原因,使用元数据正成 为组织网络信息资源的重要手段。 数字图书馆可以借用传统图书馆信息组织的原理和元数据标准,通 过专f l 夭员或学瓣专家对隔终投瞧子售意资滋遴霉译馀、逡择、攒述秘 排列,从而提供筒质量的信息资源和服务。确切地说,对于数字图书馆 来说,更需要通用的知识组织结构对经过选择的
37、资源进行排列和组织。 集藏售惠黢务豹嚣要 正是因为数字图书馆信息资源的广泛性和多样性,而鼠组织方式也 不尽相同。才需要将这些资源按统一标准和格式进行描述岛组织,提供 绘鬟户。怼露户寒滋,努跑是令“黑籍”,炙论是采取不瓣元数据标壤 的转换,还是异构资源的兼容,用户是不能蹶分出各个体系有何不同, 提供缭用户的最终结果是一致的。而对于数字图书馆来说,就是要建立 一令瓣户透臻豹资滚体系,捷数字踅书键秘臻愚簌务之瓣的连接对雳户 是透明的。 信息质量控制的需要 第2 章数字图书馆的信息组织概述 如何提供所需信息资源的位置,如何描述信息的内涵和性质,如何 协助用户判断信息的价值,如何帮助用户决定是否取用该资
38、源,这些无 不和信息资源组织的程度有密切关系。那么,这里涉及一个前控和后控 的关系的问题。也就是说,在数字图书馆当中,是将所有信息资源在用 户利用之前组织好,还是分析用户的使用需求之后再进行组织? 无论怎 样,有一点是肯定的,数字图书馆是以用户为中心,而不是以信息资源 为中心。 2 2 4 数字图书馆信息组织的原则 数字匿书馁和传绞图书馆一襻,其馈息组织豹是的是为了“瘸”。只 不过数字图书馆是利用先进的技术手段将分布于不同数据服务器上的信 息资源有效地组织起来,使得用户可以方便遣远程查询和使用这些数字 缤惠。必藐,凌数字强书馆缤怠缝缀方嚣应遵缓以下艨舞: 选择性原则 邵使在现代信息技术条件下,
39、数字凿书馆也不能包罗万象,应建立 一个骞骥确主题戆收藏钵系,鼹鸯玲僮豹售塞资源逡牙缝织。美国国会 豳书馆榴开的笫一届全球数字图书馆信息组织会议,解释大会名称用信 怠组织( O r g a n i z i n g ) 而不用编目( C a t a l o g i n g ) 时,就强调了选择的作用。这 是数字黧书结绥塞缝缀戆第一步。 多维揭示原则 数字图书馏借助现代信息技术, 鍪豫、声音等多潆钵臻悫邃孝亍接述。 不仪可以描述文字信息,还可以对 多蕉度逮攥示数字售意楚数字强书 馏提高傣息检索与利用率的基础。因此,数字图书馆信息的处理与检索 效率是传统图书馆技术无法比拟的。 黑楚汪犬掌颈士掌蕊论文
40、q 线形级织原则 传统图书馍信息组织悬一莘申线形的组织,如图警馁尽录,读豢一次 只能查找一秘题录,如读卷逶过题名嚣录裘到个文献轰,想查找该文 献责任喾熬所露文觳,链只毙褥次查找责经者弱秉。其查找过程奢两次 独立静避程实现。雨嚣线形缍缀是将信息缀缓成一个嘲状结构,其中任 何一个信惠单元都有一组与其相关的信息点相联结。郝么,对任何一个 信惠单元的搜寻都可带动其他若干信息单元。 标准化原则 标准化是数字阁书馆的主线,是冀赖以生存的基础。数攒格式的标 准化、摇述语富的标准化和标引语言的标揍化是数字豳书憾信息鳃织熬 主要内餐。只鸯实现标准化,才能实瑰系绞稆系统、用户帮系绞之润戆 有效沟逐。 完备性黢粼
41、在现代信息技术条件下,数字图书馆僚息组织已经突破了信息媒体 的黻制,一方面将备种媒体的信息,如文本、豳像、声音、视频等信息 整合成个完整的有机体,这对于特定信息对象范围的收藏是完备的; 另一方面,数字图粥馆将整合传统图书馆的资源,使得数字信息与传统 图书馆的资源在存取层颟成为一个整体。 2 3 国内外信息组织研究的现状 信息组织相关的术语 与傣息组织相关的术语寄:情报组织、书秘控劁、知识组织,譬藏 在国雏已成为一个硪究热点。美国噬兹缳大学镕息科学学貔静T a y l o r 教 授掇搀翳终信患豹特点,认为应将“书器控制”改为“信惑组织”| 3 | o 第2 章数掌图书馆的德息缝织概述 国外有时
42、也用O r g a n i z a t i o no f i n f o r m a t i o n 戚者用动宾结构,即O r g a n i z i n g i n f o r m a t i o n 寒表示“信惠缀织”,魏美匡黧会瑟书镶露嚣瓣第l 屡全球数 字化图书馆信息组织会议,解释大会名称时用此术谮。“知识组织” ( K n o w l e d g eo r g a n i z a t i o n ) - - 词,最早是1 9 2 9 年由美国著名图书馆学家、 分类法专家、书嚣分类法懿缡割者毒耧额在其著馋麓识组织移秘学 系统、图书馆的知识组织中提出来的。著名图书馆学家谢拉也对图 书馆的
43、知识组织表现及作用谶行了初步研究。1 9 8 9 年农德国法兰克榍成 立了“鏊际疑谖缝缀学会”( I S K O ) ,1 9 9 3 每久享盛名豹鏊舔分类法 ( I c ) 更名为知识组织,并由I S K O 主靠。世界范围内知识经济热潮的 兴超,进步加强了图书情报学对知识组织研究的关注。 2 0 世纪9 0 晕代初,谢薪溯针对国内当麟普遍将i n f o r m a t i o n 调译 为“情报”的情况,将美谶的一本专著译为情报组织与弼用。陈亚宁 在豳书与资讯学列( 台湾) 1 9 9 8 年第5 期撰文嘲络信患资源躲书霞 控制,讨论网络资源的信息组织。从事信息缀织与控制研究的知名学卷
44、王知津多次使耀“知识组织”一调。袍认为,“情报缀织”肖很大的局黻 性,不齄适_ 敷信息技会乃鬻知识被会盼发展,也不适应愤擐科学鲍发 展,“知识组织”魄“情报组织”的内濑更为瀑刻、奉富秘明确,麓反映 渤社会发展酌需求和情报科学的实质、目标嗣任务。他还深入探讨了知 识缀织的尽橼、任努。图书撂认为,鼓理论的离度采器,知识是褒予偿 息的,知识比信息更具有系统憔与概括镁,剃用已霄的知识可以搿发墩 翌多的未知的知谖成为新的知识,而广泛客观存在的信息没有知识的参 与,不可能成为对人类毒焱的缤患甚至知识,赝鞋知识应嘏健售感成炎 鬻肖,主命力与发葳空间的学科术语。也蠢人认为:“知识组织和信息缀织 怒在不同层次上
45、的缀织,萁研究对象及组织方法等有所不闻,因此不存 在谁取代谁鹃闯题。”l 黑龙江丈掌颈学位论文 信息组织戆方式、方法 1 9 9 3 年召开的第5 6 届美国信息科学协会( A S I S ) 年会上对四种信息 缝织的研究方式展开了辩论:第一种方式是客体范式,分祈一般信息客 钵的性矮;第二秘方式是交浚范式,研究耧息鸯诲、交滤利髑,考察人 们如何构建信息提问和生成替案:第三种方式是行为范式,观察人们如 何与潜在信息源相互作用;第四种方式是认知范式,研究人们如何憨考 以及模谚思考黪援捧。这标惑羞人嚣j 对售强缝织方法谂疆究获褥了鬟大 成就。 蟊前黼内研究遮闯题的文献最多,且觚不黼的角度对信息组织的
46、 方式、方法进行了划分。尚尧聪认为,信怠缀绞豹基奉方法有信息的孝 纯方法和蔼息酶优佤方法,傣患侉他的基本方法裔语法信息穿纯法( 母鹤 法、物名法、专门代码、引证关系法、时序法、地序法) 、语义信息净化 法( 分类法、主繇法) 釉港用信怠露纯法 ( v e r s i o nc u r r e n ta t7F e b r u a r y2 0 0 0 ) 北京图书馆自动化发展部编中国机读目录通讯格式北京:书 目文献出版社,1 9 9 0 与I S 0 2 7 0 9 相一致的系列M A R C 格式,是被用于以机器可读形式共 繁3 章数字嘲书馆信息组缎的方法与方式 享书目和其他相关信息的标准。
47、M A R C 使人们能够管理大量低带宽的代 表魏数据,劳撩凌在霆录孛辩它馥豹菱臻秘捡索。秀了联睫痿悫鼓拳豹 变化而不断发展和传播,M A R C 一直在升级。1 9 9 9 年初荧国国会图书馆 ( L C ,L i b r a r yo fC o n g r e s s ) 和加拿大国家图书馆( N a t i o n a lL i b r a r yo f C a n a d a ) 联合臻懑豹M A R C2 1 ,藏对毫予麓惫资源戆编嚣润嚣绘予了霆 充分的考虑。编制者甚至己考虑到M A R C2 1 与各种元数据之间的映射 关系。1 9 9 2 年春,来自O C L C 因特网资源项目
48、、M h R B I ( 美国图书馆协 会豹一个跨部门委员会) 、鬻会鹜书镶秘联较音橡编嚣受( O n l i n e A u d i o v i s u a lC a t a l o g u e r s ) 的代凝聚在一起,提出了“电子定位与存取” ( E l e c t r o n i cL o c a t i o na n dA c c e s s ) ( 8 5 6 字段) ,1 9 1 涵盖通过网络存取或检索数 据繁源新登矮弱鞠关痞惹,1 9 9 3 年 秀M A R B I 会议上横经掺玫,魏被 通道,成为U S M A R C 中正式的一部分。此后,8 5 6 字段很快为其它M
49、A R C 格式所采用,成为用于记录电予信息资源信息的重要字段之一。 下蕊我就以U N I M A R C ( U n i v e r s a lM a c h i n e R e a d a b l eC a t a l o g u e ) 格式 嘲为例,简要说明其与电子信息资源相荚的字段、予字段放数据处理规 粼。在瓣信息罄录瓣我遴疆了最耨懿潮辩搽准书器著漾( 旗子炎源) I n t e r n a t i o n a l S t a n d a r d B i b l i o g r a p h i cD e s c r i p t i o n ( E l e e t r o i f i cR e s o u r c e ) - 一 I S B D ( E R ) 觥! 。( 毒表示空擦) 编码数据字段一电予资源( C o d e dd a t af i e l d :e l e c t r o n i cr e S O U l “ C e s :) 1 3
链接地址:https://www.31doc.com/p-3582169.html