文献检索章节二计算机检索基础知识.ppt
《文献检索章节二计算机检索基础知识.ppt》由会员分享,可在线阅读,更多相关《文献检索章节二计算机检索基础知识.ppt(37页珍藏版)》请在三一文库上搜索。
1、文献检索课 二 计算机检索的基础知识,林 英 图书馆信息咨询部 ,课程安排,电子信息资源检索,电子信息资源的概念: 以数字化的形式,把文字、图形、图像、声音、动画等多种形式的信息存放在光、电、磁等非印刷型介质上,以电信号、光信息号的形式传输,并通过网络通信、计算机或终端等方式再现出来的一种信息资源。,电子信息资源的特点: 1、组织形式发生变化:由传统的文本、线性,发展成超文本、超媒体等多种形式,并组成相互联系、非线性的网状结构。 2、数字化:存储密度高,容量大。 3、内容丰富多样:从文字、图表到多媒体信息,文献类型多样,涉及领域宽广。 4、数据具有通用性、开放性、动态性 5、信息资源体积小、数
2、量大 6、传播方式的无限性,不受时间、空间限制 7、检索功能强大,使用方便、快捷。,信息检索系统 概念:按某种方式建立起来的供读者查找信息的一种有层次的体系,是表征有序信息特征的集合体。分为两大类型:印刷型检索系统和计算机检索系统。 印刷型检索系统 1、文献型检索工具 (1)目录 以报道文献出版或收藏信息为主要功能的工具。如全国总书目。 (2)题录 是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成,供人们查找篇目出版的工具。如全国报刊索引 (3)文摘 以精练的语言把文献信息的重要内容、观点、数据等摘录下来,并按一定的著录规则与排列方式编排起来,供读者检索使用的一种检索工具。 2、非文
3、献型检索工具 主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。,计算机检索系统的类型 1.文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数据库,即数据库记录的对象为文献信息时。包括目录型数据库、题录型、文摘型和全文型数据库。 (1)目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或收藏单位为基本著录单元,如“本”、“种”、“件”等。著录内容包括书(刊)名、作者、出版年月、出版地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机读目录数据库OPAC)、联合目录、出版发行目录等。,(2)题录、文摘型数据库 题录型:是将单篇文献的“篇”、“章”等为著录单元,如一篇论文、
4、一份报告、一件专利等。如全国报刊索引。 文摘型:在题录的基础上每个著录单元再加上文摘。如美国工程索引、科学文摘等。 (3)全文数据库 指存储文献全文或其中主要部分内容的源数据库。存储内容主要有各种图书、期刊论文、法律条文及案例、新闻报道等。它将二次文献的检索同原文献的获取融为一体。,2.非文献型数据库 指一种能够直接提供具体的术语、事实和数值等信息的数据库。包括术语型数据库、事实型数据库和数值型数据库。 (1)术语型数据库 指专门存储并揭示各类名语、术语、词语的检索工具。大多是辞书、词典、百科全书等数字化版本。 (2)事实型数据库 指存储简单而独立存在的非文献信息,如机构、人物、产品、地理位置
5、、事件等实体信息。 如:各种人物数据库、机构名录数据库、产品或商品数据库等。 (3)数值型数据库 一种以自然数值形式表示、计算机可读的数据集合。,信息检索技术 布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“和(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。,运算优先级顺序为NOT、AND、OR,可以用括号“( )”改变它们的运算顺序。 如A and (B or C),检索顺序为先B或C,然后再与A,逻辑算符举例 查找关于“动物保护”的文献: “动物”和“保护
6、” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。 查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。 查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为
7、:(西红柿+番茄)*(种植+栽培+培育),词组检索: 通常在所检索词上加“”对所检索词视为词组处理 例如:“动物保护”,表示动物保护是个词组,检索结果动物和保护不能分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。 截词检索 又称部分一致检索,是在检索词的适当位置进行截断,然后使用截词符代替,利用截断的词的一部分进行检索,检索词与文献部分一致性。 截词检索是预防漏检,提高查全率 尤其适用于英语,常用于处理词语的单复数,不同拼写方式,相同词根的相近意义词,以及动词的不同形式等。 截词的类型:按照截词的位置,分为后截词 (前方一致),前截词(后方一致),
8、中截词(中间一致和中间不一)。 截词符:不同的检索系统所使用的截词符不同,常用的有“*”、“?”,“*”、“?”的比较 “*”,无限截词,代表多个字符如regard*, 代表regard, regarding, regardless, 等 absorb* “?”有限截词,代表0个或1个字符,如“wom?n”,则包含“woman,women”; 可以用“n?”来代表多个字符 前截词、后截词、中间截词的比较 前截词 将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。如:*computer 将检索出 computer、 minicomputer 、microcomputer等
9、单词的文献。 后截词 将截词符放在词根的后面,前方一致。如:grow* ,系统将检索出含有grow、growth、growing等词的所有记录 中间截词 是将截词符号置于检索词的中间,而词的前后方一致。通常用于英、美不同拼写形式的词(英语单词)进行检索。如:colo?r 可检出的词为colour(英音)、color(美音)。,位置检索技术 利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。 在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。 (W) (WITH)算符:表示两个检索词紧挨着,词序不能颠倒,中间不能有其他词,但可以有空
10、格和标点符号。也可以用() A(W)B AB两词靠近,次序为A先B后。 例如:communication(w)satellite或者communication()satellite,只检索出communication satellite, communication-satellite的记录 (nW) 算符:表示两个检索词之间插有n个词,但顺序不能颠倒。 A(nW)B AB两词靠近,次序为A先B后,中间最多可加n个词。 例如:communication(2w)satellite,只检索出communication satellite、communication-satellite,commun
11、ication through satellite、communication on the satellite词组的记录。,(N)(Near)算符:表示两个检索词为相邻关系,两个词之间不能插入任何词,但词序可以颠倒。 A(N)B :AB两词靠近,次序可变。 如 building (N) construction可检索出buildingconstruction, construction building, construction-building的记录 (nN)算符:表示两个检索词之间可以插入 n 个词并且词序可以颠倒 A(nN)B:AB两词靠近,次序可变,中间最多可加n个词。 例如:in
12、formation(1N)retrieval可检索出information retrieval , information and retrieval, retrieval of information的记录。,限制检索技术 限制检索是通过限制检索范围,缩小检索结果,达到精确检索的方法。 检索方式主要有:限定字段检索和限定范围检索 限定字段检索:将检索词限定在特定的字段中。 如:题名(TI,title)、关键词(KW,keyword)、主题词(DE, descriptor)、 文摘(AB,abstract)、全文(FT, Full text)、作者(AU,author)、期刊名称Journal
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 章节 计算机 基础知识
链接地址:https://www.31doc.com/p-3206747.html