信息搜索简介.ppt
《信息搜索简介.ppt》由会员分享,可在线阅读,更多相关《信息搜索简介.ppt(17页珍藏版)》请在三一文库上搜索。
1、信息搜索简介 信息091 郑晓萱 王梦思 网络信息检索存在的问题 l信息过量、检索效率低 l信息污染及网络安全的问题 l检索工具不完善 l网络传输速度太慢 l用户缺乏信息检索专业知识 在数字化、网络化信息资源高度共享的今 天,应学习和掌握搜索引擎的检索方法与技 巧,以充分有效地利用丰富的网络信息资源 。 互联网信息检索的类型: 1、基于超文本的信息检索 2、基于搜索引擎的信息检索 3、基于目录的信息检索 4、基于专业数据库文献的信息检索 一、搜索引擎的工作原理: 1)搜索信息:搜索引擎的信息搜集基本都是自动的。根据网页链到其他 中的超链接,就象日常生活中所说的“一传十,十传百”一样便可 以遍历
2、绝大部分网页。 2)整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅 要保存搜集起来的信息,还要将它们按照一定的规则进 行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅找 到所要的资料。 3) 接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返 回资料。搜索引擎每时每刻都要接到来自大量用户的几 乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极 短时间内找到用户需要的资料,并返回给用户。 搜索引擎的性能指标 我们可以将WEB信息的搜索看作一个信息检索问 题,可以用衡量传统信息检索系统的性能参数-召 回率(Recall)和精度(Pricision)衡量
3、一个搜索 引擎的性能。 召回率是检索出的相关文档数和文档库中所有的相 关文档数的比率,衡量的是检索系统(搜索引擎 )的查全率;精度是检索出的相关文档数与检索 出的文档总数的比率,衡量的是检索系统(搜索 引擎)的查准率。 搜索引擎的主要技术 l一个搜索引擎由搜索器、索引器、检索器和用户接口等四 个部分组成。 l搜索器的功能是在互联网中漫游,发现和搜集信息。 l索引器的功能是理解搜索器所搜索的信息,从中抽取出索 引项,用于表示文档以及生成文档库的索引表。 l检索器的功能是根据用户的查询在索引库中快速检出文档 ,进行文档与查询的相关度评价,对将要输出的结果进行 排序,并实现某种用户相关性反馈机制。
4、l用户接口的作用是输入用户查询、显示查询结果、提供用 户相关性反馈机制。主要的目的是方便用户使用搜索引擎 ,高效率、多方式地从搜索引擎中得到有效、及时的信息 。用户接口的设计和实现使用人机交互的理论和方法,以 充分适应人类的思维习惯。 搜索引擎未来值得注意动向 l1.十分注意提高信息查询结果的精度,提高 检索的有效性 l2.基于智能代理的信息过滤和个性化服务 l3.采用分布式体系结构提高系统规模和性能 l4.重视交叉语言检索的研究和开发 二、搜索技巧: 1、正确使用各种检索语言 (1)布尔逻辑 not表示逻辑“非”,使用not寻找包含not前的 关键词,但排除not后的关键词的文档。 and表
5、示逻辑“与”,使用and操作符检索所得的 文档中包含所有的关键字。and的另一种表示 方式是用空格表示。 or表示逻辑“或”,使用or将检索出几个关键字中 至少包含一个的文档。or的另一种表示方式是 逗号。 括号的作用和数字中的括号相似,可用来使括 在其中的操作符先起作用。 (2)“+、-号” 在一个关键词前不留空格地加上一个“+”号, 表示该关键词一定要出现在检索结果中。 “-”号的情况正好相反,表示该关键 词一定 不会出现在结果中。 (3)双引号的使用 双引号在网络检索中的作用,主要是将引号 中的词作为一个整体,在文本中查找。 2.模糊查询与精确查询 模糊查询又称为智能查询。当我们输入一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 搜索 简介
链接地址:https://www.31doc.com/p-3240496.html