第五讲网络信息检索.ppt
《第五讲网络信息检索.ppt》由会员分享,可在线阅读,更多相关《第五讲网络信息检索.ppt(66页珍藏版)》请在三一文库上搜索。
1、第四讲 网络信息检索,导言:网络社会,在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源和网络的利用是终身学习的需要,也是个人信息素质中的重要内容。相对与图书馆纸本文献信息资源和数字资源的检索利用,其对人的影响更为深远。 今后的社会,网络是一个基本要素,它将对社会经济、科技教育、国防乃至政治产生决定性的影响。,目录,网络信息资源概述,1,2,4,3,网络信息检索工具,搜索引擎检索技术,网络信息检索技巧,网络信息资源概念 信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。,1.网络信息资源概述,
2、网络信息资源类型 按信息内容的表现形式和内容划分可分为: 全文型信息:直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; 事实型信息 天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; 数值型信息:主要是指各种统计数据; 数据库类信息:如CNKI,万方等,是传统数据库的网络化; 微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等; 其它类型:投资行情和分析,图形图象,影视广告等。,1.网络信息资源概述,1.网络信息资源概述,按所采用的网络传输协议可分为: WWW网络资源: 因特网信息资源
3、的主流,它使用http协议,使用简单, 功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声 音和多媒体超文本信息。 FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件 。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件 和长文件的主要方法。 TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和 软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录 系统,信息服务机构的综合信息系统等。 用户服务组资源:包括新闻组,电子邮件组等。,1.网络信息资源概述,网络信息资源特点 信息资源丰富、种类繁多 超文本、超媒体
4、、集成式提供信息,图表、图形、图像、声音、动画等 信息来源分散、无序,没有统一的管理机构,没有统一的发布标准 价廉,但质量良莠不齐 正式出版物和非正式信息交流交织在一起 共享程度高 是信息资源的宝库,1.网络信息资源概述,网络信息资源的评价与选择 网络信息资源的评价与选择主要是针对信息源 内容因素:内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。 形式因素:形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。 定量的评价:Goo
5、gle的pagerank;星数评价等级。,1.网络信息资源概述,网络检索的类型 按搜索的目标分类,可分为 站点搜索 普通搜索引擎、新浪、搜狐、Yahoo等 图书资料 网上图书馆、电子图书、网上商店 专业文献 专业数据库(中外文期刊、专利、图书),1.网络信息资源概述,寻找因特网上的任何一个网页,其中的环节不会超过十九个页面,六度空间理论?,搜索的六度空间理论?,寻找世界上任何一个人其中的环节不会超过六个人,1.网络信息资源概述,附:人肉搜索 请通过百度百科中的“人肉搜索引擎”词条了解人肉搜索http:/ 人肉搜索,其实是情报学中的信息分析和情报调研过程,是信息检索技能、信息分析方法和情报调研过
6、程的集中应用。其最大的特点是应用web2.0的思路,网聚人力,虚拟与现实结合。,2. 网络信息检索工具,当已经知道地址时,直接通过地址访问。 当不知道地址时,需要借助检索工具。 搜索引擎 网络资源目录 信息门户 搜索软件,2. 网络信息检索工具,当别人问你一个问题,而你10秒内无法想出答案时,你是否会回答去网上搜索一下? 当你需要编写一个格式报告(如毕业论文、年终总结)时,你是否会先搜索一些范例并参照编写? 如果你马上要和别人就一个你不熟悉的领域进行讨论时,你是否会赶紧先搜索一把,储备足够的背景知识,然后出动? 你是否经常有这样的感觉,凡是我想到的,别人都想到了;凡是我想知道的,一定有人知道答
7、案? 当你即将前往一个陌生的地方,你是否会先打开搜索引擎页面,查阅当地的地理人文、风俗习惯,然后再启程?,2. 网络信息检索工具,搜索引擎,除此之外,还有哪些?,2. 网络信息检索工具,中文常用搜索引擎 国内搜索引擎 百度(Baidu) 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。 国内目录索引 搜狐(Sohu) 国内三大门户之一,最早在国内推出搜索引擎收费登录服务 新浪(Sina) 最大的中文门户网站,同样也推出了搜索引擎收费索引项目 网易(Netease)网易旗下搜索引擎,主要提供网页、图片、热闻、视频、音乐、博客等传统搜索服务,同时推出海量词典、阅读
8、、购物搜索等创新型产品。,2. 网络信息检索工具,英文常用搜索引擎 Google 以搜索精度高、速度快成为最受欢迎的搜索引擎,搜索界的领军人物。 Yahoo 最著名的目录索引,搜索引擎开山鼻祖之一.,2. 网络信息检索工具,搜索引擎只是一个索引数据库,一般没有自己的信息资源,信息的可获得性与搜索引擎无关。不过搜索引擎有时也会在数据库中存储某些信息的内容。,baidu,google,2. 网络信息检索工具,水平搜索引擎(综合搜索引擎) 水平搜索引擎索引几乎所有可能内容, 包括多种类型、大量领域。在 内容类型和领域方面表现出综合性。 水平搜索引擎强调信息的宽广、面对的是广泛用户的信息需求。 典型的
9、水平搜索引擎有: 百度中文搜索引擎:http:/ Google中文搜索引擎:http:/.hk/,2. 网络信息检索工具,垂直搜索引擎 垂直搜索引擎 即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。 垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。 垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但检出结果重复率低、相关性强 、查准率高,适合于满足较具体的 、针对性强的检索要求 。 目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。,2. 网络信息检索工具,找工作的搜索引擎:http:/ ht
10、tp:/ google学术搜索:http:/ google图书搜索:http:/ 比价购物搜索引擎:http:/ 论坛搜索引擎:http:/ 旅行TripAdvisor http:/ 图像搜索引擎:http:/ 网络信息检索工具,综合搜索引擎的专门化趋势 搜狗(Sogou) 人物、音乐、购物、图片、地图 http:/ GOOGLE 学术搜索: http:/ GOOGLE 图书搜索 http:/ http:/ AllTheWeb 能专门对图像、多媒体信息。 http:/,2. 网络信息检索工具,元搜索引擎 元搜索引擎(matesearch)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统
11、一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。 优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。 缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。 例如:搜魅网(someta)、马虎聚搜,2. 网络信息检索工具,网络资源目录 由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。,2. 网络信息检索工具,搜索引擎目录目录索引:新浪目录http:/ 开放目录ODP http:/dmoz.org/ 、http:/ 中国艺术开放目录 http:/ http:
12、/ 专题网址 如搜索引擎的专题网址:http:/ 网络信息检索工具,信息门户 学科信息门户 http:/ 政府信息门户 http:/ 商业信息门户 公司信息门户 导航库,一些疑问?,搜索引擎到底有什么搜索技术? 搜索引擎技术都有哪些应用? 是不是也有应用实例演示? 我们将进入本次课程下一个部分的学习,3.搜索引擎检索技术,一、Google 二、Baidu 三、其他,3.搜索引擎检索技术,3.搜索引擎检索技术,3.搜索引擎检索技术,谷歌 网址:http:/.hk 谷歌宣传动画:http:/ “ Google ”取自数学术语googol ,意思是一个1后面有100个0。意在表现该引擎“搜集和驾御浩
13、瀚无穷的网络信息”的宏图。,3.搜索引擎检索技术,谷歌一般搜索技术 默认模糊搜索、默认拆分语句和过长的短语 如何精确搜索(短语搜索) 通配符*用法 点号匹配任意字符:. 布尔逻辑 与:空格、AND 或:OR、| 非:-(减号) 约束条件:+ 同义词: 数字范围: 括号:(),3.搜索引擎检索技术,默认模糊搜索、默认拆分语句和过长的短语,3.搜索引擎检索技术,如何精确搜索(短语搜索),3.搜索引擎检索技术,通配符*用法 如:检索【”市场*研究报告”】,3.搜索引擎检索技术,点号匹配任意字符(也可不用引号) 与通配符星号“*”不一样的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有、(
14、、-等 。如:【“大全.中国”】,3.搜索引擎检索技术,布尔逻辑 布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多搜索引擎一样,多个词间的逻辑关系默认的是逻辑“与”(空格)。当用逻辑算符的时候,词与逻辑算符之间需要用空格分隔,包括后面讲的各种语法,均要有空格。 “或”OR必须大写,“非”是特例,即减号必须与对应的词连在一起。 对于复杂的逻辑关系,可用括号分组。 如:逻辑与:【电子行业 AND 研究报告】,用空格和AND 以及小写搜索结果差别不大。此例是搜索电子行业的研究报告。 逻辑或:【电子行业 AND 研究报告 AND (人才 | 风险)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 网络 信息 检索
链接地址:https://www.31doc.com/p-3123268.html