第八讲检索可视化和检索评价.ppt
《第八讲检索可视化和检索评价.ppt》由会员分享,可在线阅读,更多相关《第八讲检索可视化和检索评价.ppt(59页珍藏版)》请在三一文库上搜索。
1、第八讲 检索可视化和检索评价,陆铭 66134922 mingler.ccshu.org,2,内容提要,信息可视化研究 一般概念,在图书馆应用,可视化检索 http:/infovis.cs.vt.edu/cs5764/readings.html 检索评价研究 信息检索评价的概念、研究历史、系统评价指标、用户评价指标、信息检索相关性模型,3,1 信息可视化研究一般概念,看到什么了?,4,信息可视化研究的一般概念,什么是可视化? 现代可视化技术是指运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术 Visualize: Interactive
2、 - 互动式的 Visual representation 可视的 Amplify cognition 提高认知功能的,5,信息可视化研究的一般概念,参考模型,6,信息可视化研究的一般概念,信息可视化的三大支柱 The power of Perception 感知的功能 The power of Graphics 图形的功力 The power of Associations 联想的潜力,7,信息可视化研究的一般概念,信息可视化本质 寻求人机合作一种新的途径 计算机将大量抽象的信息映射到图像上; 人们通过图像的结构,特征等来理解认识从而获得知识。 让计算机与人各显神通 电脑的高速信息处理能力远
3、远超过人脑; 人脑的识辨,理解能力是电脑所不可及的。,8,信息可视化研究可视化工具,http:/iv.slis.indiana.edu/,9,信息可视化研究的一般概念,Touchgraph工具,10,信息可视化应用研究,信息可视化的应用 数据分析 Visual inspection of data properties Dimensional deduction 海量数据的图形化表示 Clustering and grouping Discovery of hidden internal structures 实现与数据的可视化交互 interactive online searching b
4、rowse large amount of information,11,信息可视化应用研究,在电子数字图书馆中的应用 揭示信息的分布 显示检索的结果 为大量的信息分类 帮助用户浏览 提供个性化信息服务,12,信息可视化应用研究,为大量的信息分类 将整个数据库的内容用一个图表示出来 图书情报专业群英图,13,信息可视化应用研究,帮助浏览,14,信息可视化应用研究,揭示信息的分布,15,信息可视化应用研究,显示检索的结果,数字图书馆,16,可视化检索,可视化检索的必要性 每个人的个人“信息空间”都在飞快地膨胀 个人信息空间现在是“搜索引擎战”的前沿阵地 Google, Yahoo!, Micro
5、soft 都提供免费的Desktop Search Solutions 但问题是 单单检索已经不够!(Search is not Enough!),17,可视化检索,可视化检索的必要性 检索界面单一,当前的检索系统没有根据不同的查询,提供有针对性的、相关性可以调整的机制 界面死板 不能揭示相关文档之间的关系 固有的关系被掩盖 忽略了检索结果选取时的人机交互作用 无交互功能,或交互功能极弱,18,可视化检索,可视化检索的必要性 让用户做到“过目不忘” 只要看过的,就记下 Keep-It-Button 提供知识系统帮助组织,整理个人信息空间 提供个人空间与其他信息空间的连接 强调“人机合作” 既要
6、“自动化”,又要“个性化”,19,可视化检索,两个有影响的国际研讨会 1995年起,每年10月美国IEEE信息可视化国际研讨会 1997年起,每年7月英国信息可视化国际研讨会 国际上已经取得的成果 可视化理论模型研究 出现一批原型系统,20,可视化检索,可视化信息检索的设计原则 提供信息反馈 帮助用户掌握检索提问和信息检索之间的关系、命中文献之间的关系、命中文献和描述该文献的元数据之间的关系 减少工作记忆负担 允许用户返回临时放弃的检索策略,或者从一个检索策略跳到另一个检索策略 提供一般用户和专家用户的界面选择 采用“脚手架”(scaffolding)技术:向初学者提供简易界面,向有经验的用户
7、提供高级界面,21,可视化检索,可视化检索技术 格式刷和连接,颜色联动 两个和更多窗口的连接 摇镜头 变换聚焦,变换景深 魔幻镜头 通过点击代表不同的检索对象,实现覆盖对象和未覆盖对象之间的切换,22,可视化检索,检索可视化模型 信息晶体(infoscrystal) 超级图书(superbook) 信息可视化引擎(NIRVE),23,可视化检索信息晶体(infocrystal),24,可视化检索超级图书(superbook),25,可视化检索可视化引擎(NIRVE),26,可视化DIALOG检索,将多次DIALOG检索结果一次性图形表示 用户从一个简单的检索开始 系统将检索结果做多层次的分析
8、收集出现频率最高的主题词 分析主题词之间的关系 系统将分析结果图形户化表现在介面上 用户interacts with 主题词图表以达到更好的检索效果,27,Interactive Query Construction,28,KEPT Knowledge-Enabled Personalization Tools,29,Visual Thesaurus,30,Hyperbolic Tree,31,Highwire: http:/www.highwire.org,View Citation Map,32,检索评价,信息检索评价的概念 研究历史 系统评价指标 用户评价指标 信息检索相关性模型,33,
9、信息检索评价的概念,信息检索的基本问题是评价相关性 以二值表述的相关性不能反映文献相关的程度 一些文献提供的相关信息多一些,而另外一些提供的相关信息少一些,但不是无关 已经有一些研究按照相关性程度表述但是仅仅只有几个试验实际利用了不同的相关因素,34,信息检索评价的概念,在现代的大型数据库条件下,对一个检索提问响应的相关文献量动辄远远超过用户的实际需要 用户希望检索结果按照相关程度排序 系统设计人员和图书情报工作者也希望通过评价不同检索方法的效果,以揭示其区别,35,信息检索评价的类型,系统评价主要包括 功能评价,即评价一个系统是否完成了它所侧重的目标。 性能评价,主要指标是时间与空间的开销。
10、(如:对数据检索系统的评价)响应时间越短,占用的空间越少,系统性能越好 信息检索系统还包括其他一些度量指标。 这是由于用户的查询请求本身具有模糊性,检出的结果不一定是精确答案。需要依照与查询的相关度,对结果集合的准确度进行评价。,36,信息检索评价的类型,检索性能评价 批处理模式 用户提交提问,并得到检索结果 产生检索结果集合的方法 交互模式 用户通过于系统一系列交互步骤提交信息需求 涉及的因素 用户因素 界面性能 系统的导引性能 过程的时间,37,检索评测基础,检索评测基础: 建立在测试参考集和一定的评价测度基础之上。 测试集由一个文档集、一组信息查询实例、对应于每个信息查询实例的一组相关文
11、档(由专家提供)所组成。 检索策略的评价 对一个给定检索策略S,对每个信息查询实例,评测由S检出的结果集合与由专家提供的相关文档集之间的相似性,量化这一指标。,38,国内外检索评价历史,20世纪30年代,美国Bradford首先使用文献的主题相关概念(documents relevant to a subject) 20世纪50年代,美国Taube,Mooers,Perry和Luhn等首先实现了基于集合论和布尔代数的信息检索系统。当时对于相关性的假设是,检出的结果就是相关的,没有检出的就是不相关的。 稍后的相关性研究集中于非相关(non-relevance)。Taube等认为相关性主要受系统内
12、在特征与操作影响,影响因素包括分类表、索引、词汇的语义以及语法描述、文献组织以及检索提问的分析与检索策略等。此时的问题是没有注意文献选择过程,即没有考虑人的因素。(系统观) 1958年科学信息国际会议(ICSI)开始相关性研究中考虑了人的因素。Vickery在会议上提出将相关性分为主题相关和用户相关两类。主题相关性定义为描述检索问题的主题词和描述文献的主题词之间的匹配关系(系统观),用户相关性定义为用户检索相关信息的愿意程度(用户观),39,国内外检索评价历史,1959-1980,以Saracevic发表的关于相关性研究的阶段性综述为标志,出现了大型实证研究和系列理论研究 实证研究:1957和
13、1962年开始的美国科学基金会(NSF)资助的Aslib Cranfield I和Cranfield II项目。 Cranfield I基于系统观,检索提问根据来源文献题目拟出,相关性判断由查询者将检索提问与文献号比对完成,不阅读文献 Cranfield II将实际检索提问提交给系统,提问者通过阅读检出的文摘判断相关性 Cranfield 的意义 找到了影响相关性判断的多种因素,为后续得到研究提供了测试数据 首次采用查全率和查准率进行检索系统评估,同时发现两者之间存在的类反比关系(inverse relationship) 引发了相关性研究的论争,Cranfield的每个方面都收到批评和反驳,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 检索 可视化 评价
链接地址:https://www.31doc.com/p-2626808.html