技术篇二.ppt
《技术篇二.ppt》由会员分享,可在线阅读,更多相关《技术篇二.ppt(57页珍藏版)》请在三一文库上搜索。
1、技术篇 (二),赵亮 上海图书馆系统网络中心 ,面向21世纪课程教材 数字图书馆原理及应用,内容,第六章:数字图书馆信息存储与检索技术(p153-188) 第七章:数字图书馆的互操作(p188-226),重点,掌握: 数据压缩技术原理、方法,文本压缩、多媒体压缩;p162-167 跨语言检索的实现方法;p179-185 数字图书馆异构对象数据库互操作技术;p195-197 Z39.50协议及Z39.83协议其原理、模式、应用;p210 熟悉: 多媒体信息检索;p170-178 互操作产生的原因;p190-191,重点,了解: 存储设备、存储技术和架构、数据备份技术、数据压缩;p153,p162
2、 基于内容的信息检索技术;跨语言检索;p170, p178 数字图书馆的互操作及其协议和标准;p189,第六章 数字图书馆信息存储 与检索技术,数字图书馆的存储设备(p.153-155),磁盘阵列 (RAID) 磁带库 光盘塔 光盘库 光盘网络镜像服务器,存储技术和架构(p.155-158),直接连接存储 (DAS) 网络连接存储 (NAS) 存储区域网 (SAN),DAS ( 直接连接存储),定义: 用SCSI或FC直接连接到服务器,运行SCSI协议。,DAS 的优点 简易 快速 (5ms) 已广泛应用 安全 所有驱动程式齐备 为甚麽不采用?,DAS 的缺点 不能重新分配 不能重新配置 没有
3、集中管理 没有集中备份 扩充容量会有困难 增加存储设备会拖慢服务器,定义: 通过专用服务器连接到网络的存储设备,一般使用NFS, CIFS, TCP/IP, HTTP 或其他网络协议,DAS 的优点 简易 快速 (5ms) 已广泛应用 安全 所有驱动程式齐备 为甚麽不采用?,DAS 的缺点 不能重新分配 不能重新配置 没有集中管理 没有集中备份 扩充容量会有困难 增加存储设备会拖慢服务器.,NAS 的缺点 加重网络的负担 存储需求增大时,需要再购置额外的NAS机组,NAS (网络存储),NAS (网络存储),Ethernet,一台专用服务器为网络提供档案管理服务 通常服务器会为用户提供 NFS
4、, CIFS, 或 NetWare 存储空间,而利用 TCP/IP 作网络协议 单一的 NAS 服务器会产生数据存取的瓶颈,Sun,HP,Windows,SCSI,DATA,NAS,SAN (存储区域网络),定义: 一个以连接存储设备及服务器为主要目的而设计和建立的专用网络,一般运行SCSI协议。这种结构可以抒缓企业网络的压力,DAS 的优点 简易 快速 (5ms) 已广泛应用 安全 所有驱动程式齐备 为甚麽不采用?,DAS 的缺点 不能重新分配 不能重新配置 没有集中管理 没有集中备份 扩充容量会有困难 增加存储设备会拖慢服务器,NAS 的缺点 加重网络的负担 存储需求增大时,需要再购置额外
5、的NAS机组,光纤 SAN,Ethernet,一种存储架构,服务器利用光纤网络使用存储资源 SAN 通常在光纤(FC-AL or FC-SW)背後使用SCSI协议 数据块在应用服务器内编排成档案,DATA,Fibre Channel,SAN,三种存储架构的比较分析,数据备份技术,本地备份 DAS 网络备份 NAS 基于SAN的LAN-FREE的备份 SAN,物理空间降低存储费用 时间空间迅速传输媒体信源 频率空间并行开通更多业务,数据压缩的定义与内容p.162,数据压缩技术实现的衡量标准p.163,压缩比要大 恢复后的失真小 速度要快,压缩算法简单 硬件开销小,数据压缩技术原理、方法 p.16
6、3-164,无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。 有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。 混合压缩是指接近于无损压缩效果的有损压缩。,文本压缩技术 p.164-167,霍夫曼(Huffman)编码 算术编码 字典压缩模型 LZW编码 游程编码,霍夫曼编码实例, step I,Assume that relative frequencies are: A:
7、 40 B: 20 C: 10 D: 10 R: 20 (I chose simpler numbers than the real frequencies) Smallest number are 10 and 10 (C and D), so connect those,霍夫曼编码实例, step II,C and D have already been used, and the new node above them (call it C+D) has value 20 The smallest values are B, C+D, and R, all of which have v
8、alue 20 Connect any two of these,霍夫曼编码实例, step III,The smallest values is R, while A and B+C+D all have value 40 Connect R to either of the others,霍夫曼编码实例, step IV,Connect the final two nodes,霍夫曼编码实例, step V,Assign 0 to left branches, 1 to right branches Each encoding is a path from the root,A = 0 B
9、 = 100 C = 1010 D = 1011 R = 11 Each path terminates at a leaf Do you see why encoded strings are decodable?,霍夫曼编码,Unique prefix property,A = 0 B = 100 C = 1010 D = 1011 R = 11 No bit string is a prefix of any other bit string For example, if we added E=01, then A (0) would be a prefix of E Similarl
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 技术
链接地址:https://www.31doc.com/p-2643280.html