《综合布线-存储方案.ppt》由会员分享,可在线阅读,更多相关《综合布线-存储方案.ppt(51页珍藏版)》请在三一文库上搜索。
1、存储&备份的基础,bird_man 2003-10-26,存储备份系统的发展 存储备份 存储备份技术中的误区 构建存储备份系统的原则,内容,存储备份系统的发展,软盘,硬盘,磁带,磁光盘 scsi技术,ssa技术,fc技术,iscsi技术 das,nas,san Lan backup,lanfree backup,serverfree backup .,SCSI技术与RAID技术,SCSI是Small Computer System Interface(小型计算机系统接口)的英文缩写。SCSI最早是一种并行连接使用SCISI命令的计算机硬件接口。 Redundant Array of Inexp
2、ensive (or Independent) Drive。RAID是1988年由美国加州大学的Berkeley分校的David Patterson等几人提出来的。,RAID,RAID条切“striped”的存取模式 在使用数据条切Data Stripping 的RAID 系统之中,对成员磁盘驱动器的存取方式,可分为两种: 并行存取Paralleled Access 独立存取Independent Access RAID 2和RAID 3 是采取并行存取模式。 RAID 0、RAID 4、RAID 5及RAID 6则是采用独立存取模式,平行存取模式,并行存取模式支持里,是把所有磁盘驱动器的主轴
3、马达作精密的控制,使每个磁盘的位置都彼此同步,然后对每一个磁盘驱动器作一个很短的I/O数据传送,如此一来,从主机来的每一个I/O 指令,都平均分布到每一个磁盘驱动器。 为了达到并行存取的功能,RAID 中的每一个磁盘驱动器,都必须具备几乎完全相同的规格:转速必须一样;磁头搜寻速度Access Time必须相同;Buffer 或Cache的容量和存取速度要一致;CPU处理指令的速度要相同;I/O Channel 的速度也要一样。总而言之,要利用并行存取模式,RAID 中所有的成员磁盘驱动器,应该使用同一厂牌,相同型号的磁盘驱动器。,独立存取模式,相对于并行存取模式,独立存取模式并不对成员磁盘驱动
4、器作同步转动控制,其对每个磁盘驱动器的存取,都是独立且没有顺序和时间间格的限制,同时每笔传输的数据量都比较大。因此,独立存取模式可以尽量地利用overlapping 多任务、Tagged Command Queuing等等高阶功能,来“隐藏”上述磁盘驱动器的机械时间延迟Seek 和Rotational Latency。 由于独立存取模式可以做overlapping 多任务,而且可以同时处理来自多个主机不同的I/O Requests,在多主机环境如Clustering,更可发挥最大的性能。,RAID级别 相对优点 相对缺点,RAID 0 存取速度最快 没有容错 RAID 1 完全容错 成本高 R
5、AID 3 写入性能最好 没有多任务功能 RAID 4 具备多任务及容错功能 Parity 磁盘驱动器造成性能瓶颈 RAID 5 具备多任务及容错功能 写入时有overhead RAID 0+1/RAID 10 速度快、完全容错 成本高,Tape,DDS,8mm,AIT(HP,Exabyte,SONY) DLT(ATL) LTO(IBM,HP,Segate) 9840(STK) ,SAN,SAN = Storage Area Network (存储区域网络) 是一种基于光网的特殊的后台数据存取网络 提供了一个性能稳定的数据高速存取平台 关键概念: 支持前台企业信息处理网络 (例如:Ethern
6、et及TCP/IP) 有助于减轻关键工作量和增加应用性能及高可用性 成为一种有灵活同时有扩展性的数据平台来解决现有的数据迁移和数据共享瓶颈问题 基于NCITS T11:光纤通道(Fibre Channel)标准I/O接口 (X3.230-1994) http:/www.t11.org,光纤通道的特性,光纤通道的优点 为一个新的多用途网络信息基础结构, 用于连接开放系统存储, 网络, 视频应用和服务器集群应用. 为上层协议(SCSI,IP,ATM,IEEE 802.2等)提供一个通用硬件传输平台 高速: 现在可以提供2Gbit(200MB)/秒的数据传输速率, 全双工专有连接,未来可升级至10G
7、bit/秒 串行的,无阻塞(non-blocking)数据传输 最大10公里连接距离(通过扩展器可连接上千公里,适于灾难恢复应用) 多平台系统支持 (包括 AIX, NT, Solaris, HP/UX, UNIX, LINUX, Novell,等) 支持传统环境和应用,光纤通道的技术能力 不存在无线电信号散射 (RFI), 从而消除了电磁信号 串行数据传输, 每传输一位需要0.94纳秒(极小的时间延迟) 使用8b/10b编码方式将8位转换为10b格式进行串行传输 (内置时钟信号) 先进的流控制系统保证数据按顺序传输. 最多可以连接1千6百万个节点(交换Fabric模式) 帧大小可调整, 支持
8、128MB的批量数据传输 强大的错误更正能力(位错误率 = 1x10-12), 比原有铜连接网络强大1,000倍,光纤通道 = 是SAN Fabric的基础 为存储系统提供一个网络连接模式,客户机,LAN(局域网),广域网,存储区域网 (第二网),Fabric = 第二网 “Fabric”是一个由智能光纤通道交换机构成并具有良好系统设计的高智能网络, 这一数据网络可以提供企业级的性能, 扩展能力, 可管理能力, 可靠性和可用能力,服务器,存储子系统,第一网,光纤通道的拓扑结构,Fibre Channel有三种拓扑结构: 点对点(Point-to-Point) 两个设备之间互连 仲裁环(Arbi
9、trated Loop) 最多支持126个设备互连,形成一个仲裁环 交换式Fabric(Switch Fabric) 最多1千6百万个设备互连,点对点,交换式 Fabric,Arbitrated Loop (仲裁环),光纤通道协议映射,IPI - 3 命令集映射 (IPI-3 STD),第二网启动顺序:,建议遵循一定的顺序启动网络设备 首先要启动的就是网络系统,包括所有的交换机并确定所有的设备连接正常 第二网启动进程:,NAS,网络附加存储设备(Network Attached Storage,NAS)是一种专业的网络文件存储及文件备份设备,或称为网络直联存储设备、网络磁盘阵列。NAS是基于L
10、AN的,按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据传输。在LAN环境下,NAS已经完全可以实现异构平台之间的数据级共享。 NAS 结构和SAN最大的区别就在于NAS有文件操作和管理系统,而SAN却没有这样的系统功能,其功能仅仅停留在文件管理的下一层,即数据管理。 SAN和NAS并不是相互冲突的,是可以共存于一个系统网络中的,但NAS通过一个公共的接口实现空间的管理和资源共享,SAN仅仅是为服务器存储数据提供一个专门的快速后方通道,在空间的利用上,SAN和NAS也有截然不同之处,SAN是只能独享的数据存储池,NAS是共享与独享兼顾的数据存储池。,ISCSI,iSCSI
11、(互联网小型计算机系统接口)是一种在Internet协议网络上,特别是以太网上进行数据块传输的标准。它是由Cisco和IBM两家发起的,并且得到了IP存储技术拥护者的大力支持。是一个供硬件设备使用的可以在IP协议上层运行的SCSI指令集。简单地说,iSCSI可以实现在IP网络上运行SCSI协议,使其能够在诸如高速千兆以太网上进行路由选择。 ISCSI的工作流程 iSCSI协议就是一个在网络上封包和解包的过程,在网络的一端,数据包被封装成包括TCP/IP头、iSCSI识别包和SCSI数据三部分内容,传输到网络另一端时,这三部分内容分别被顺序地解开。,数据时任何资源的基础,Data,Busines
12、s Intelligence,Knowledge,Wisdom,Information,Backup(备份),Backup - Definition “Backup is a copy type of operation, designed to protect data from accidental or malicious loss or damage”,为什么要备份,System stolen User Data and System Loss System damaged User Data and System Loss/Downtime Accidental File Delet
13、ion File Loss Accidental File Overwrite File Loss Accidental Directory Deletion Directory and/or File Loss Hacker Intrusion Corrupt or Lost Data Magnetic Disk Failure Corrupt or Lost Data CPU/Motherboard Failure Corrupt or Lost Data and Downtime Network/Interface Failure Corrupt or Lost Data/Loss of
14、 Connectivity Application Halt or Crash Corrupt or Lost Data Operating System Halt or Crash Corrupt or Lost Data,事件,结果,为什么要备份,Flood Site Loss - Complete or Partial Extreme Weather Event Site Loss - Complete or Partial Seismic Event Site Loss - Complete or Partial Aviation Accident Site Loss - Comple
15、te or Partial Terrorism Site Loss - Complete or Partial Emergency Evacuation Loss of Access to Site,灾难,后果,Full backup(全备份),全备份,.,全备份,全备份是在某一个时间点上所有数据的一个完全拷贝,Differential(差分) Backups,Full Backup,Differential,Full Backup,A differential backup is a copy of all the data since the last full Backup.,.,Inc
16、remental(增量) Backups,Full Backup,.,Incrementals,Full Backup,Incremental backup is a copy of only the data that have changed since the last backup.,恢复,恢复过程将数据从磁带拷贝回磁盘 备份是比恢复早的一个时间点的完全映象,备份记录了文件的目录结构,权限等,备份在具体的某盘磁带,磁带在磁带库中具体的槽位等 这些信息存储在备份软件的数据库中 通常被称为元数据,备份数据的生命周期,Data backed up,Browse Policy Expires,
17、BROWSABLE,Retention Policy Expires,RECOVERABLE,Volume Recycled,RECYCLABLE / RECOVERABLE,Archive(归档),Archive - Definition “Archive is a move type of operation, designed to preserve a file for future reference”,Hierarchical Storage Management (HSM),HSM 是充分保护现有的硬盘存储资源的基础上,将很少使用的文件保存到相对较为便宜的磁带上,当应用需要访问的
18、时候自动进行回调,相对而言在访问速度上会有所影响;对于应用来说是透明的。,1.,1.,HSM Process,“透明的” 移动,备份服务器,备份客户端,Backup Server Definition “The Backup Server is the central control and management point of the backup and restore process. It holds the Index database (Metadata)” A Client - Definition “A client is a server or workstation th
19、at backs up its data over the network to the backup server”.,传统lan环境下数据流走向,Application Server,LAN,RAID or JBOD,Tape Library,Backup Server,Lanfree备份数据流的走向,Local Area Network,Metadata,Backup Server,Backup Client,Serverfree数据流走向,Disk,Fibre Channel,Local Area Network,Storage Area Network,San环境下磁带驱动器的共享,
20、Tape,Local Area Network,SAN,Fibre Channel,集群环境下的备份,Nas的备份,NAS Server,Tape,Backup Server,存储备份的误区,误区1: 混淆备份、双机热备份和容灾系统,在为大型企业提供咨询服务时,经常有用户反映: “我们的数据库软件有容错和自动恢复功能,服务器主机也做了双机热备份,而且以后还要建立容灾系统。在这么高标准的安全性保证下,我们再也不需要用磁带设备和备份软件每天做备份了。”,误区2: 错解数据迁移,随着社会的发展,现代企业的流动性大大增加,给企业的数据“搬家”在所难免。很多企业由于业务需要,都建立了异地的数据分发、数据
21、集中或者数据同步一类的系统。一些用户把这种系统称为“数据迁移”。不妥的是,在存储技术中,“数据迁移”这一概念早已有了明确的定义,而且与之相去甚远。真正的数据迁移技术(也被称为分层存储管理)是指: 由在线存储设备和离线存储设备共同构成一个协调工作的存储系统,该系统在在线存储设备和离线存储设备之间动态地管理数据,使得访问频率高的数据存放于性能较高的在线存储设备中,而访问频率低的数据存放于较为廉价的离线存储设备中。这样,既可以保证在绝大部分状况下系统的性能,同时又大幅度降低了系统成本。,构建存储备份的原则,原则一: 信息是存储的核心,什么样的企业需要存储系统,实际上,任何企业都需要存储系统。因为今天
22、企业的核心问题之一是信息,而建立存储系统的目的,就是对信息进行保护、管理和共享。,原则二: 要产品也要技术,一个典型的数据存储系统基本由以磁盘阵列为主的在线存储系统、以磁带设备为主的离线存储系统、存储管理软件、交换设备和主机适配器等周边设备共4部分的产品构成。由于产品提供商很难对用户的具体数据特征做出深入细致的分析,并给出具有针对性的方案,所以在用户还没有足够的能力来自行设计存储系统之前,选择一家有经验的存储专业集成商是很必要的。,原则三: 明确需求,切勿一味追新,作为用户,应该充分把握自己的实际情况,不要盲目地跟随厂商的思路。在明确需求之时,可以咨询有经验的行业专家顾问,或者考察同行业的系统
23、设计和实施情况,万不可把自己至关重要的业务作为“试验田”。,原则四: 长远考虑,打好基础,存储是应用系统的基础和核心,它的丝毫变化都将“牵一发而动全身”,同时,存储系统出现的问题和故障也可能影响到整个IT系统的正常运行。所以,建立存储系统之初就应该考虑到稳定性和结构扩展性等方面的要求,保证系统能够稳定而长期的工作。,综合评价 为我所用,确定好选择哪种存储系统的基本结构后,我们可以考虑产品问题。存储产品的评价基本可以集中在下面几个方面 容错能力、 性能、 容量、 连接性、 管理性 附加功能,1容错能力,容错能力是指在存储设备的设计方面对各种偶然性错误和意外情况的预期,以及采取的预防或补救措施。这
24、里,用户需要注意的是,存储系统是一个从软到硬的复杂系统,所以,对数据保护能力的评价应当考虑到整个系统。,2性能,存储产品的性能评价是最容易的,因为这一指标可以被充分量化。对磁盘阵列产品来说,性能指数主要有2个: 带宽和IOPs(每秒I/O次数)。带宽决定于整个阵列系统,与所配置的磁盘个数也有一定关系; 而IOPs则基本由阵列控制器决定。在Web、Mail和数据库等小文件频繁读写的环境下,性能主要由IOPs决定。在视频和测绘等大文件连续读写的环境下,性能主要由带宽决定。可见,在不同的应用方式中,需要考察的侧重点各不相同。,3容量,容量是最简单的一个性能指标,需要注意的是,用户不仅要关心产品的最大
25、容量,还要关心厂商推荐使用容量以及扩容成本等问题。,4连接性,在传统的LAN环境中,连接不存在问题。 在SAN环境中,以光纤通道连接设备为中心,要连接主机、磁盘阵列和磁带库等设备,环境比较复杂,因此在产品选型时,充分考虑设备间的连接性。选择具有良好的开放性和连接性的产品,不仅为当前系统正常连接和运行提供保障,也为系统未来扩展提供更大的空间和灵活性。,5管理性首先,用户应考虑产品所提供的管理功能是否实用可靠; 其次,支持中心化管理和远程管理的产品一定让用户很省事; 还有,很多产品的故障自动通知机制给用户带来方便,同时也构成安全隐患; 最后,在配置改变或系统扩容时,无须宕机或尽可能缩短宕机时间是企业级产品的重要特征。,6附加功能,现在的存储产品,尤其是部门级和企业级的在线、离线存储产品,已经不仅仅是存储数据的BOX,而是一个智能的小型系统。各厂商将很多功能性软件都整合到自己的存储设备中,以向用户提供更好的解决方案。目前,比较常见的附加功能主要有数据快照功能、LUN Masking功能和异地数据复制以及scsi copy功能等几种。,谢谢,
链接地址:https://www.31doc.com/p-2919925.html