技术报告NetApp Lustre 高性能计算解决方案.docx
《技术报告NetApp Lustre 高性能计算解决方案.docx》由会员分享,可在线阅读,更多相关《技术报告NetApp Lustre 高性能计算解决方案.docx(55页珍藏版)》请在三一文库上搜索。
1、NetApp技术报告NetAppLustre高性能计算解决方案:解决方案指南NetApp公司RobertLai2012年8月ITR-3997目录1简介51.1NetAppLustreHPC解决方案简介52解决方案概述91.1 NetAppLustreHPC解决方案规模估算注意事项91.2 NetAppLustreHPC解决方案性能注意事项161.3 E系列解决方案硬件包223 E系列管理263.1 E系歹IJSANtricityES10.80带外管理264 E系列物理基础架构274.1 E系列E5400硬件274.2 E系列E2600硬件334.3 E系列磁盘扩展架395 E系列存储425.1
2、 Lustre文件系统的E系列OST配置425.2 Lustre文件系统的E系列MDT配置436连接到E系列的操作系统446.1 Lustre文件系统的E系列OSS配置446.2 Lustre文件系统的E系列MDS和MGS配置46表格目录表1)NetAppLustreHPC解决方案组件列表。6表2)NetAppLustreHPC解决方案的E系列扩展参考标准。8表3)驱动器大小和容量。11表4)元数据性能。12表5)域1和域2的性能指标。14表6)驱动器和驱动器架容量。14表7)每个架的最大驱动器容量。15表8)按阵到显示的性能摘要。19表9)E系列部件号。22表10)控制器驱动器架LED状态定
3、义。29表11)控制器基本功能LED状态定义。30表12)以太网管理端口状态指示灯定义。31表13)主机端FC端口状态指示灯定义。31表14)驱动器端SAS端口状态指示灯定义。32表15)控制器磁盘架LED状态定义。35表16)控制器基本功能LED状态定义。36表17)以太网管理端口状态指示灯定义。37表18)主机端SAS端口状态指示灯定义。37表19)驱动器端SAS端口状态指示灯定义。38表20)OSTHA存储配置。42插图目录图1)典型Lustre工作流。5图2)典型Lustre架构。7图3)OSSUHA配置示例。8图4)文件系统的测试进程I/O流。17图5)按流数量绘制的性能域。17图6
4、目录操作性能。20图7)文件操作性能。21图8)SANtricityES管理客户端的“EnterpriseManagement“(企业管理)窗口。26图9)E5400架选件。28图10)E5460控制器架与可选的主机端扩展端口。28图11)控制器驱动器架状态LEDo29图12)E5400控制器状态LED指示灯。30图13)E5400驱动器扩展端口状态LED指示灯。31图14)主机连接示例。33图15)E2600架选件。34图16)E2660控制器与可选的主机端扩展端口。34图17)控制器驱动器架状态LEDo35图18)E2600控制器状态LED指示灯。36图19)E2600驱动器扩展端口状态
5、LED指示灯。38图20)主机连接示例。39图21)ESM箱。39图22)使用DE6600架的最大容量E系列阵列配置。40图23)使用DE5600架的典型E系列阵列配置。40图24)使用DE1600架的典型E系列阵列配置。41图25)LustreHA配置下的“OSS到存储”架构。44图26)常见的“OSS到OS,HA配置。45图27)E系列E2624存储上的Lustre文件系统冗余MDSHA配置。461简介1.1NetAppLustreHPC解决方案简介概述NetAppLustre高性能计算(HPC)解决方案通过大容量、高性能E系列存储平台,使Lustre-文件系统在建模和模拟环境中可支持超强
6、的可扩展性与超高的输入/输出(I/O)吞吐量。凭借其可扩展性和高可靠性设计,可满足当前及未来的性能和增长需求。图1说明了典型Lustre工作流的各个阶段。图1)典型Lustre工作流。我入管理生成F处理F传输NetAppLustreHPC解决方案基于E系列平台,它是针对可扩展、可靠且高性能计算需求而构建的,可支持超强的I/O性能和大规模文件系统容量。政府、大学、研究机构和企业组织都会发现,NetAppLustreHPC解决方案能够应对重大业务挑战,可支持数万个Lustre客户端以每秒数千GB的I/O吞吐量访问数百个PB存储。架构和组件NetAppLustreHPC解决方案由E系列存储以及适用于
7、对象存储目标(OST)与元数据目标(MDT)的Lustre全局并行文件系统组成。NetApp专业服务和SupportEdge是必备的解决方案组成要素。NetAppLustreHPC解决方案包括以下组件,如表1所示。表I)NetAPPLUStreHPC解决方案组件列表,组件兑明硬件提供商对象存储服务器(OSS)OSS可为客户端提供文件I/O服务,并管理OST上的数据。OSS通常采用光纤通道(FC)或InfiniBand(IB)协议直接连接到基于E系列的OST。Linux服务器(在高可用性HA模式下为两台)集成商或客户对象存储目标(OST)OST是一个Lustre逻辑单元号(LUN),位于基于E5
8、460或E5424的存储设备上,可提供Lustre对象存储空间。NetAppE5460和E5424NetApp对象存储可扩展单元(OSSU)OSSU是一个可扩展组件,该组件包括由OSS以及相关OST组成的HA对。NetAppE5460/E5424与OSSNetApp与集成商或客户元数据服务器(MDS)MDS可为客户端提供元数据服务。MDS可使用SAS协议连接到元数据存储。Linux服务器(在高可用性HA模式下为两台)集成商或客户元数据目标(MDT)MDT是用于保存文件系统元数据的存储。元数据存储与应用程序或用户存储是分离的。MDT通常使用SAS连接到MDS0NetAppE2624NetApp管
9、理服务器(MGS)MGS用于管理文件系统配置。Linux服务器集成商或客户Lustre客户端这些客户端将运行通过网络连接到Lustre客户端网络结构的应用程序,它们是Lustre应用程序的计算或I/O节点。Linux服务器集成商或客户Lustre客户端网络结构旧、以太网(或其他集群网络结构)以及相应的布线,用于在Lustre客户端与OSS服务器之间提供I/O访问功能。IB网络或以太网等集成商或客户第二层和第三层存储用于将数据归档到磁盘或磁带的其他可选方法。近线(NL)磁盘存储和(或)磁带库归档集成商或客户有关详细信息,请参阅NetAPPE5400存储系统数据表。图2简要描绘了使用旧LUStre
10、客户端网络结构的计算和可视化环境中的NetAppLustreHPC解决方案。图2)典型Lustre架构。1.ustreLAN客户谪超级计Jl机1.uttre相田器LNETHAflK务我员核It援对象存储外敏存IM器器(OSSNetAPPE5460阵列NetApPE2624元效据存M阵列1.ustreIB客户S像群1.ustre元敷据疆务H40Gb朦IB对象存锭可旷展单元(OSs对象存情相势器(OSS)NeSppE5460阵列通过旧SkFCE系列架构NetAppLustreHPC解决方案包括E5460和(或)E5424E系列存储系统。这些存储系统在可容纳60个驱动器的DE66004U架或可容纳2
11、4个驱动器的DE56002U架中放置两个E5400RAID控制器。每个架均可使用NL-SAS.SAS或固态驱动器(SSD)来填充。E5460和E5424是第五代存储阵列,采用机械工程设计专利技术,可提供密集、可扩展且高度可靠的带宽和容量.二磁盘控制器固件可支持高带宽、大型块流和小型块随机I/O的最佳组合。基础E5460或E5424可通过添加一个或多个相对应的DE6600或DE5600扩展机箱进行扩展。DE6600和DE5600是磁盘扩展机箱或扩展架,可放置磁盘,但不能放置RAID控制器。它们通过线缆连接到E5460或E5424,可在基础单元中的RAID控制器背后提供扩展存储。因此,NetApp
12、LustreHPC解决方案的架构可以设计为能单独扩展容量和带宽,从而更好地满足客户需求。该解决方案还使用E2624来存储Lustre文件系统元数据。E2624具有DE5600架,但使用E2600RAID控制器,而不是E5400o表2列出了NetAppLustreHPC解决方案的E系列扩展选件的参考标准。表2)NetAppLustreHPC解决方案的E系列扩展参考标准。I类别IE5460E5424IE2624外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224控制器架111最大扩展架数570*磁盘架总数681k系列柱制器飞期演器驱沿器大小原宿容蜃珞式化后
13、的容量I(RAID10),te文件甯构24|600GB14.4TBI6.0TB1JXITJ7C.E匕&1性能【每秒操蚱数):;数千个客户端通过其单一文件系统命名空间派片工用BarWU大加不山3l4-2XArfK6,000至23,000翅管理仲2服务RSk作为连接到OSS一的卡添期未储1lUN提供10,00089,000N胱醐)SSU可将两个C)SS及其关联的E系歹历收载作硒D系统(以及相应的C)ST)组合成一个 修用十扩展LuSire文件系统的性能、容噂轴蔓版OoO)SSU设计相当于为单个E系列存储系统甑置一对-OSS这种设计可提供基本的HA功能,并能 懈鲤生可能会影响Lustre用户数据访问
14、的OSS,故障至S则设计可防止在一个C)SS发生故障时对数据的访问。每个OSSU都是一个独支w ,由一拙宜太的CGGIl旦Je再列控制器架扩展架 膜或器I撑制器权和控制权 有-学卑微IM以最隹鬻茶胫吞吐量、容量变X采用这种方 前CbSS控制槎J 5424 或 5460Lustreo: 60/90:斤用格任让后的:TB)AAQ 6 (82;OSSU共享存储连接或性完。pletA*fPd解决方案配置最电实践将或其关联的9S=伞qssu7W 需要ffQ9ssu1度配甑例602/3 TB120/18087.3/130.9ESMDE6600602/3 TB120/18087.3/130.9E5400E5
15、42424600 GB/900 GB14.4/21.58.7/13.1ESMDE560024600 GB/900 GB14.4/21.58.7/13.1:腑OSSU来扩展LlJSt钞哪察统,牌而提高总楸能加容量。青却褪示了卜e佛那建议的HA DSSU 架构。(半填充)E5400 NetA)P其南e(辎毯S梨决案:解决方案指南的 E5460ESMDE6600 架60个(每个阵列最多总共360 个)3005个(每个阵列最多总共6个架)5阵列型号驱动器数量RAID格式域1:最大域1:控制器架域2:最大域2:控制器架流数性能(GB/秒)流数性能(GB/秒)E546030RAID6(8+2)501.25
16、1,5000.6E546060至360RAID6(8+2)1002.53,0001.2E542424RAID6(8+2)501.31,0000.6E542448至192RAID6(8+2)1002.62,0001.2E系列控制器控制器架扩展架;驱动器数上限支持的扩展架数上限这些OSSU可通过从OSS到Lustre客户端网络结构的连接来连接到整个Lustre文件系统,从而极大地简化Lustre的横向扩展和整体设计。只需通过一个文件系统命名空间在客户端网络结构上增加OSSU的数量,即可横向扩展该文件系统。NetAppLustreHPC解决方案确定了每种OSSU设计的性能和容量特征。在设计特定于客户
17、的Lustre文件系统时,会根据单个OSSU的特征值,使用适当数量的OSSU进行扩展,以达到总体性能和容量标准。MDS可管理Lustre元数据,并将这些数据存储到MDT中。一个MDS可为文件系统中的一组OSSU提供Lustre客户端的文件布局映射。另一个MDS可提供高可用性,建议在所有配置中使用。结论NetAppLustreHPC解决方案是为需求量最高的计算和可视化处理工作负载进行设计和优化的。这一预先配置且经过预先测试的解决方案旨在支持大量用户处理大量数据所需要的高带宽。通过以更高的速度来处理数据,组织可以更有力地支持技术和业务计算建模和模拟: 高带宽支持可在一个4U机架单元中提供高达3.5
18、GB/秒的带宽。 模块化设计能够利用最少的组件来实现扩展,从而避免了超配。 高密度可在每个行业标准40U机架中支持多达1.8PB的存储容量。经济高效的扩展能力可在同一个容器中单独扩展带宽和容量。可从小型部署开始,然后随着需求的变化以2U或4U为增量逐步扩展。2解决方案概述2.1 NetAppLustreHPC解决方案规模估算注意事项概述规模估算是构建NetAppLustreHPC解决方案的一个关键环节。首先,它需要能够达到特定的容量和吞吐量目标。要恰当估算Lustre文件系统的规模,请务必收集尽可能多的信息和需求。这些信息和需求分为以下几类: 基础架构环境、用户群、应用程序和工作流 用户及其应
19、用程序所需的应用程序数据存储容量 应用程序环境所需的总体吞吐性能,以及并发顺序I/O流数量的估计值 未来数据存储和性能的增长因素工作流需求在NetAppLustreHPC解决方案环境中,具有许多应用程序类型、使用情形以及所产生的I/O模式。出于规模估算的目的,已对与大多数HPC环境相关的并行I/O特征进行了一些简单假设。一般来说,当集群中的客户端从Lustre文件系统执行大量的并行顺序文件读写请求时,需要的吞吐性能最高。这些顺序文件读写请求称为流。对于NetAppLustreHPC解决方案中的存储元素而言,这种应用程序I/O通常表现为遍布在存储系统中的大量均匀分布的并发顺序读写流。为了确定I/
20、O大小不同的大量并发顺序I/O读写流的吞吐性能特征,已在相似测试条件下对NetAppLustreHPC解决方案进行了衡量。容量要求无论是使用现有应用程序还是部署新应用程序,都需要确定文件系统所需的存储容量。存储容量通常以TB为单位来指定。此外,还需要考虑用户数和正在使用的文件总数。性能要求性能通常指定为高峰期所需的总存储吞吐量。无论是新应用程序环境,还是现有应用程序环境,这一指标均以所有应用程序的预计数据访问速率(GB/秒)来衡量。此外,为达到总吞吐量而执行的并发流数对性能也同样重要。因此,需要在规模估算计算中同时使用总吞吐量和流数。此外,还需要注意相对于总吞吐量所需读写量的百分比。但是,目前
21、的规模估算仅计算读写流总共所需的吞吐量.二此外,还对以下操作确定了元数据性能特征: 每秒创建和删除的文件数 每秒创建和删除的目录数 每秒统计信息数(例如,Linux中的IS命令等操作)元数据性能不受E系列存储阵列性能的限制,而主要由所选的MDS以及Lustre架构来决定。1.ustre存储容量需求估算计算对于Lustre文件系统,应执行两种容量估算计算: 用作OST的存储 用作MDT的存储OST存储容量需求由客户根据其特定环境来指定。MDT存储容量需求由客户在Lustre文件系统中需要的文件总数决定。注:在本文档中,Lustre存储需求是以单个Lustre文件系统来计算的。1.ustre元数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 技术报告NetApp Lustre 高性能计算解决方案 技术 报告 NetApp 性能 计算 解决方案
