欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    技术报告NetApp Lustre 高性能计算解决方案.docx

    • 资源ID:499314       资源大小:1.01MB        全文页数:55页
    • 资源格式: DOCX        下载积分:5
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录 微博登录
    二维码
    微信扫一扫登录
    下载资源需要5
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    技术报告NetApp Lustre 高性能计算解决方案.docx

    1、NetApp技术报告NetAppLustre高性能计算解决方案:解决方案指南NetApp公司RobertLai2012年8月ITR-3997目录1简介51.1NetAppLustreHPC解决方案简介52解决方案概述91.1 NetAppLustreHPC解决方案规模估算注意事项91.2 NetAppLustreHPC解决方案性能注意事项161.3 E系列解决方案硬件包223 E系列管理263.1 E系歹IJSANtricityES10.80带外管理264 E系列物理基础架构274.1 E系列E5400硬件274.2 E系列E2600硬件334.3 E系列磁盘扩展架395 E系列存储425.1

    2、 Lustre文件系统的E系列OST配置425.2 Lustre文件系统的E系列MDT配置436连接到E系列的操作系统446.1 Lustre文件系统的E系列OSS配置446.2 Lustre文件系统的E系列MDS和MGS配置46表格目录表1)NetAppLustreHPC解决方案组件列表。6表2)NetAppLustreHPC解决方案的E系列扩展参考标准。8表3)驱动器大小和容量。11表4)元数据性能。12表5)域1和域2的性能指标。14表6)驱动器和驱动器架容量。14表7)每个架的最大驱动器容量。15表8)按阵到显示的性能摘要。19表9)E系列部件号。22表10)控制器驱动器架LED状态定

    3、义。29表11)控制器基本功能LED状态定义。30表12)以太网管理端口状态指示灯定义。31表13)主机端FC端口状态指示灯定义。31表14)驱动器端SAS端口状态指示灯定义。32表15)控制器磁盘架LED状态定义。35表16)控制器基本功能LED状态定义。36表17)以太网管理端口状态指示灯定义。37表18)主机端SAS端口状态指示灯定义。37表19)驱动器端SAS端口状态指示灯定义。38表20)OSTHA存储配置。42插图目录图1)典型Lustre工作流。5图2)典型Lustre架构。7图3)OSSUHA配置示例。8图4)文件系统的测试进程I/O流。17图5)按流数量绘制的性能域。17图6

    4、目录操作性能。20图7)文件操作性能。21图8)SANtricityES管理客户端的“EnterpriseManagement“(企业管理)窗口。26图9)E5400架选件。28图10)E5460控制器架与可选的主机端扩展端口。28图11)控制器驱动器架状态LEDo29图12)E5400控制器状态LED指示灯。30图13)E5400驱动器扩展端口状态LED指示灯。31图14)主机连接示例。33图15)E2600架选件。34图16)E2660控制器与可选的主机端扩展端口。34图17)控制器驱动器架状态LEDo35图18)E2600控制器状态LED指示灯。36图19)E2600驱动器扩展端口状态

    5、LED指示灯。38图20)主机连接示例。39图21)ESM箱。39图22)使用DE6600架的最大容量E系列阵列配置。40图23)使用DE5600架的典型E系列阵列配置。40图24)使用DE1600架的典型E系列阵列配置。41图25)LustreHA配置下的“OSS到存储”架构。44图26)常见的“OSS到OS,HA配置。45图27)E系列E2624存储上的Lustre文件系统冗余MDSHA配置。461简介1.1NetAppLustreHPC解决方案简介概述NetAppLustre高性能计算(HPC)解决方案通过大容量、高性能E系列存储平台,使Lustre-文件系统在建模和模拟环境中可支持超强

    6、的可扩展性与超高的输入/输出(I/O)吞吐量。凭借其可扩展性和高可靠性设计,可满足当前及未来的性能和增长需求。图1说明了典型Lustre工作流的各个阶段。图1)典型Lustre工作流。我入管理生成F处理F传输NetAppLustreHPC解决方案基于E系列平台,它是针对可扩展、可靠且高性能计算需求而构建的,可支持超强的I/O性能和大规模文件系统容量。政府、大学、研究机构和企业组织都会发现,NetAppLustreHPC解决方案能够应对重大业务挑战,可支持数万个Lustre客户端以每秒数千GB的I/O吞吐量访问数百个PB存储。架构和组件NetAppLustreHPC解决方案由E系列存储以及适用于

    7、对象存储目标(OST)与元数据目标(MDT)的Lustre全局并行文件系统组成。NetApp专业服务和SupportEdge是必备的解决方案组成要素。NetAppLustreHPC解决方案包括以下组件,如表1所示。表I)NetAPPLUStreHPC解决方案组件列表,组件兑明硬件提供商对象存储服务器(OSS)OSS可为客户端提供文件I/O服务,并管理OST上的数据。OSS通常采用光纤通道(FC)或InfiniBand(IB)协议直接连接到基于E系列的OST。Linux服务器(在高可用性HA模式下为两台)集成商或客户对象存储目标(OST)OST是一个Lustre逻辑单元号(LUN),位于基于E5

    8、460或E5424的存储设备上,可提供Lustre对象存储空间。NetAppE5460和E5424NetApp对象存储可扩展单元(OSSU)OSSU是一个可扩展组件,该组件包括由OSS以及相关OST组成的HA对。NetAppE5460/E5424与OSSNetApp与集成商或客户元数据服务器(MDS)MDS可为客户端提供元数据服务。MDS可使用SAS协议连接到元数据存储。Linux服务器(在高可用性HA模式下为两台)集成商或客户元数据目标(MDT)MDT是用于保存文件系统元数据的存储。元数据存储与应用程序或用户存储是分离的。MDT通常使用SAS连接到MDS0NetAppE2624NetApp管

    9、理服务器(MGS)MGS用于管理文件系统配置。Linux服务器集成商或客户Lustre客户端这些客户端将运行通过网络连接到Lustre客户端网络结构的应用程序,它们是Lustre应用程序的计算或I/O节点。Linux服务器集成商或客户Lustre客户端网络结构旧、以太网(或其他集群网络结构)以及相应的布线,用于在Lustre客户端与OSS服务器之间提供I/O访问功能。IB网络或以太网等集成商或客户第二层和第三层存储用于将数据归档到磁盘或磁带的其他可选方法。近线(NL)磁盘存储和(或)磁带库归档集成商或客户有关详细信息,请参阅NetAPPE5400存储系统数据表。图2简要描绘了使用旧LUStre

    10、客户端网络结构的计算和可视化环境中的NetAppLustreHPC解决方案。图2)典型Lustre架构。1.ustreLAN客户谪超级计Jl机1.uttre相田器LNETHAflK务我员核It援对象存储外敏存IM器器(OSSNetAPPE5460阵列NetApPE2624元效据存M阵列1.ustreIB客户S像群1.ustre元敷据疆务H40Gb朦IB对象存锭可旷展单元(OSs对象存情相势器(OSS)NeSppE5460阵列通过旧SkFCE系列架构NetAppLustreHPC解决方案包括E5460和(或)E5424E系列存储系统。这些存储系统在可容纳60个驱动器的DE66004U架或可容纳2

    11、4个驱动器的DE56002U架中放置两个E5400RAID控制器。每个架均可使用NL-SAS.SAS或固态驱动器(SSD)来填充。E5460和E5424是第五代存储阵列,采用机械工程设计专利技术,可提供密集、可扩展且高度可靠的带宽和容量.二磁盘控制器固件可支持高带宽、大型块流和小型块随机I/O的最佳组合。基础E5460或E5424可通过添加一个或多个相对应的DE6600或DE5600扩展机箱进行扩展。DE6600和DE5600是磁盘扩展机箱或扩展架,可放置磁盘,但不能放置RAID控制器。它们通过线缆连接到E5460或E5424,可在基础单元中的RAID控制器背后提供扩展存储。因此,NetApp

    12、LustreHPC解决方案的架构可以设计为能单独扩展容量和带宽,从而更好地满足客户需求。该解决方案还使用E2624来存储Lustre文件系统元数据。E2624具有DE5600架,但使用E2600RAID控制器,而不是E5400o表2列出了NetAppLustreHPC解决方案的E系列扩展选件的参考标准。表2)NetAppLustreHPC解决方案的E系列扩展参考标准。I类别IE5460E5424IE2624外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224控制器架111最大扩展架数570*磁盘架总数681k系列柱制器飞期演器驱沿器大小原宿容蜃珞式化后

    13、的容量I(RAID10),te文件甯构24|600GB14.4TBI6.0TB1JXITJ7C.E匕&1性能【每秒操蚱数):;数千个客户端通过其单一文件系统命名空间派片工用BarWU大加不山3l4-2XArfK6,000至23,000翅管理仲2服务RSk作为连接到OSS一的卡添期未储1lUN提供10,00089,000N胱醐)SSU可将两个C)SS及其关联的E系歹历收载作硒D系统(以及相应的C)ST)组合成一个 修用十扩展LuSire文件系统的性能、容噂轴蔓版OoO)SSU设计相当于为单个E系列存储系统甑置一对-OSS这种设计可提供基本的HA功能,并能 懈鲤生可能会影响Lustre用户数据访问

    14、的OSS,故障至S则设计可防止在一个C)SS发生故障时对数据的访问。每个OSSU都是一个独支w ,由一拙宜太的CGGIl旦Je再列控制器架扩展架 膜或器I撑制器权和控制权 有-学卑微IM以最隹鬻茶胫吞吐量、容量变X采用这种方 前CbSS控制槎J 5424 或 5460Lustreo: 60/90:斤用格任让后的:TB)AAQ 6 (82;OSSU共享存储连接或性完。pletA*fPd解决方案配置最电实践将或其关联的9S=伞qssu7W 需要ffQ9ssu1度配甑例602/3 TB120/18087.3/130.9ESMDE6600602/3 TB120/18087.3/130.9E5400E5

    15、42424600 GB/900 GB14.4/21.58.7/13.1ESMDE560024600 GB/900 GB14.4/21.58.7/13.1:腑OSSU来扩展LlJSt钞哪察统,牌而提高总楸能加容量。青却褪示了卜e佛那建议的HA DSSU 架构。(半填充)E5400 NetA)P其南e(辎毯S梨决案:解决方案指南的 E5460ESMDE6600 架60个(每个阵列最多总共360 个)3005个(每个阵列最多总共6个架)5阵列型号驱动器数量RAID格式域1:最大域1:控制器架域2:最大域2:控制器架流数性能(GB/秒)流数性能(GB/秒)E546030RAID6(8+2)501.25

    16、1,5000.6E546060至360RAID6(8+2)1002.53,0001.2E542424RAID6(8+2)501.31,0000.6E542448至192RAID6(8+2)1002.62,0001.2E系列控制器控制器架扩展架;驱动器数上限支持的扩展架数上限这些OSSU可通过从OSS到Lustre客户端网络结构的连接来连接到整个Lustre文件系统,从而极大地简化Lustre的横向扩展和整体设计。只需通过一个文件系统命名空间在客户端网络结构上增加OSSU的数量,即可横向扩展该文件系统。NetAppLustreHPC解决方案确定了每种OSSU设计的性能和容量特征。在设计特定于客户

    17、的Lustre文件系统时,会根据单个OSSU的特征值,使用适当数量的OSSU进行扩展,以达到总体性能和容量标准。MDS可管理Lustre元数据,并将这些数据存储到MDT中。一个MDS可为文件系统中的一组OSSU提供Lustre客户端的文件布局映射。另一个MDS可提供高可用性,建议在所有配置中使用。结论NetAppLustreHPC解决方案是为需求量最高的计算和可视化处理工作负载进行设计和优化的。这一预先配置且经过预先测试的解决方案旨在支持大量用户处理大量数据所需要的高带宽。通过以更高的速度来处理数据,组织可以更有力地支持技术和业务计算建模和模拟: 高带宽支持可在一个4U机架单元中提供高达3.5

    18、GB/秒的带宽。 模块化设计能够利用最少的组件来实现扩展,从而避免了超配。 高密度可在每个行业标准40U机架中支持多达1.8PB的存储容量。经济高效的扩展能力可在同一个容器中单独扩展带宽和容量。可从小型部署开始,然后随着需求的变化以2U或4U为增量逐步扩展。2解决方案概述2.1 NetAppLustreHPC解决方案规模估算注意事项概述规模估算是构建NetAppLustreHPC解决方案的一个关键环节。首先,它需要能够达到特定的容量和吞吐量目标。要恰当估算Lustre文件系统的规模,请务必收集尽可能多的信息和需求。这些信息和需求分为以下几类: 基础架构环境、用户群、应用程序和工作流 用户及其应

    19、用程序所需的应用程序数据存储容量 应用程序环境所需的总体吞吐性能,以及并发顺序I/O流数量的估计值 未来数据存储和性能的增长因素工作流需求在NetAppLustreHPC解决方案环境中,具有许多应用程序类型、使用情形以及所产生的I/O模式。出于规模估算的目的,已对与大多数HPC环境相关的并行I/O特征进行了一些简单假设。一般来说,当集群中的客户端从Lustre文件系统执行大量的并行顺序文件读写请求时,需要的吞吐性能最高。这些顺序文件读写请求称为流。对于NetAppLustreHPC解决方案中的存储元素而言,这种应用程序I/O通常表现为遍布在存储系统中的大量均匀分布的并发顺序读写流。为了确定I/

    20、O大小不同的大量并发顺序I/O读写流的吞吐性能特征,已在相似测试条件下对NetAppLustreHPC解决方案进行了衡量。容量要求无论是使用现有应用程序还是部署新应用程序,都需要确定文件系统所需的存储容量。存储容量通常以TB为单位来指定。此外,还需要考虑用户数和正在使用的文件总数。性能要求性能通常指定为高峰期所需的总存储吞吐量。无论是新应用程序环境,还是现有应用程序环境,这一指标均以所有应用程序的预计数据访问速率(GB/秒)来衡量。此外,为达到总吞吐量而执行的并发流数对性能也同样重要。因此,需要在规模估算计算中同时使用总吞吐量和流数。此外,还需要注意相对于总吞吐量所需读写量的百分比。但是,目前

    21、的规模估算仅计算读写流总共所需的吞吐量.二此外,还对以下操作确定了元数据性能特征: 每秒创建和删除的文件数 每秒创建和删除的目录数 每秒统计信息数(例如,Linux中的IS命令等操作)元数据性能不受E系列存储阵列性能的限制,而主要由所选的MDS以及Lustre架构来决定。1.ustre存储容量需求估算计算对于Lustre文件系统,应执行两种容量估算计算: 用作OST的存储 用作MDT的存储OST存储容量需求由客户根据其特定环境来指定。MDT存储容量需求由客户在Lustre文件系统中需要的文件总数决定。注:在本文档中,Lustre存储需求是以单个Lustre文件系统来计算的。1.ustre元数据

    22、对于用作LustreMDT的E系列存储,NetApp建议使用E2624,该存储已进行配置,可提供最高的元数据性能,并满足容量需求。具有高达24个600GB硬盘驱动器(HDD)的一个E2624架可提供足够的容量来支持PB级文件系统(取决于平均文件大小),并满足存储性能需求,这样,元数据性能将受MDS硬件性能(而不是E系列存储性能)的限制。计算元数据存储需求计算MDT规模时,需要考虑的一个重要因素是要在文件系统中存储的文件数。该数量决定了所需的索引节点数,而索引节点数又对MDT规模估算起着决定作用。Lustre元数据所需的连接存储通常是文件系统容量的1%到2%,具体取决于文件大小。假设每个索引节点

    23、的默认Lustre值为4KB,则MDT存储容量需求将按如下方式进行计算: 所需容量=文件系统中的文件总数X每个索引节点4KB如果不知道文件总数,可以通过使用文件系统总容量除以平均文件大小来估计该数量。例如,如果平均文件大小为5MB,并且可用OST空间为500TB1则估计的最多文件数(以及最少索引节点数)可按如下方式进行计算: (500TBX1024GB/TBx1024MB/GB)/每个索引节点5MB=1.049亿个索引节点NetApp建议使用的索引节点数至少为最小值的两倍,以支持未来扩展以及比预期值更小的平均文件大小的情况。因此,所需空间为: 每个索引节点4KBX2.098亿个索引节点=839

    24、2GB如果平均文件大小很小(例如,4KB),则Lustre的效率不会很高,因为MDT会尽可能使用与OST一样的空间,但该配置对于Lustre并不常见。此外,如果MDT过小,则可能会使OST上的空间无法使用或无法访问。在对文件系统进行格式化之前,请务必确定支持该文件系统所需的适当MDT大小。在对文件系统进行格式化之后再增加索引节点数将非常困难。具有24个600GBHDD的E2624是NetAppLustreHPC解决方案所支持的默认元数据存储器。最佳实践对于这种元数据阵列的RAID配置.请使用RAID10(11+11)驱动器(区块大小为128KB)以及两个热备用驱动器。表3指定了采用这种配置时

    25、E2624的最大容量。表3)驱动器大小和容量“外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224建以日勺配直足,在L控带唠篦2个,其中,由JStretZNb/4MDI中具自尹RAIDlO的开销,508RjI热田用驱动器Oa5W小为可用容量。可以使用配直入打uJ用驱动数限獭24个驱动器来提供最大何用仝词IIgtra6仕冬办曷纪但不云添加数据保护功能5HTid7个十件过07相当干40夕个索弓I节点0*.因此要部署招大视遥磁罐晶数文件系统,可IS需要添加更多的DE56)6磁盘扩展架,才能提5上所需的索引节点数。利兀烈循服充而运以类别E5460E5424E2

    26、624控制器架驱动器驱动器大小原始容量E系列格式化后的容量(RAID10)生的影响。.便用豉B町UHUo出十为较快风口以坂邮庠即1减少大量各尸肺锁除是使用火簟谶较慢的技思喔一点也很有礼还建议对操作系统(OS)使用专用系号,性能:空秒燥作数)与E系列存储上的Lustre曾算健(MDT)分离开来。6,000至23,000居服务器内存需求10,000至89,000R哂暴解需求可能取决于多个因素.例如.客户R遨帚量懿出、服务器上的元数据负载等。懒定客户端的文件元数据以及所需要的濡肾f瓣酶性而有所差异。有时,一个客户端可能拥有.MDS内存I包括LUStre分布式锁定管理器(DlJV的H作集中使用.的义件

    27、数。可用内存的锁定数会根据服务器上的负载和3WS畲喔忐的锁定。每个文件大约使用2KB|_辍定取.当输所用文件的内核数据结构。与从磁盘1融胸据相比,缓存文件数据可将元数据性能提筋如霸或腼,,默认情况下,文件系统日志将使井5变9牛系统趣理的RAM数抿量但的可用RAM.则往往很D需要使用磁盘Io来检索亓数抿ES网络传输工作流还会使用喈6眈P或柒用收发缓须予以考虑(半填充)需求也必驱动器大小RAID原始(TB)I格式化后的(TB)IRAID6(8+2)既支持文件累经兜数据工作流毁型皆不能.哪馥输支件系统元;银牌他网络协谀相笑联的三梆两仲卢这一内存E5喇情强5侮个LUStre文件(1由、上使用同等卷T-

    28、RTOd三fs)系统的佃店大小为4001MB18对于每帮或偿菸统,会在内存量必嗡彝与主MDS87.3/130.9例可IEl62G驱动器数最RAiD格式i域1:最大I1流数:51,5000.6|域2:控制架i性能(G&秒)J4IIJI三JLCJOB3副48GEfig:盅粮多。1.2JJyIDJiJ-,,E546060至360RAID6(8+2)1002.53,0001.2E542424RAID6(8+2)501.31,0000.61t5424Nel叨举磐觥*抗用瞰唠+缪决万物萨2.62,0001.2魄蹴雇性翦以谶擀统卫难曾的应用程序R蝴GB/900GB14.4/21.58.7/13.1扩展架支持

    29、的扩展架数上限驱动器数上限E系列控制器架控制器荐鳏LUSMe文件系统铝嬖的内存,存。这样就余领纳需要若干分GB的E5做的底ES需要的底估计元数据性能在NetAppLustreHPC解决方案中,MDT存储将使用具有24个HDD的单架E2624o通过这种配置以及适当的设置,元数据性能就会受所选MGS服务器的限制,而不是E2624存储性能的限制。出于规模估算的目的,唯一需要的变化因素就是存储容量,因为性能不是一个影响因素。我们已经在建议的配置(这种配置旨在实现区块大小为128KB的RAID1011+11的MDT性能)中对元数据性能进行了测试,该测试采用内存为48GB的双插槽Westmere类服务器作

    30、为MDS1并采用具有24个2.5英寸SAS600GB10KRPMHDD的E2624o表4列出了在这种配置中可能执行的元数据操作的典型性能范围。表4)元数据性能。I类别IE5460IE5424IE2624外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224控制器架111最大扩展架数570*磁盘架总数681E系列控制器架驱动器驱动器大小原始容量格式化后的容量(RAID10)嗡网这些因素会使操作I性能(每秒操作数)l-u裂I寇XJ豕1于134里为IKtraCST需求牯笆E祭万Il存储的初境曾拿要土手懿胃知出能妆两丽要吐出干OST的目的,7建盛福两个平台:一1

    31、0,000至89,000,目聂施3.5英寸7.2KRPMHDD的E54603,700至12,000,恳益2.5英寸IOKRPMHDD的E5424启崎跣设客户已经选择要采用的基本驱动器技术建07.2KRPM或2.5英寸SASlOKIE系列控制器架检制器扩展架驱动器要在这些驱动器类型之间进行权衡取舍驱动器大小RAID、每个磁盘的容量、性能和原始(TB)格式化后的(TB)RD6(82)-国怪熊所需电搬!器架数来计算容量。帮果该容彘楞满足总体需求60映添加股翔g屐架来横向扩展到所需的麟填充)疑还会假设向文件率睢就Ts播PS口印制卖麒璃Ir尽管阂易琳尹丽来说潘露是合理的,但是,在海外箱S和OST之后,句

    32、髭会有许多可期导致客户端旅务善秦群无法实现00%的线性性能扩展J芭些礴苞括客户端集群RI络设计和性能,:工件和工作负俄在这些QSS和(旧的0中的分在5械及用于确定应用程用如何执行IC鹤石讲行文件系殿豳的不闫的淘13体或档不会1寸龙上述何笈K但计划将术作为该解决万案的,I主题加以讨陀。ESMDE6600602/3TB120/18087.3/130.9E5400E542424600GB/900GB14.4/21.58.7/13.1ESMDE560024600GB/900GB14.4/21.58.7/13.1阵列驱动器RAID格式域1:最大域1:控制器架域2:最大域2:控制器架型号数量流数性能(GB

    33、/秒)流数性能(GB/秒)E546030RAID6(8+2)501.251,5000.6E546060至360RAID6(8+2)1002.53,0001.2E54242Nm24XPPLustre高悴SRAID6(8+2)汽+比铤决方星:破决50片家有南1.31,0000.6E542448至192RAID6(8+2)1002.62,0001.2E系列控制器架扩展杂I驱动器数上限支持的扩展架数上限对象存储服务器建议OSS可使用任何现代的X86_64CPUo为了获得最高性能,应使用尽可能多的RAM。考虑到每个OSS可能会映射多个OST,因此,每个OST都需要文件系统日志空间,每个I/O线程都需要内

    34、存,连接的每个OST都需要OST缓存。此外,对于OSS读取缓存,还会使用备用内存。一般来说,OSSRAM需求高于MDS需求,尽管使用的CPU可能并不那么重要。系统的操作系统还应驻留在物理上与用于OST的E系列存储不同的分区上。最佳实践NetApp建议对操作系统使用专用系统磁盘(RAlDI或10),将其与E系列存储上的Lustre文件系统OST分离开来。对象存储性能估算存储性能需求估算包括两部分: 整个Lustre文件系统所需的总存储I/O带宽或吞吐量(通常以GB/秒来表示) 整个文件系统的所有客户端达到所需总聚合吞吐量的最大并发I/O流数我们设计的测试方案旨在确定NetAppLustreHPC

    35、解决方案的存储性能特征,并制定要在规模估算计算中使用的代表客户使用情形和环境的指标,NetAppLustreHPC解决方案的大多数客户环境都具有存储工作负载,其中包括并发文件读写流,这些读写流的总量决定了所需的系统吞吐量。该测试通过大量的并发I/O流和I/O大小来生成综合工作负载,并以此模拟HPC环境。在这项测试中,我们为规模估算确定了两个工作域,并制定了相关的指标。在第一个工作域(域1)中,测试发现,对于小型或中型规模的并发流,E系列控制器会达到最大饱和性能。对于需要最高性能的环境来说,这是首选工作域。要使该域达到这一性能指标,需要将应用程序工作负载所运行的并发流数量限制在所支持的上限以下。

    36、随着并发流数量的增加,这些流将出现混合,并为存储提供随机性更强的I/O工作负载(相比于顺序I/O工作负载而言)。在域1中,LustreOSS和E系列控制器可处理混合的并发I/O流,同时仍可达到控制器的饱和吞吐量。如果超出域1的流数量上限,则I/O随机性将导致性能受驱动器限制。这是域2的性能指标,该指标适用于需要大量并发I/O流的工作负载。此时,性能估算将由所需的总聚合吞吐量以及在这一吞吐量下的并发I/O流总数决定。这两个值所产生的工作特征可以在域1或域2得以更好地满足。根据所需的并发流总数,域1(流数量中等)或域2(流数量较多)将产生最佳的控制器架数。这两个域的规模估算将按以下方式进行计算:

    37、输入:控制器架类型为E5460或E54240口最大吞吐量是指所需的总吞吐量(以GB/秒来表示)。口最大流数是指达到总吞吐量时的并发I/O流总数。输出:口类型为E5460或E5424的所需控制器架数达到所需性能的最低驱动器和架需求计算:口所需控制器架总数=域1控制器架数或域2控制器架数域1控制器架数=最大吞吐量/(此阵列类型的域1控制器架性能)或最大流数/(域1最大流数)(以两数中较大者为准)域2控制器架数=最大吞吐量/(此阵列类型的域2控制器架性能)或最大流数/(域2最大流数)(以两数中较大者为准)表5显示了域1(流数量中等)和域2(流数量较多)的性能估算指标。:驱动器加驱动器架容有DE660

    38、030(半填充)表5)域1和域2的性能指标。|类别IE5460IE5424IE2624外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224控制器架111最大扩展架数570*磁盘架总数681h系歹蟀制器架驱动翡驱动器大小原始将想,格式化后的容量;I(RAIDIO)I皿而E2600E262424600GB14.4TB6.0TBW刍后依l5土笛片弋种.估算完成后,可计算出容量,并将其与总容量!性能(每秒操作数)!荷需要的额外容量添加更多的扩展架以及1区助魏至23,000目录统计10,000至89,000同翻除建议采用本文档中所述的配置:区块大小疗用噪知1符笔

    39、AID6(8+2),所获得的RAID条;那阻递1MB。这种配置最适合Lustre文件系1MRRd,任能层件不0而劫版才契括去村耳F鬼9鼠以免晚文件系统在SCSl块级I/O大小5460t=jE5&24存储冲利NetAnn者R建IV平田汽酬翰计3,800至81,0001品&手%通过半填充的驱动器架(30个驱动器)或翻痛艇麻架(60个驱动器)支持三个或六QRA曙仰2E雕图J支控联器架6(8+2)卷%总共204迤动器大小原始(TB)I格式化后的(TB)寺两个RAIDjRAIi:1RAI02技6列出了唱嬲扩用各解癖不:架进行扩展E1驱动器架选1寸聒配置相同,牛的容量大小2/3TB60/9043.7/65

    40、52/3TB60/9043.7/65.5E5400E5460602/3TB120/18087.3/130.9ESMDE6600602/3TB120/18087.3/130.9E5400E542424600GB/900GB14.4/21.58.7/13.1ESMDE560024600GB/900GB14.4/21.58.7/13.1阵列型号RAID格式大最1数域流域1:控制器架性能(GB/秒)大最2数域流域2:控制器架性能(GB/秒)E5460RAID6(8+2)501.251,5000.6E546060至360RAID6(8+2)1002.53,0001.2E542424RAID6(8+2)

    41、501.31,0000.6WiF用甯了两个BAID6(8+2)卷纲Cn这样畲号可用驱动器数限制为。明叫可用容智,其余四个马筠罂可用作折备用驱动器.E系列控制器架扩展架驱动器数上限支持的扩展架数上限控制器E5400具有CE6600架的E546060个(每个阵列最多总共360个)5个(每个阵列最多总共6个架)tSMNetAJPLustre高性能计算解决:宁耻蝴喋南3005E5400具有CE5600架24个(每个阵列最多总共7个(每个阵列最多总共配置扩展架(DE6600和DE5600)时,为了不超过所允许的相应控制器限制,请务必遵循每个阵列的驱动器数上限。表7列出了每个架的最大驱动器容量。表7)每个

    42、架的最大驱动器容量”类别IE5460IE5424IE2624外形规格4U/60个驱动器2U/24个驱动器2U/24个驱动器最大磁盘驱动器数36019224控制器架111最大扩展架数570*磁盘架总数681E系列控制器架驱动器驱动器大小原始容量格式化后的容量(RAID10)E2600E262424600GB14.4TB6.0TB操作I性能(每秒操作数)7睇鹿樨使用扩展架(DE6600和DE5600),但翻尊循用豌贝卯即驱动器数上限不能超过每个控制,送黜1限制。但是,NetAPP通常并不建议在翻熊褪褊馨睛撼魁黑$喉鹦W瓯旎能因为该解决方案倾向于对称设计。在任何T既褊誉”规模怙算和性能标准。3,700至12,000UI移装驱动器数需求L限超过控制器架的限制%蕊望需需的容量需衣必须配置额外的匚Sil通过性能估算而得的容量,则为了达到川如表7所示。熔量,可以添加额外的驱动器架和驱动器F展5,600至21,000k系列控制器分S益利展步展架夏前燃s牲能,并在OWS和整个文孑|,样式伐扁的:冏国D6总容量,必so忌N,坦,襦舞阵列所包台田的扩展架数与对称扩展架的UbI应晶达到上悌的控制器架r:零磨类型和谷冷:,喉物


    注意事项

    本文(技术报告NetApp Lustre 高性能计算解决方案.docx)为本站会员(peixunshi0)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!




    宁ICP备18001539号-1

    三一文库
    收起
    展开