高性能计算机体系结构 小论文.doc
《高性能计算机体系结构 小论文.doc》由会员分享,可在线阅读,更多相关《高性能计算机体系结构 小论文.doc(7页珍藏版)》请在三一文库上搜索。
1、高性能计算机体系结构技术分析高性能计算机体系结构技术分析摘 要:本文简单介绍了高性能计算机在科技、工业等众多领域的广泛应用,结合TOP500的最新排名,简单概括了当今比较流行的几大体系结构技术,初步了解HPC的发展状况,尝试性地说明高性能计算机的发展方向。关键词:高性能计算机;体系结构;ISC;TOP500; SMP;MPP;cluster一、研究背景1.1基本概念高性能计算机,(HPC:High Performance Computer)传统上指的是运行速度非常快的计算机,等同于超级计算机,致力于专业用户进行大规模科学和工程计算,追求的性能指标是浮点计算能力。随着对于高性能计算的应用需求由C
2、PU运算密集型的科学和工程计算拓展到IO处理密集型的商业事务处理,高性能计算机从单纯追求CPU 运算能力变为追求包括 IO 处理能力在内的综合性能指标,而且随着用户群体的扩大、对价格的日趋敏感以及PC 服务器和互连网络等技术的成熟,高性能计算机已经倾向走产业化发展道路,采用开放的软硬件技术。当前,以机群为载体的高性能计算机已广泛应用于教育、游戏、气象、石油、航空航天、金融、生物、制造、信息建设等各个领域。 1.2发展历程 (1)专用时代包括向量机,MPP系统,SGI NUMA 系统,SUN大型SMP系统,也包括我国的神威,银河,曙光1000等。之所以称为“专用”,并不是说它们只能运行某种应用,
3、是指它们的组成部件是专门设计的,它们的CPU板,内存板,I/O板,操作系统,甚至I/O系统,都是不能在其它系统中使用的。由于技术上桌面系统与高端系统的巨大差异,和用户群窄小。(2)普及时代高性能计算机价格下降,应用门槛降低,应用开始普及。两个技术趋势起到重要作用商品化趋势使得大量生产的商品部件接近了高性能计算机专有部件标准化趋势使得这些部件之间能够集成一个系统中,其中X86处理器、以太网、内存部件、Linux都起到决定性作用。机群系统是高性能计算机的一种,它的技术基础和工业基础都是商品化和标准化。1.3高性能计算机系统架构 Constellation 星群 PVP Parallel Vecto
4、r Processors 并行向量机系统SMP Symmetric Multiple Processor 对称多处理器DSM (NUMA) 分布共享存储 非一致性访问分布共享存储MPP Massively Parallel Processor 大规模并行处理机COW cluster of workstations 工作站集群 1.4高性能计算机分类现代高性能计算机都属于MIMD(多指令多数据流)。MIMD从结构上和访存方式上,又可以分为:结构模型:PVP, SMP, MPP, DSM, COW访存模型:UMA, NUMA, COMA, CC-NUMA, NORMA 2003-2011年计算机系
5、统结构TOP500分布和性能表现分布二、几大主流技术分析2.1对称多处理SMP技术对称多处理(symmetrical multiprocessing,SMP)技术是相对非对称多处理技术而言的、应用十分广泛的并行技术在这种架构中,多个处理器运行操作系统的单一复本,并共享内存和一台计算机的其它资源SMP系统采用商品化的处理器,这些处理器通过总线或交叉开关连接到共享存储器。所有的处理器都可以平等地访问内存、I0和外部中断系统资源被系统中所有CPU共享,工作负载能够均匀地分配到所有可用的处理器之上目前,大多数SMP系统的CPU是通过共享系统总线来存取数据,实现对称多处理的在SMP系统中增加更多处理器的
6、两个主要问题是系统不得不消耗资源来支持处理器抢占内存,以及内存同步。对称式共享存储:任意处理器可直接访问任意内存地址。且访问延迟、带宽、机率都是等价的,系统是对称的。微处理器: 一般少于64个; 处理器不能太多, 总线和交叉开关的一旦做成难于扩展;应用实例: IBM R50, SGI Power Challenge, SUN Enterprise, 曙光一号。2.2 非一致访问分布共享存储NUMA技术在非一致访问分布共享存储技术(non uniformmemory access,NUMA)体系结构中,每个处理器与本地存储器和高速缓存相连,多个处理器通过处理器、存储器互联网络相连处理器还通过处理
7、器、IO网络访问共享的IO和外围设备至于处理器之间的通信则通过可选的处理器之间的通信网络来实现NMUA技术在科学与工程计算领域具有不可替代的地位,在联机事务处理(OLTP)、决策支持服务(DSS)和Intranet以及Internet中的地位也越来越重要目前,NUMA并行机的处理器数目可达到512个,且带宽可随处理器数目基本上呈线性扩展这样大的处理器数,使单一系统映像的NUMA机足以覆盖绝大多数的应用首先,由于它具有与SMP相同的编程模式,因此在科学与工程计算领域具有不可替代的地位;其次,由于它具有共享内存和良好的可扩展性优势,可以适应企业数据中心的多种应用NUMA系统能够运行世界上一些最大的
8、UNIX数据库应用,而且正被广泛接受为电子商务的主流技术,包括处理功能强大、IO的大规模可扩展性、高可用性、工作负荷和资源管理的广泛灵活性,而且无需改变SMP编程模型等优越技术分布共享存储: 内存模块物理上局部于各个处理器内部,但逻辑上(用户)是共享存储的。这种结构也称为基于Cache目录的非一致内存访问(CC-NUMA)结构,局部与远程内存访问的延迟和带宽不一致。与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形成一个共享的存储器;微处理器: 16-128个,几百到千亿次。应用实例: SGI Origin 2000, Cray T3D。2.3 MPP技术MPP模式则是一种分布
9、式存储器模式,能够将更多的处理器纳入一个系统的存储器。一个分布式存储器模式具有多个节点,每个节点都有自己的存储器,可以配置为SMP模式,也可以配置为非SMP模式。单个的节点相互连接起来就形成了一个总系统。MPP体系结构对硬件开发商颇具吸引力,因为它们出现的问题比较容易解决,开发成本比较低。由于没有硬件支持共享内存或高速缓存一致性的问题,所以比较容易实现大量处理器的连接。单一SMP模式与MPP模式的关键区别在于,在SMP模式中,数据一致性是由硬件专门管理的,这样做比较容易实现,但成本较高;在MPP模式中,节点之间的一致性是由软件来管理,因此,它的速度相对较慢,但成本却低得多。物理和逻辑上均是分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高性能计算机体系结构 小论文 性能 计算机体系结构 论文
链接地址:https://www.31doc.com/p-2080410.html