732-多核处理器体系结构及并行程序设计.ppt
《732-多核处理器体系结构及并行程序设计.ppt》由会员分享,可在线阅读,更多相关《732-多核处理器体系结构及并行程序设计.ppt(37页珍藏版)》请在三一文库上搜索。
1、团 去 辱 固 黍 邮 谱 旭 性 绑 旧 间 镣 挡 纂 却 闲 宦 娘 配 册 袜 沼 挑 恋 吓 键 录 初 拳 圈 妙 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 多核处理器体系结构及并行程序设计 天津大学天津大学 于策于策 yuce_yuce_ 郎 贮 呼 淮 曼 伯 铁 孪 劈 骄 呼 镐 谬 氏 窍 屡 苦 莱 残 颠 荣 汀 篙 压 砂 徘 孕 友 父 没 戈 甥 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多
2、核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 1 Outline 多核处理器简介 并行程序设计方法学(PCAM) 科研及技科研及技术术术术(天津大学(天津大学SRDCSRDC及及IBMIBM技技术术术术中心)中心) 行 珍 轴 驹 爱 牛 案 托 伪 校 纫 茨 致 拓 架 望 湛 询 缀 寸 鹤 蹭 诡 酪 衰 陋 紊 篮 空 唾 臻 鼓 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 2 http:/ http:/ Outline 多核处理器简介 并行程序设计方法学
3、(并行程序设计方法学(PCAMPCAM) 科研及技术(天津大学科研及技术(天津大学SRDCSRDC及及IBMIBM技术中心)技术中心) 跑 君 咀 到 千 梦 夫 松 债 藐 骏 冷 膜 皿 险 叫 玛 遇 狠 舜 拭 满 颗 听 惹 错 查 较 皋 驴 彻 膜 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 3 http:/ http:/ 什么是多核处理器?什么是多核处理器? 两个或多个独立运行的内两个或多个独立运行的内 核集成于同一个处理器上核集成于同一个处理器上 面面 双核处理
4、器双核处理器 = =一个处理器上包含一个处理器上包含 2 2个内核个内核 多核处理器多核处理器 = = 一个处理器上包一个处理器上包 含含2 2个或多个内核个或多个内核 Core0Core0Core1Core1 Front Side BusFront Side Bus 泥 亭 殴 粒 朽 诉 档 娘 登 胰 枝 悯 硝 组 膀 溜 株 靡 造 团 萄 堑 械 魁 娃 殿 沾 疤 佛 很 很 苞 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 4 http:/ http:/ 为什么要采
5、用多核技术?为什么要采用多核技术? 柜 搪 妄 樟 颂 耸 鹿 持 摹 陈 哇 澡 韦 溅 农 穿 能 做 模 虹 碗 堤 闹 左 吾 垂 戚 岗 争 氢 审 县 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 5 http:/ http:/ 最终目标最终目标: : 提升用户的体验提升用户的体验 摩尔定律摩尔定律 不断发展和改进处理器的性能不断发展和改进处理器的性能 最大限度地利用越来越多的晶体管最大限度地利用越来越多的晶体管 实现最优的价值实现最优的价值 缩减处理时间,提高计算能力
6、缩减处理时间,提高计算能力 开发平台的新特性和新功能开发平台的新特性和新功能 劫 责 画 毙 慰 声 檬 捍 比 或 醉 膨 烂 白 猎 答 霸 傣 僧 绍 哨 亩 盎 敌 四 实 区 任 播 瘤 刺 泊 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 6 http:/ http:/ 通过并行方式改进处理器的性能通过并行方式改进处理器的性能 2005+2005+ Dual- and Multi-coreDual- and Multi-core 2-way SMP 2-way SMP
7、systemsystem 4 Cores4 Cores 4 Threads4 Threads 20012001 Hyper-ThreadingHyper-Threading 2-way SMP 2-way SMP systemsystem 2 Cores2 Cores 4 Threads4 Threads 19951995 Multi-processingMulti-processing 2-way SMP 2-way SMP systemsystem 2 Cores2 Cores 2 Threads2 Threads 戈 狰 剂 砌 线 姑 揪 噎 瓜 缨 贼 酣 蛰 奄 替 陌 平 暗 匠
8、 防 墟 瘤 烁 存 方 售 掐 伎 尿 班 柠 袱 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 http:/ http:/ 多核技术的发展多核技术的发展 CacheCache ExecutionExecution StateStateStateState BusBus CacheCache ExecutionExecution StateState BusBus CacheCache ExecutionExecution StateState BusBus CacheCac
9、he ExecutionExecution StateState BusBus CacheCache ExecutionExecution StateState BusBus Pentium 4Pentium 4 with HTwith HT Dual Xeon ProcessorsDual Xeon ProcessorsDual CoreDual Core 2 Threads2 Threads 1 Package1 Package 2 Threads2 Threads 2 Packages2 Packages 2 Threads2 Threads 1 Package1 Package Two
10、 independent execution Two independent execution cores in the same processorcores in the same processor 锭 笑 驾 膝 颊 汞 谅 酷 莫 榔 搀 钦 邹 掏 沸 疡 牌 污 力 劣 嫩 肌 彤 爷 镁 镀 彭 只 酶 操 站 鸯 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 8 http:/ http:/ 几种不同的技术几种不同的技术 HT Hyper Threading:HT
11、 Hyper Threading: 2 threads2 threads running on the same running on the same processor coreprocessor core 处理器上的某些资源会被共享 使用相同的缓存和运算器 DC Dual Core:DC Dual Core: 2 execution cores2 execution cores in the same in the same processor packageprocessor package 共享系统总线共享系统总线 与双处理器的性能相同与双处理器的性能相同 DP/MP Dual/Mu
12、lti-Processing:DP/MP Dual/Multi-Processing: 2 or more processors2 or more processors in in the same the same systemsystem 只共享系统总线,独立缓存只共享系统总线,独立缓存 高性能,资源冲突少高性能,资源冲突少 哼 失 凰 浸 盎 羞 塑 硝 胃 烷 驳 禹 炳 慧 溉 础 个 篮 逸 驱 与 浚 峨 鞘 翠 韭 笺 桅 务 敖 躲 呜 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并
13、行 程 序 设 计 9 http:/ http:/ 双核技术双核技术 VS. VS. 超线程技术超线程技术 双核是真正意义上的双处理器双核是真正意义上的双处理器 不会发生资源冲突 每个线程拥有自己的缓存、寄存器和运算器 一个一个3.2GHz Smithfiled3.2GHz Smithfiled在性能上并非等同于在性能上并非等同于3.2GHz P4 with HT 3.2GHz P4 with HT 的的2 2 倍倍 HT HT 使处理器的性能至少提升了使处理器的性能至少提升了1/3 1/3 双核的性能相当于双核的性能相当于2 2块块 non-HT non-HT 处理器处理器 双核技术与双核技
14、术与HTHT技术在性能上的对比技术在性能上的对比 Ex 1: Ex 1: 两个两个floating pointfloating point线程线程 (Smithfield client) (Smithfield client) 每个线程拥有自己的每个线程拥有自己的FPU, FPU, 没有资源冲突没有资源冲突 尽管性能上没有提升太多,但仍然优于尽管性能上没有提升太多,但仍然优于HTHT Ex 2: Ex 2: 一个一个integerinteger线程与一个线程与一个floating pointfloating point线程线程 性能大幅度提升性能大幅度提升 没有资源冲突没有资源冲突 冯 玛 寡
15、 杯 疏 庸 洋 晒 里 南 叉 诵 盗 芒 燃 斜 半 衙 届 肛 硕 酥 醒 刽 歌 永 负 攀 代 婶 阿 拿 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 10 http:/ http:/ Single core , With HT ( Eg. Pentium 4 Processor With HT ) Integer and Floating Point Threads L2 Cache and Control L2 Cache and Control L1 D-Cach
16、e and D-TLB Schedulers Integer Trace Cache Rename/Alloc uop Queues BTB uCode ROM 33 Decoder BTB & I-TLB Floating Point 2 threads can be executed at the same time (per processor) if theyre not competing for the same execution resource 珍 工 被 再 慎 许 爆 僳 蹿 旭 客 宙 浩 号 犊 凄 炭 泉 翰 银 呀 袒 落 例 孩 吻 皋 资 拖 宪 坝 两 7
17、3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 11 http:/ http:/ Single core , With HT ( Eg. Pentium 4 Processor with HT ) Two Floating Point Threads L2 Cache and Control L2 Cache and Control L1 D-Cache and D-TLB Schedulers Integer Trace Cache Rename/Alloc uop Queues BT
18、B uCode ROM 33 Decoder BTB & I-TLB Floating Point 2 threads CANNOT be executed at the same time (per processor) if theyre competing for the same execution resource (eg. 2 floating point threads in a P4P architecture) 江 充 淖 绝 腕 癌 吾 挥 坠 喘 瓢 莽 警 鹃 赖 跃 仪 绽 柔 冕 曙 士 婶 甩 父 涉 澜 捅 剩 韭 棺 乓 7 3 2 - 多 核 处 理 器 体
19、 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 12 http:/ http:/ Dual core , Without HT ( Eg. Pentium D Processor ) Two Floating Point Threads L2 Cache and Control L2 Cache and Control L1 D-Cache and D-TLB Schedulers Integer Trace Cache Rename/Alloc uop Queues BTB uCode ROM 33 Decoder B
20、TB & I-TLB Floating Point L2 Cache and Control L2 Cache and Control L1 D-Cache and D-TLB Schedulers Integer Trace Cache Rename/Alloc uop Queues BTB uCode ROM 33 Decoder BTB & I-TLB Floating Point Even 2 floating point threads can be executed at the same time now (per processor) as there are multiple
21、 floating point execution units 肘 姑 往 跃 腥 洛 茂 撂 录 漂 前 釉 疏 速 棘 篓 辑 靳 衫 交 嚼 铡 选 讼 酋 曾 蹦 枕 嗅 它 壕 纵 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 7 3 2 - 多 核 处 理 器 体 系 结 构 及 并 行 程 序 设 计 13 http:/ http:/ Dual core , With HT ( Eg. Dual Core Pentium Processor Extreme Edition ) Supports HT Multiple Integer and Fl
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 732 多核 处理器 体系结构 并行 程序设计
链接地址:https://www.31doc.com/p-5789792.html