九章存储层次.ppt
《九章存储层次.ppt》由会员分享,可在线阅读,更多相关《九章存储层次.ppt(60页珍藏版)》请在三一文库上搜索。
1、1,第九章 存储层次,9.1 存储器的层次结构 9.2 Cache存储器 9.3 虚拟存储器 9.4 基本Cache和虚拟存储器的扩展 9.5 实例:Pentium/Windows个人计算机 上的内存管理,同济大学 软件学院,2,9.1 存储器的层次结构,图9.1 一般的存储器层次,物理内存:由动态RAM组成。 Cache存储器:由静态RAM构成,比DRAM快得多,但也 昂贵的多。Cache是物理内存的部分副本。 虚拟存储器:空间比物理内存大得多的逻辑空间。,3,9.2 Cache存储器,目标:弥补主存速度的不足,9.2.1 相联存储器 一般存储器 接收一个地址,访问该地址中的数据。 相联存储
2、器:按内容访问的存储器。 并行搜索所有单元,标记那些与特定数据匹 配的单元,然后连续读出匹配的数据值。,4,1. 相联存储器的内部组织结构,5,2. 读数据 CPU必须给出两个值: 第一个值:要被匹配的数据值(参数或数据) 第二个值:哪些位需要检查(屏蔽位或关键位) 如果满足如下的公式,则匹配就会发生,6,例如(参考图9.2): 屏蔽寄存器K 1111 0000 0000 0000 数据寄存器D 1010 XXXX XXXX XXXX 数 据 位M 1010 1101 0000 0111 执行 0000 XXXX XXXX XXXX 执行 1111 XXXX XXXX XXXX 执行 1111
3、 1111 1111 1111,7,3. 将数据写回相联存储器 CPU把数据送到数据寄存器并发出写信号。相联存储器检查所有单元的有效位,并找到有效位为0的一个单元,如果找到,把数据存到这个单元,同时将有效位设为1。如果没有找到,必须采用替换算法清除一个单元来保存数据。,8,常见的替换算法 FIFO LRU RANDOM,9.2.2 相联映象的Cache存储器,9,64K 8位内存,10, 作用于数据行或数据块的相联存储器,11,9.2.3 直接映象的Cache存储器 一种利用标准的SRAM、廉价的Cache映射方案。,12, 索引 Cache地址的低位,用来选择Cache的一个特定单元。 标识
4、 原始地址中不是索引的那些高位。,设M2m,则当表示为二进制数时,j 实际 上就是i 的低m 位:,m位,j,i:,i:主存地址 j:Cache地址,13, Cache容量: 1K,14, 相对简单的CPU中,块大小为4字节的直接映像Cache,15,9.2.4 组相联映像的cache存储器,16, 考察大小为1k的2路组相联cache,该cache有1k个数据入口,每个单元2个数据值,因此有512个单元 用9个地址位选择cache单元,剩下的7位说明标识值 计数值用来纪录数据什么时候被访问过了,组数,17, 相对简单CPU中具有4字节数据行的2路组相联cache,18,9.2.5 在cach
5、e中替换数据 问题的引出: 当cache已满时,又有新数据要调入cache ,需 将哪个数据移出cache。,FIFO 先进先出原则 LRU 近期最少使用原则 随机策略,19,例:在一个4路组相联cache单元中应用LRU策略,T,D,C,V,T,D,C,V,T,D,C,V,T,D,C,V,C,c,2,1,B,b,1,1,A,a,0,1,-,-,-,0,1. Cache单元的当前状态,2. CPU访问D,C,c,3,1,B,b,2,1,A,a,1,1,D,d,0,1,3. CPU访问E,4. CPU访问A,E,e,0,1,B,b,3,1,A,a,2,1,D,d,1,1,E,e,1,1,B,b,
6、3,1,A,a,0,1,D,d,2,1,20,9.2.6 写数据到cache,写直达法 每次信息从CPU写入cache单元中时,也要 写回相应的物理内存单元中 回写法 写入cache中的值并不总是被写回物理内 存。仅在数据被移出cache时写回物理内存。,21,处理写失效问题,按写分配法 把单元装入cache,然后使用写直达法或 写回法把数据写到cache 不按写分配法 直接更新物理内存中的值,而不把值写回 Cache。,22,9.2.7 cache的性能 1. 评判性能的标准 命中率与失效率 Cache命中率:CPU访问Cache时,在Cache中找到 数据的概率。 Cache失效率:CPU
7、访问Cache时,在Cache中找不 到数据的概率。 平均访问时间 Tm=h Tc (1h) Tp,23,Tc = 10ns Tp = 60ns 结论:增加命中率 能够减少平均访问 时间,24,2. 如何计算命中率和平均访问时间?,例:CPU访问下列顺序单元: 每一个值的下标是由物理内存地址的低3位来描述的。 A0 B0 C2 A0 D1 B0 E4 F5 A0 C2 D1 B0 G3 C2 H7 I6 A0 B0 现在我们确定在三种不同cache配置下的命中率 和平均访问时间。 假设: Tc=10ns Tp=60ns,25, 8字节相联cache 初始化为空,使用FIFO的替换策略。,访问:
8、 18次 命中:7次 命中率:h=0.389 平均访问时间:Tm=40.56ns,26, 直接映射cache,命中率:h=0.167 平均访问时间:Tm=50.67ns,27, 8字节的2路组相联cache Cache使用LRU替换策略。,命中率:h = 0.389 平均访问时间:Tm = 40.56ns,28,考虑这个同样的系统。 有2字节的数据行 组成相关行的数据对; A和J;B和D;C和G;E和F;I和H 使用相同的替换策略 (相联cache采用FIFO,组相联采用LRU) 相同的访问时间(Tc=10ns,Tp=60ns),29,相联cache:命中率h=0.611 平均访问时间Tm=2
9、9.44ns,30,直接映射cache:h=0.389 Tm=40.56ns,31,9.3 虚拟存储器,存储管理单元 在物理内存和较慢的存储设备间移动数据 虚拟存储器的主要实现方法:分页和分段,交换磁盘 交换文件,32,9.3.1 分页,页面:在分页技术中,整个逻辑地址空间被划分为连续的块叫做页面,页面的特点: 每个页尺寸相同 页面不可重叠,每个逻辑地址确切地 属于某个页面,33,一个页面或者包含程序指令或者包含数据,不能同时包含两者 4. 可能导致内部碎片问题 内部碎片:假设MMU实现的页式存储器中每个页面大小为4K,一个4K+1大小的程序需要MMU分配两个存储器页面,尽管它的第二个页面只用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 存储 层次
链接地址:https://www.31doc.com/p-3160312.html