南开大学21并行程序设计离线作业2参考答案86.docx
《南开大学21并行程序设计离线作业2参考答案86.docx》由会员分享,可在线阅读,更多相关《南开大学21并行程序设计离线作业2参考答案86.docx(12页珍藏版)》请在三一文库上搜索。
1、南开大学21春并行程序设计离线作业2参考答案1. 每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案:D2. 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是( )。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案:D3. 一个AVX寄存器最多存放_个双精度浮点数。一个AVX寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:B4. 静态线程编程模式的缺点是( )。A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高参考答案:B5. 实现任
2、何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp reduce参考答案:C6. 当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。A.多核和众核技术B.突破物理局限C.改善散热D.采用新材料参考答案:A7. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案:C8. 对双精度浮点计算,AVX最
3、高实现( )路并行。A.2B.4C.8D.16参考答案:B9. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案:C10. 为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案:C11. 在使用信号量之前必须对其进行_。在使用信号量之前必须对其进
4、行_。A.初始化B.加锁C.加1D.销毁参考答案:A12. MMX有_个专用寄存器。MMX有_个专用寄存器。A.4B.8C.16D.32参考答案:B13. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案:D14. 若SIMD并行化时遇到对齐问题,下列说法正确的是( )。A.只能使用不对齐访存指令B.不能进行SIMD并行化C.对齐开销可能完全抵消SIMD并行收益D.以上皆错参考答案:C15. 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘加
5、计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案:B16. 采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第_层循环进行循环展开然后向量化。采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第_层循环进行循环展开然后向量化。A.3B.4C.5D.6参考答案:D17. MPI默认点对点通信模式是( )。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案:A18. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案:A19. 采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘加运算涉
6、及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生次访存。A.nB.tC.n-tD.n/t参考答案:D20. 利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是( )。A.降低了访存延迟B.隐藏了访存延迟C.利用了cache空间局部性D.利用了cache时间局部性参考答案:C21. 条件变量相对于互斥量的优点是_。A.是多源状态B.加锁解锁开销低C.条件不成立时阻塞线程并自动解锁加锁D.以上皆错参考答案:C22. 以下超级计算机中,( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案:D23. 编写矩阵乘法
7、的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:B24. 在使用互斥量之后必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:D25. 华尔街是世界上超级计算机最密集的区域之一,原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案:D26. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T-TB.T-TC.p
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 南开大学 21 并行 程序设计 离线 作业 参考答案 86
