关于基于TMS320C6678的粒子群算法并行的设计.doc
《关于基于TMS320C6678的粒子群算法并行的设计.doc》由会员分享,可在线阅读,更多相关《关于基于TMS320C6678的粒子群算法并行的设计.doc(5页珍藏版)》请在三一文库上搜索。
1、关于基于TMS320C6678的粒子群算法并行的设计0 引言粒子群优化(Particle Swarm Optimization,PSO)算法1是由KENNEDY J和EBERHART R C等开发的一种新的进化算法。相对于遗传算法2等,该算法参数较少、容易实现,能够解决复杂的优化问题,因此在众多优化问题领域都得到了广泛的应用3,如控制决策、目标跟踪、深度学习等。然而,粒子群优化算法在实际应用中往往难以达到实时性的要求,特别是求解复杂的多维问题时,速度问题更加突出,难以满足实际应用的需求。随着嵌入式领域对性能、功耗和成本越来越高的要求,多核处理器应运而生4。其中TI公司推出的基于KeyStone
2、架构的多核处理器TMS320C66785是目前业界最高性能的量产多核DSP。其具有8个1.25 GHz DSP内核,最高可实现160 GFLOP的性能。与FPGA相比其具有更好的浮点性能和实时处理能力,并且具有较高的灵活性和可编程性,为实现更为复杂的算法提供了便利。因此其在4G通信、航空电子、机器视觉等领域得到了广泛的应用。本文针对粒子群算法在实际应用中的实时性需求,在对算法进行并行性分析的基础上,根据TMS320C6678多核处理器的架构特点,设计出高效的应用程序,充分发挥了TMS320C6678的性能优势,有效地提高了系统的实时处理能力。实验数据表明了该设计的合理性与有效性。1 PSO算法
3、简介PSO流程图如图1所示。粒子群算法的数学描述如下:m维的解空间中,X=x1,x2,xn表示整个种群,该种群由n个粒子组成。因此整个种群中的第i个粒子的位置可以表示为xi=xi1,xi2,xim,该粒子对应的求解速度可以表示为vi=vi1,vi2,vim,每个粒子对应的个体最优解表示为pi=pi1,pi2,pim,整个种群的全局最优解可以表示为gi=gi1,gi2,gim。在每一次的迭代中,每个粒子将个体最优解pbest和全局最优解gbest作为飞行经验,根据如下公式来更新自己的速度和位置:式中,t表示当前迭代次数,xi(t)对应粒子当前时刻的位置,xi(t+1)对应粒子下一时刻的位置,vi
4、(t)和vi(t+1)分别表示粒子当前时刻和下一时刻的速度,为惯性因子,c1和c2为学习因子,r1和r2表示在01之间的随机数。此外在每一维,粒子都有最大的限制速度vmax,如果vivmax,则有vi=vmax;如果vi2 多核DSP任务并行设计2.1 算法并行性分析粒子群算法和其他一些进化算法相比,其优势在于步骤简单、参数少、容易实现、无需梯度信息等。更重要的是粒子群算法是一种并行算法,非常适合在多核处理器上实现其并行计算。算法中各个粒子具有很高的独立性,所以各个粒子可以独立地完成信息的更新,从根本上实现各个粒子间的并行操作处理,提高算法的实时性。根据处理器的核心数,将粒子的更新任务平均映射
5、到8个核上。运行时使用如下基本测试函数对该方案进行验证:其中,n表示维数,该函数在x=(0,0,0)处取得全局最小值fmax=0。另外该函数比较复杂,是一个多峰函数。2.2 并行处理模型设计将程序映射到多核处理器的第一步就是确定任务的并行性,并选择一种最合适的处理模型。前面已经分析了算法的并行性。两种最主要的模型是主从模型和数据流模型6,分别如图2、图3所示。主从模型是一种控制集中、执行分布的模型。数据流模型代表分布式控制和执行。除此之外还有OpenMP模型7,该模型是一种在共享内存并行体系中应用发展多线程的应用程序编程接口,如图4所示。结合前面算法的并行性分析,考虑到处理流程时间上的并行性和
6、空间上的并行性,这其中包含了流水操作和并发操作,使用单一的模型都无法有效地解决,因此,突破性地将二者结合起来,设计出局部并行全局串行的并行模型,如图5所示,从而取得良好的并行度和加速比,这在测试数据及结果分析中可以看出。2.3 处理器之间的通信交流多核处理器中内核之间如何进行高效的通信交流,是多核系统所面临的主要难点。处理器之间的通信交流主要包括数据移动和同步8。TMS320C6678提供了多种处理器之间的通信机制。软件是基于SYS/BIOS实时操作系统开发的。考虑到开发的难易程度及性能,采用IPC核间通信的组件来完成核间数据搬移和同步。该组件有“消息队列”(MessageQ)和“通知”(No
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 基于 TMS320C6678 粒子 算法 并行 设计
链接地址:https://www.31doc.com/p-3388175.html