CNN高效升级,有一定的可编程性.doc
《CNN高效升级,有一定的可编程性.doc》由会员分享,可在线阅读,更多相关《CNN高效升级,有一定的可编程性.doc(4页珍藏版)》请在三一文库上搜索。
1、CNN高效升级,有一定的可编程性2018年7月18日,自适应和智能计算公司赛灵思(Xilinx, Inc.)宣布完成对专注于神经网络剪枝、深度压缩技术及系统级优化的中国AI芯片公司深鉴科技的收购。这是迄今为止第一家中国AI芯片初创公司与全球芯片领军厂商的深度绑定。深鉴科技CTO单羿在近日举办的赛灵思全球开发者大会上表示,公司此前本身在深度学习方面有一定的技术积累,用户不需要写底层的RTL,就可以通过提供的API接口,进行应用的开发,可以进一步降低开发者的难度,这是最适合客户的开发模式。赛灵思在客户积累以及服务方面,有着丰富的经验和能力,对于创业公司而言,一般是缺乏客户的开发能力,以及后续的技术
2、支持方面的能力。因此对于深鉴而言,同赛灵思合作,可以弥补这一方面的劣势,更快的将产品推广给更广范围的用户,省去教育用户的开销。另外,赛灵思和深鉴科技双方对于客户的看法是一样的,今天的AI的算法是一直在变化的,ASIC的做法并不适用,加之流片的成本也越来越高,周期较长,传统的做法并不是适应这个变化极快的时代。FPGA在灵活性方面有着不可比拟的优势,目前的频率是在数百兆HZ,未来也会根据需求以及技术的成熟,达到过GHZ的频率;FPGA上也有着丰富的DSP资源,充分的互联,接口众多。这些特性都对应了这个AI算法快速迭代发展的时代。因此,双方的优势和互补性使得彼此走到了一起。深鉴提供全栈的解决方案,包
3、括基本的检测、追踪、分割等算法,比如汽车检测、行人检测、交通标志牌识别的参考算法,免费给用户。既有标准化的优化算法技巧,也给用户定制化的可能。这些方案是基于FPGA的部署,深鉴科技实际上做的就是DPU的设计,处理器的架构中,有自己的存储访问的Hardware、调度器、微体系结构等。有了这些之后,用户使用CNN就会变得高效,有一定的可编程性。一.DNNDK降低AI startup门槛为了方便用户使用,深鉴科技开发了一套软件的工具DNNDK(Deep Neural Network Development Kit,深度学习开发与部署全栈式解决方案)。最新的版本可支持两种赛灵思的方案,ZCU102和Z
4、CU104。这个工具每月会定期的更新,方便用户下载使用。对于AI创业公司而言,能够使其具备竞争力的,就是产品的差异化,而差异化是需要在软件上不断的训练不同的模型。训练模型是需要依赖算法团队的实力,很少有创业公司能够兼顾模型精准和短小精悍。为了让用户无差异的使用相同的处理器平台,提供了模型压缩技术。通过自动化工具,可以训练模型,经过不长的时间,就可以得到一个精简、轻量化的模型。深鉴科技的自动化模型压缩工具,是基于硬件进行的,因此更适合硬件加速。压缩工具工作主要有两个步骤,量化和剪枝,量化就是改变参数,从浮点表达变成定点表达,剪枝就是去掉无用的部分,比如一些连接和神经元。分类网络的压缩结果,保证压
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CNN 高效 升级 一定 可编程
链接地址:https://www.31doc.com/p-3250612.html