芯片是战略要地。目前 GPU 芯片在深度神经网络训练领域获得大范围的应用,但受制于功耗、应用优化性等方面的限制,仍有众多的巨头和初创公司在该领域积极探索,英特尔 2016 年发布 Nervana AI 处理器,可加速各类神经网络。谷歌 2016 年也发布了自己的 ASIC 芯片 TPU,用于加速深度神经网络,微软、AMD、百度等也相继加入战局。
寒武纪研发了国际首个深度学习专用处理器芯片(NPU),目前其 IP 指令集,已扩大范围授权集成到手机、安防、可穿戴设备等终端芯片中,2016 年就已拿到 1 个亿元订单。
执行董事罗韬 26 日表示,目前寒武纪深度学习处理器,若以阶段性论,还处于相当于“ARM”的授权阶段,未来一年内,将推出芯片问世,并拟与台积电先进工艺制程展开合作。
寒武纪之所以想要开发一款专用的深度学习处理器,因为有必要有专门的深度学习处理处,来提升效能与克服降低功耗。通用芯片与专用芯片相比,就像是一把万能的瑞士军刀与菜刀之比,想要切菜得好,必须有专用的菜刀堪用。而深度学习是处理智能应用迄今最好的方法。
罗韬表示,AI 已经在很多领域超越了人脑。但是传统的 CPU/GPU 处理深度学习效率低下,他举例,AlphaGo 使用上千个 CPU 和数百个 GPU,下一盘棋的电费就高达 3000 美元,相当耗能。
而寒武纪的目标,据称,是要让 1 瓦以内功耗的摄像头、手机、甚至手表都能和 AlphaGo 一样“聪明”。
光靠 NPU 指令集就已赚钱
他也分享目前寒武纪的近況。就在 2016 年国际计算机体系结构年会中,约有 1/6 的论文都引用寒武纪开展神经网络处理器研究。
目前寒武纪设立了三条产品线:首先是智能终端处理器 IP 授权,智能 IP 指令集可授权集成到手机、安防、可穿戴设备等终端芯片中,客户包括国内顶尖 SoC 厂商,目前已经开始投入市场。而 2016 年全年就已拿到 1 个亿元订单。这也使得寒武纪研发了国际首个深度学习专用处理器芯片,于 2016 年第一年成立,就实现盈利。
其次,在智能云服务器芯片领域:作为 PCIE 加速卡插在云服务器上,客户主要是国内的知名服务器厂商。
另外,家用智能服务机器人芯片:从智能玩具、智能助手入手,使服务机器人独立具备看听说的能力。客户是各类下游机器人厂商,产品的推出将比智能云服务器芯片更晚一些。
日前中科院还注资 1000 万元,这 1000 万元专项资金一方面用于人工智能芯片的基础性研究,探索下一代人工智能芯片的架构、算法以及在一些新型场景(如 AR/VR)中的应用开发方法。
下一阶段重点 流片商用问世
据指出,DianNao 是寒武纪系列的第一个原型处理器结构,平均性能超过主流 CPU 核的 100 倍,但面积和功耗仅为 1/10,效能提升可达三个数量级。
寒武纪处理器能直接面对大规模神经元和突触处理,一条指令完成一组神经元处理,相比传统执行 x86 指令集的芯片,有数量级的性能提升,未来在云服务器和智能终端上的图像识别、语音识别、人脸识别等方面有着较广应用前景。
而迈入下一个阶段,寒武纪从 IP 指令集授权,到推出商用芯片问世,预料是目前紧锣密鼓筹备的重点。
相关人士也指出,寒武纪目前锁定与台积电最先进的工艺制程合作,其中对其量产成熟的 14 纳米工艺很有兴趣。预期最快一年后流片。
行业人士还指出,国内现在高端芯片设计领域的实力已经提升,但是国内晶圆代工厂的工艺制程还没跟上节奏,包括展讯 14 纳米找英特尔代工、兆芯 14 纳米 CPU 也都选择与台积电合作。
相关人士表示,目前看国内芯片厂的技术节点仍落于国外两到三个世代,在 28 纳米工艺制程还未站稳脚跟的当下,在国内选择综合考量上,高端芯片会多倾向以选择台积电、GLOBALFOUNDRIES 为主,而台积电则又较具两岸优势。
更多最新行业资讯,欢迎点击与非网《今日大事要闻》!