终端人工智慧解决方案领导厂商耐能智慧(Kneron)今日正式发布Kneron NPU IP神经网路处理器系列(Kneron NPU IP Series),是针对终端装置所设计的专用人工智慧处理器IP。Kneron NPU IP系列包括三款产品,分别为超低功耗版KDP 300、标准版KDP 500、以及高效能版KDP 700,可满足智慧手机、智慧家居、智慧安防、以及各种物联网装置的应用。全系列产品具备低功耗、体积小的特性,且提供强大的运算能力。别於市面上用於人工智慧的处理器,其功耗动辄数瓦起,Kneron NPU IP的功耗为100毫瓦(mW)等级,针对智慧型手机脸部辨识专用的KDP 300,功耗甚至不到5毫瓦。
Kneron创办人暨执行长刘峻诚表示:「要在终端装置上进行人工智慧运算,同时满足功耗与效能需求是首要考量,Kneron NPU IP实现了这样的目标,为终端人工智慧带来革命性的发展。Kneron自2016年推出该公司首款终端装置专用的人工智慧处理器NPU IP後,就不断改善其设计与规格,并针对不同产业应用进行优化。我们很高兴推出全系列新一代产品,同时宣布KDP 500已获得客户采用,将於第二季进入量产制造(Mask tape-out)阶段。」
Kneron NPU IP是针对终端装置所设计的专用人工智慧处理器,让终端装置在离线环境下,就能运行 ResNet、YOLO等深度学习网路。Kneron NPU为完整的终端人工智慧硬体解决方案,包含硬体IP、编译器(Compiler)以及模型压缩(Model compression)三大部分,可支援各种主流的卷积神经网路(Convolutional Neur al Networks,CNN)模型,如Resnet-18、Resnet-34、Vgg16、GoogleNet、以及Lenet等,以及支援主流深度学习框架,包括Caffe、Keras和TensorFlow。
Kneron NPU IP功耗为100毫瓦等级,超低功耗版的KDP 300甚至不到5毫瓦,全系列产品的每瓦效能在1.5 TOPS/W以上(注二),由於采用了多项独家技术,因此能实现低功耗、高运算力的需求。在架构设计上,运用卷积核拆分(Filter decomposition)技术,将大卷积核的卷积运算区块分割成多个小卷积运算区块分别进行运算,然後结合可重组硬体卷积加速(Reconfigurable Convolution Accelerating)技术,将多个小卷积运算区块的运算结果进行融合,以加速整体运算效能。透过Kneron先进的模型压缩(Model compression)技术,则能将未经优化的模型压缩数十倍。记忆体分层储存技术(Multi-level caching)可减少占用CPU资源以及降低数据传输量,进一步提升整体运作效率。此外,Kneron NPU IP能结合Kneron影像辨识软体,提供即时辨识分析、快速回应,不仅更稳定,也能满足安全隐私需求。由於软硬体可紧密整合,让整体方案体积更小、功耗更低,以协助产品快速开发。
Kneron NPU IP产品系列介绍:
1.NPU IP- KDP 300低功耗版
锁定手机3D脸部辨识应用,可进行3D结构光与来自双镜头的立体影像辨识分析,让真人脸部辨识更快速精准。KDP 300亦适用於需要超低功耗的终端装置,该处理器包含运算与静态随机存取记忆体(SRAM)的功耗不到5毫瓦。
2.NPU IP- KDP 500标准版
可进行快速即时、大规模的脸部、手势、身体辨识与分析,以及深度学习。适用於智慧家居、智慧安防等领域。运算能力可达152 GOPS(500MHz) (每秒十亿次运算),功耗仅有100毫瓦。
3.NPU IP- KDP 700高效能版
能处理更进阶与复杂的人工智慧运算,以及深度学习推理应用,可应用在高阶智慧型手机、机器人、无人机、智慧监控设备等。KDP 700具有优异的运算能力,资讯吞吐量可高达4.4 TOPS(1GHz) (每秒万亿次运算),功耗为300~500毫瓦。