博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Arm宣布推出Cortex-M55核心和Ethos-U55 microNPU,瞄准低功耗Edge AI
阅读量:2112 次
发布时间:2019-04-29

本文共 2604 字,大约阅读时间需要 8 分钟。

昨天,Arm宣布了其最新的Cortex-M系列产品,即新的Cortex M55。除了新的CPU微体系结构带来了一些新的改进之外,我们还看到了新的Ethos-U55 NPU IP的引入,该IP旨在与新的M55内核集成在一起。Arm的新IP旨在在未来几年内提高数十亿低功率嵌入式设备的机器学习和推理能力,并扩展其产品组合以适应新的用例。

Edge AI是芯片技术的最大趋势之一。也就是说有很多AI的功能,可以在没有云端服务器连接的情况下本地运行,最直接的就是提高了运行速度与隐私性。恩智浦边缘处理器高级副总裁Geoff Lees表示,“在新的AI要求以及成本,延迟,可靠性和隐私性等基于云的处理挑战的推动下,'Empowered Edge'成为一种新的大趋势。Arm的新型端点ML技术将帮助NXP众多的微控制器基础开发人员可以加速受尺寸和功率限制的设备的边缘处理。”

先举几个例子:

物联网AI的其中一个应用是已经存在的东西,但是使用Cortex-M55和Ethos-U55可以将其提高到一个新水平。该设备并不是每个人都必须拥有的,但是对于那些需要它的人来说,它可能会改变生活。以下是一些统计数据:在美国,有1000万人注册为盲人或部分盲人。在全球范围内,这一数字接近3亿。这里我想说的设备是连接的手杖。早期版本已经存在,我们发现是以下版本:WeWalk,这些设备使用感应和导航功能来智能地指导人们避开室内和室外的危险。新AI 包括新的人工辅助,语音和手势引导的机器交互以及预测性故障传感器系统,将极大的改变生活。

与Arm医疗保健创新团队谈到了我们新的Cortex和Eth操作系统处理器可能会进行重大升级。他们告诉我,如今的连接开发人员面临的最大挑战是对超声定位的依赖。但是超声波的射程和保真度有限,并且所需的传感,处理和电源组件往往会使设计膨胀。

新处理器可以使开发人员使用360度摄像头将超声换成支持AI的视觉传感。除了无线通信和导航外,还将由能够持续一整天的超薄电池供电。该设备看起来像传统的设备,但却是最终的视觉辅助工具。而且,由于AI计算是在本地执行的,因此失去单元连接也没关系。

接下来我们一起看看,新发布的Cortex-M55与Ethos-U55有哪些新的特性。

新型Cortex-M55是与M33更紧密相关的新一代IP,但是它带来了一些新的体系结构改进,在机器学习以及矢量指令方面有望实现较大的性能和灵活性改进。

Ethos-U55是专用的“ microNPU”专用推理加速器,可与Cortex-M类CPU结合使用,并提供专用NPU的性能和能效,或者通常由MAC引擎带到桌面上–类似的M级IP占用空间小。

Cortex-M55:第一个具有Helium和自定义指令能力的CPU内核

新的Cortex-M55非常重要,因为它是第一个同时具有Helium(原谅我中文名还不知道怎么叫好)和自定义指令功能的Arm CPU内核。Helium的技术名称实际上是MVE(用于M-Profile Vector Extension),是M级处理器产品系列中的新矢量扩展和专用矢量执行单元,使其成为该范围内首款具有SIMD功能的CPU说明。新增功能使新内核的DSP性能提高了5倍,与ML相比,针对ML工作负载的优化指令与MVE相结合,性能提高了15倍。

在整体微架构方面,它是M33和µarch组合的继任者,而且频率的提高将使标量工作负载的性能提高大约20%,具体取决于供应商的配置。该内核的设计重点是带宽,并启用了需要带宽的新MVE和新ML工作负载,因此对内存子系统进行了改进,例如具有到TCM(紧密耦合内存)的4个32位接口。

Ethos-U55:Arm的首款microNPU

Arm在NPU领域相对较晚一点,因为大多数供应商已在产品中采用了自己的第一方IP体系结构,而如今大多数供应商都在使用此类实现。但是,嵌入式市场有些不同,因此需要一种面积和功耗比通常在“更大”的实现中(例如,在Arm的Ethos-N涵盖的移动SoC中)所用的产品要小得多的产品, NPU IP。这是该公司用于微控制器的新型“ microNPU”神经网络加速器协处理器中的首个产品。Arm声称,结合新发布的Cortex-M55,Ethos-U55可以在公司现有的Cortex-M系列产品上将机器学习性能提高480倍。

新的U55是一种小型NPU,可从32个MAC扩展到256个MAC,并且需要与Cortex-M类NPU耦合。Arm并未涉及微体系结构的主要细节,但它是一种非常精简的设计,着重于面积和功率效率,并且具有较小的内存占用量,其中包括我们在N系列产品中看到的一些功能,例如重量减压。我们说的是U55需要与M级CPU耦合才能用作控制器,但是实际上,这与N系列的功能并没有太大区别,因为该IP已经包含M级CPU,专门为低功耗用例设计的。

与上一代解决方案相比,使用M55和U55的此类系统的性能改进代表了非常重要的步进功能提升。与基于Cortex-M7的系统相比,Arm提供的数据最多可将性能提升50倍,同时可将能源效率提高25倍。

至于将在何处使用新IP,则有各种各样的嵌入式系统。在这里我们要明白,这类系统的主要部分实际上将是当前现有芯片的子系统。如果以移动设备为例,您会看到子系统在电话的指纹传感器中使用IP,在语音助手功能中始终监听音频芯片,甚至在RF系统中使用子系统来优化工作负载,例如天线调谐。当今的移动设备中有数百种M级处理器将从ML功能中受益,其中大多数功能对用户完全透明。

Arm目前已将M55和U55许可给其主要合作伙伴,并将在未来几个月内向其他客户开放更广泛的许可。与IP一样,如果供应商曾经公开确认他们是否在其产品中使用了这些设计,预计最早的芯片最早要到2021年初才能问世。

往期回顾

1.

3.

4.

5.

6.

7.

你可以添加微信17775982065为好友,注明:公司+姓名,拉进 RT-Thread 官方微信交流群!

RT-Thread

让物联网终端的开发变得简单、快速,芯片的价值得到最大化发挥。Apache2.0协议,可免费在商业产品中使用,不需要公布源码,无潜在商业风险。

长按二维码,关注我们

点击阅读原文,进入RT-Thread GitHub首页

你点的每个“在看”,我都认真当成了喜欢

转载地址:http://qonef.baihongyu.com/

你可能感兴趣的文章
Java - JVM TLAB、对象在内存中安置顺序、垃圾收集、回收算法
查看>>
转: 关于Linux与JVM的内存关系分析
查看>>
(转)Java 程序员必备的高效 Intellij IDEA 插件
查看>>
局域网(内网)docker安装及代理访问
查看>>
软考 英语学习
查看>>
maven 文件上传到远程服务器目录
查看>>
shell 脚本免密远程访问
查看>>
Linux平台Oracle多个实例启动说明
查看>>
在LINUX平台上手动创建数据库(oracle 10g)(在一个oracle服务器上启动两个实例)
查看>>
Oracle 10g 下载地址
查看>>
Linux 下 新增Oracle10g 实例
查看>>
LRM-00123 ORA-01078
查看>>
ORA-01102: cannot mount database in EXCLUSIVE mode
查看>>
专栏结语
查看>>
BERT 实战
查看>>
BERT 基础
查看>>
什么是 Transformer
查看>>
简述 XLNet 的原理和应用
查看>>
实战:为图片生成文本摘要
查看>>
论文复现:用 CNN 进行文本分类
查看>>