ARM推出Project Trillium机器学习处理器

ARM推出Project Trillium机器学习处理器
我♡小工具,游戏和语法。曾经的美国专职技术人员。

Arm以其移动CPU和GPU处理器而闻名,但该公司也渴望在更多新兴领域展示其专业知识。在首次揭示其存在的三个月后,Arm于本周推出了其新的Project Trillium机器学习处理器(MLP)。

MLP的存在是为了允许智能手机和平板电脑独立执行机器学习,而无需连接到某处的服务器。尽管智能手机的性能有限,但此方法有很多优点:发送和接收数据时需要花费更少的带宽和功率,而数据却没有'不要离开设备,这样更安全'最小延迟等等。当Arm最初瞄准移动设备时,他们希望该解决方案能够在一天之内从小型的物联网设备扩展到大型数据中心。

Trillium MLP项目由Arm的工程师设计'的CPU和GPU团队可以自由支配设计不受约束的新架构。他们决定在构建过程中强调三个要点:

  • 有效卷积 数据均匀混合,这会占用大量的计算时间)
  • 高效的数据移动(因为移动数据比实际计算需要更多时间)
  • 足够的可编程性(例如,允许使用新的架构,操作员和拓扑)

MLP使用多达16个计算引擎来执行必要的处理,而微控制器和直接内存访问引擎则负责调度。为了在不消耗大量能量或空间的情况下保持足够的性能水平,Arm瞄准了机器学习中常见的量化8位数据类型。

Arm MLP有很多技巧可以提高操作效率。例如,它可以通过屏蔽给定块中的重复零来执行特征图的无损压缩,通常产生3:1的压缩率。这使MLP减少了所需的SRAM数量,而Arm的目标是仅为其16个计算引擎提供1MB的内存。

压缩还用于最小化用于权重的带宽。如果权重得到了很好的训练,则它们在网络的后面各层中往往会有很多零,因此Project Trillium MLP会屏蔽这些零以实现4:1的压缩比。 MLP还可以跳过不太重要的计算,'t显着影响最终结果以节省时间。

通过使用可编程层引擎(PLE)可以满足ARM MLP的可编程性要求。 PLE允许处理器添加新的运算符,并且还支持Android神经​​网络API(NNAPI)和Arm'自己的神经网络SDK(Arm NN)。它还使用池,激活和压缩来加速常见任务,从而再次提高性能和效率。

ARM MLP将于2018年中期发布,并将在旧的16nm和尖端7nm制造节点上提供。开发人员将能够使用Arm NN(适用于Android和嵌入式Linux)编写代码,并在其现有的CPU和GPU上运行,并使其在这些新的MLP上立即开始工作。're available.

您对移动机器学习开发感兴趣吗?让我们在评论中知道。

车身图片来源:Arm。

查看评论
发表评论

一则评论“ARM推出Project Trillium机器学习处理器

发表评论

您的电子邮件地址不会被公开。 必需的地方已做标记 *