Arm新一代全面计算解决方案,不止改变“视界”这么简单!
对于大多数玩家而言,逼真的游戏画面是不可或缺的一部分。因为高品质界面不仅可以增加游戏深度、提高游戏的挑战性、增加游戏的幽默感,甚至还可以让游戏视觉效果、动画等方面更加突出。可以说,一款手机游戏的核心,就在于极为丰富的视觉体验。
说到视觉体验,这里不得不提的就是Arm全面计算解决方案了。要知道,无论市面上何种手游,沉浸式游戏体验感总与设备性能息息相关,这特别体现在手机CPU、GPU等方面。而Arm全面计算解决方案,可以将二者性能得到全面提升,为实现高清流畅的手游体验提供强大的支持。
2021年,Arm发布了首款全面计算解决方案,通过提供出色的性能、安全性、可扩展性和效率,满足了各类消费级设备市场的专用处理需求。日前,Arm又推出了2022全面计算解决方案(TCS22),旨在进一步完善各类终端市场的用户体验,继续突破移动市场的界限。
坚持三项原则,助力视觉创新
为了让大家全面地了解这一解决方案,近日在Arm技术媒体沟通会上,Arm高级副总裁兼终端事业部总经理Paul Williamson对其进行了详细的介绍,并探讨了相关领域的终极用户体验、市场趋势与技术发展。
据介绍,Arm推出全面计算战略已有多年,目前Arm全面计算解决方案已在MediaTek的天玑9000 SoC中得到了最佳的展现。它通过Armv9作为最高性能智能手机的根基,被OPPO和vivo采用在其手机中,从而为消费者带来了无懈可击的领先持续性能。
与2021全面计算解决方案(TCS21)相同,此次Arm推出的TCS22也是面向所有消费级设备市场,并且持续专注于计算性能、开发者对性能的可及性,以及平台的安全性。
“首先,在性能方面,如果你对性能要求很高,那么你就需要64位。过去,对于开发者生态系统的就绪程度一直带有一些犹豫不决。鉴于近期OPPO、vivo和小米等公司参与的中国金标联盟宣布,中国的计算生态系统和应用生态系统已全面就绪64位。这意味着,未来几年的旗舰级智能手机都需保证为全64位设计,以确保获得最佳的效率和最强的性能。”Paul Williamson指出,如果你对性能要求很高,那么你需要重视64位。
其次,在开发者的可及性方面,Arm为了让开发者获得IP在机器学习性能方面的更新与提升,便不断推进Arm计算库和Arm NN框架,以确保开发者能够访问这些性能。Paul Williamson表示,无论是在GPU中的矩阵乘法的改善,还是在系统级优化和设计中其它地方的缓存微调中,Arm计算库和Arm NN框架都能让开发者获取这些性能。
第三,在安全性方面,Arm一直在加强处理内存的安全性。“我们已经推出了非对称内存标签扩展,这可被认为是Arm去年推出的同步MTE和异步MTE的结合。”Paul Williamson补充道,此外我们还将这些保护措施扩展到设计中较小的可信执行环境中,这是系统执行软件栈中可能最具安全意识组件的地方。像人脸解锁和面部识别这样的功能,需要确保其免受额外的恶意攻击。在这一代产品,我们将这些安全增强引入设备上的可信执行环境中,这些功能将在这个环境中运行。
扩展五大能力,打造极致体验
为了进一步提高整个SoC的系统性能,TCS22在TCS21的基础上又增加了一些新的升级和附加功能,主要集中在以下五个方面:
1、全新的CPU集群
据Paul Williamson介绍,全新的CPU集群是由2个全新的CPU和2款现有IP的更新共同组成。此次Arm推出了新的Arm Cortex-X3 CPU、Arm Cortex-A715 CPU、Arm Mali-G715 GPU、Arm Mali-G615 GPU和第一款Arm旗舰GPU Immortalis-G715,可以提供卓越的峰值性能,实现性能与效率的完美平衡。
值得一提的是,全新的GPU是Arm迄今为止性能最高的图形处理器,具有增强视觉体验的新功能和特性。Immortalis-G715将游戏性能提升到了一个新的水平,是首款提供基于硬件的光线追踪支持的Arm GPU,可以提供更为真实的沉浸式游戏体验。
除此之外,Arm还对TCS22进行了一系列IP更新和添加,比如通过系统IP更新提高可扩展性和效率、Arm Cortex-R82 CPU支持MMU等。
“伴随着Arm最新的CPU与GPU IP,我们配置了工具、软件生态系统,以及实体IP和通用标准,致力于打造出灵活且扩展性高的解决方案,以满足从台式机到轻量级AR/VR设备之间广泛的价格区间。”Paul Williamson表示,作为核心基础平台的延伸,TCS22支持这些市场的专用计算能力。只有通过系统层级的优化,我们才能提供如此出色的体验。
2、高级游戏体验
Arm认识到,在如今的移动市场中,游戏不断推动着智能手机平台的发展。据统计,游戏应用程序占所有智能手机使用量的43%;同时,在现有的22亿活跃的移动游戏用户中,约有78%使用Android系统。
而TCS22可以满足移动设备上更复杂的AAA游戏体验的需求,从而为用户带来一个全然不同的世界。除了新的Armv9 CPU、支持基于硬件的光线追踪的Immortalis-G715,以及更为高级的Mali GPU,Arm还对Mali-DDK进行了进一步优化。
相较于上一代全面计算解决方案,这些新增的功能和改进,可使DRAM带宽减少23%,功耗减少16%,性能提升28%,显著改善了缓存大小与游戏工作负载,同时还改善了效率并最终延长了游戏性能续航。这一重大的提升,可为百万计的移动游戏开发者带来进一步的持续游戏性能表现。
3、机器学习(ML)加速
当前,ML工作负载正在重新定义所有消费类设备的用户体验,比如以下几个应用场景,其在性能需求上都有所不同:
● 用于音频传感和振动检测的集成传感器集线器需要较低的性能;
● 语音交互的语音助手,以及语音识别和关键字检测;
● AI摄像头和视频对性能的要求最高,这些用例利用包括计算机视觉、图像识别、深度学习和机器学习在内的一系列技术来丰富视觉体验。
而TCS22可为高性能AI相机和视频用例释放ML计算,促进多个方面的性能提升:
● 物体检测增加43%
● 超分辨率增加32%
● 对象分类增加30%
● 实时识别增加39%
此外,通过这些新增的功能和优化,TCS22还将ML能力提高了1倍,以实现更多的智能应用和更出色的用户体验,比如:
● 新GPU中添加了矩阵乘法指令支持,实现了2倍的架构ML改进;
● Cortex-M85与Helium和Cortex-M55相结合,可在小功率预算下高效执行DSP和ML算法;
● Arm计算库的优化;
● 系统级优化,例如微调缓存和减少DRAM延迟;
● 将Arm计算库和Arm NN框架集成到Android中,可使第三方开发人员更容易使用ML,从而在数百万个应用程序和数十亿台设备上释放ML性能。
4、增强平台安全性
据了解,TCS22的安全性主要通过过程中安全、安全固件更新、可信执行环境(TEE)这三个关键层得到增强。
通过第二代Armv9 CPU引入新的非对称内存标记扩展(MTE),进程内安全性得到了加强。通过在定位安全漏洞的速度和精度之间提供更大的灵活性,可以显著提高MTE性能。MTE具有新的非对称MTE选项,允许现场安全监控和内部调试,以简化和加快软件开发,这将为芯片供应商、设备制造商、操作系统供应商(OSV)和开发人员等节省时间和成本。
与此同时,为了实现进程内安全,Arm还增强了PAN,保护用户数据免受JITed代码攻击。此外,Arm还通过Cortex-M系列处理器在很小的面积内采用了指针身份验证(PAC)和分支目标标识符(BTI)。Cortex-M85是第一款可选择支持PAC和BTI的Cortex-M处理器,而PAC和BTI扩展了Cortex-M处理器的安全功能,可以减轻针对复杂软件堆栈的面向返回的编程和面向跳转的编程攻击。
5、软件和工具(包括为开发人员提供最新的Android软件堆栈支持)
通过TCS22,Arm提供了最新的Android AOSP请求程序软件堆栈,其中包括可供开发人员使用的最新功能、Arm的固定虚拟平台(FVP),以及堆栈在该平台上运行和验证。这些软件和工具可以帮助开发人员快速部署,并定制他们自己的解决方案。
在新的软件堆栈之上,Arm硬件和软件成功套件为开发人员提供了对Arm工具和模型的无限制访问。其中,硬件成功套件加快了供应商从设计到流片的上市时间;而软件成功工具包则可使开发人员在部署之前构建、调试和分析完整的软件堆栈。
Paul Williamson认为,如今的移动端是世上最大的游戏平台,移动设备的创新也正在推动这一市场的增长。随着相关性能与需求的增长,持续的性能表现将成为游戏的关键指标。“移动游戏非常强调性能极限,而这正是Arm能够在CPU、系统IP和GPU上提供全面的优化,促成这项性能的提升。”
总之,TCS22可以满足各级别的性能、效率和可扩展性要求,适用于各类消费级设备市场的专用处理需求。凭借上述功能的增强和性能的提升,可以预见,TCS22将会重新定义未来的沉浸式3D视觉效果。
来源:21ic