华为“教训”历历在目，AI芯片，如何避免重蹈覆辙？

2024.03.29 算力智库

    制订行业标准一直是行业老大们热衷于做的事，而在高速发展的AI芯片领域，话语权一直掌握在美国手中。国内有没有自己的行业标准呢？有，但影响力都有限，很难成为国际通用标准。其中，由信通院主导，发改委、科技部、工信部、网信办等多部门背书的AI芯片新标准AIIA DNN benchmark是其中最有可能跑出来的。
    几日前，WIFI联盟等通信行业标准联盟组织撤销华为会员资格一事，引起业界哗然。
    尽管5月29日这些联盟已经迅速恢复华为资格，但这已经足够令人警醒：不掌握行业标准的话语权，随时可能出局。方兴未艾的AI芯片行业更是如此。

    如何检测一块AI芯片的性能？如今最简单直白的方式就是“不服跑个分”。
    分数确实是衡量性能的直观方式，而跑分也经常被安卓手机作为衡量性能的重要手段之一，甚至已经从单纯的芯片跑分蔓延至相机跑分。
    对AI芯片来说，确实也需要一些方式来作为衡量标准，即Benchmark，通过一些基准对芯片进行测评，并以直观的数据等形式来衡量芯片的真实水平。
    因此Benchmark的设立某种程度上代表着芯片的行业标准，成为芯片厂商们在设计芯片时瞄准的方向。
    1 权威Benchmark缺位，厂商和用户鸡同鸭讲
    纵观计算机体系结构的发展史，Benchmark一直在幕后担任着指挥棒的角色，深刻地影响、甚至左右着芯片行业的发展。
    远到超算领域的Linpack，CPU界的SPEC，近到GPU世界的3DMark以及智能手机的AnTuTu，不知道有多少公司多少工程师为此而“分”狂。
    AI 领域的Benchmark却一直缺乏一个权威有力的平台来给出标准。
    对于AI芯片的衡量标准是多维度的，影响一款芯片的性能主要有三个因素：
    首先是芯片设计。在芯片设计中，主要的指标是芯片的算力，即每秒的运算次数，一般以TOPS为单位（每秒进行1012次运算），如果将算力比喻成芯片的肌肉，算力只能作为芯片的规模，而不能代表整体的能力。
    越多的算力堆砌往往意味着着越高的功耗，而既降低功耗又能达到更好效果才是一块优质芯片的设计方向。此外，系统带宽设计、非深度学习部分的加速等等都是芯片设计的一部分。
    第二点是算法优化，例如某个硬件架构不适合某网络，在选择算法时，可以选择其他适合这个硬件的算法网络来实现同样的功能。
    第三点是软件代码，即使是在芯片硬件、算法一致的情况下，代码的质量也会影响芯片的实际性能。因此要通过这三方面来评估，缺一不可。

    影响因素又多又专业，但芯片好不好终究还是要看使用情况，这或许恰恰是AI芯片至今没有一个权威Benchmark的原因所在。中国信息通信研究院云计算与大数据研究所副主任王蕴韬近日在第三界全球人工智能大会上表示，目前的Benchmark测定标准和真正的客户使用是有距离的。
    生厂商和用户一直存在着沟通不畅通的问题。生产商的宣传一般是：首款达到多少倍水平提升的芯片；超高性能，TOPS绝对领先；DSA硬件架构最优等等。但是站在用户的角度，真正在意的是芯片是否匹配自己的业务需求；在部署、适配、扩展的时候能否灵活快速；实际的性价比等等，往往厂商宣传的数据并不是用户首先考虑的点。
    因此，AI芯片需要一个符合用户需求的Benchmark，作为芯片消费大国，中国也正在着手推进自己的Benchmark。


    1  2  下一页>