2020年十大AI芯片:百花齐放的年代已经开始


    就通用芯片而言,我国与海外企业相比并不占据优势,但随着人工智能的发展,基于人工智能的芯片在我国得到快速发展——2019年,阿里巴巴、依图、云天励飞、寒武纪等众多AI企业推出了大量人工智能芯片,同时海康威视、大华、华为等传统企业也纷纷涉足AI芯片,可以说,2019年是我国AI芯片爆发式增长的一年。
    而在2020年,我国AI芯片又迎来新的增长期,在2020年,随着人工智能产业的落地,针对不同的落地环境,我国企业也推出了针对性AI芯片,从而实现百花齐放的态势。
    1、鲲云科技:CAISA
    2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6倍。第三方测试数据显示仅用1/3的峰值算力,CAISA芯片可以实现英伟达T4最高3.91倍的实测性能。鲲云科技的定制数据流技术不依靠更大的芯片面积和制程工艺,通过数据流动控制计算顺序来提升实测性能,为用户提供了更高的算力性价比。
    2、苹果M1
    2020年11月11日,苹果正式发布第一款用于Mac的自研电脑芯片M1。苹果公司表示,M1芯片实现了巨大飞跃,它能够让Mac成为完全不同的产品。这颗芯片采用5纳米制程工艺,CPU、GPU、缓存集成在一起,其中包含160亿个晶体管。
    苹果M1芯片拥有8核CPU,其中4颗为高性能核心,另外四颗为高能效核心。此外,这颗SoC还具备8核GPU。M1芯片中的神经网络引擎采用16核架构,每秒能进行11万亿次运算,将机器学习速度最高提升到了15倍。
    苹果副总裁、硬件工程师John Ternus表示,新款MacBook Air、13英寸MacBook Pro和Mac mini都会配备M1芯片。而Mac系列也将逐步过渡到采用苹果设计的全新系列芯片,该过渡将在约两年内完成。
    3、华为麒麟9000
    麒麟9000芯片是华为公司于2020年10月22日发布的基于5nm工艺制程的手机Soc,采用1*A77,3*2.54GHz A77,4*2.04GHz A55的八核心设计,最高主频可达3.13GHz。麒麟9000芯片包含两个规格:麒麟9000和麒麟9000E。
    据华为公布的数据,基于5nm工艺制程打造的麒麟9000,集成多达153亿个晶体管,包括一个3.13GHz A77大核心、三个2.54GHz A77中核心、四个2.04GHz A55小核心,是目前频率最高的手机处理器,同时集成24核心的Mali-G78 GPU(架构超过麒麟990 Mali-G76,核心数也多了一半,性能提升60%)。
    4、地平线:旭日3
    9月9日,地平线推出新一代AIoT边缘AI芯片旭日3,该芯片拥有3M和3E两种型号。该系列芯片搭载地平线第二代BPU,采用15×15mm封装,16nm制程工艺,等效算力达5Tops,典型功耗为2.5W。
    5、芯盟科技:异构AI芯片
    2020年8月25日,海宁发布消息称,芯盟科技研发出全球首款超高性能异构AI芯片。该芯片打破了传统同构芯片内储存与计算间的数据墙,实现了数据存储、计算的三维集成,将主要应用于类人感知与决策应用场景,如服务员、医生、驾驶员等。
    6、“启明920”芯片
    “启明920”由清华大学与西安交叉核心院的研发团队共同研发。
    该芯片采用软硬件协同设计的思想,对模式修剪优化之后的模型采用特定技术实现存储优化和计算加速。它可以实现神经网络模型的存储压缩达4.5倍,充分发挥硬件稀疏计算的效率。硬件加速比可达3.5倍,而神经网络模型的精度损失仅限于1%。
    此外,“启明920”进一步采用了与模式修剪技术兼容的卷积核修剪技术,实现了最低11.25倍的模型存储压缩,硬件峰值精确加速比接近9倍,可以充份缩短计算时间。值得注意的是,“启明920”通过统一的架构,为余模式数据量化提供了高效的支持,能够适应线性和非线性权重参数的量化方法,满足有所不同场景的需求。
    7、零跑汽车:凌芯01
    凌芯01由零跑汽车携手国内顶尖芯片企业耗时3年联合开发,处理性能接近市场顶尖的Mobileye芯片,整体开放性则更强,既能支撑通用运算,又有特定的AI运算逻辑,具有能耗比更低、安全可靠性更高的优势。
    凌芯01在核心CPU处理器采用了阿里旗下平头哥半导体公司提供的“玄铁C860”处理器,集成高性能的AI神经元处理器,全面提升芯片核心处理速度与效率。此外,凌芯01可通过PCIE级联技术,实现多片组合形成计算平台,提供更强大的AI算力。
    凌芯01支持接入12路摄像头来实现2.5D的360°环视,并可支持自动泊车、ADAS智能驾驶辅助域控制、以及接近L3级别的自动驾驶算力,充分满足用户对于车辆智能驾驶与主被动智能安全的行车需求。
    8、高通:骁龙888
    2020年12月1日,在夏威夷举办的骁龙技术峰会上,高通宣布推出最新一代的旗舰级SoC——高通骁龙888 5G移动平台及骁龙X60 5G基带,这是该公司首次在8系处理器中集成5G调制解调器。
    对于高通顶级 8 系列芯片组来说,骁龙 888 是第一次为 5G 做出重大改进:它最终将提供完全集成式的 5G 调制解调器,而不像骁龙 865(内部包含单独的调制解调器芯片)。
    骁龙 888 将采用高通2020年早些时候宣布的骁龙 X60 调制解调器,该调制解调器采用 5nm 工艺,以获得更好的功率效率,并改善 5G 载波聚合,跨毫米波 mmWave 和 6GHz 以下频段的频谱。支持全球多 SIM 卡,支持 SA 独立、NSA 非独立和动态频谱共享。在新的 5nm 架构和集成调制解调器带来的电源效率提升之间,新的芯片在 5G 方面似乎可以提供一些实质性的电池续航改进。
    除了 5G 改进之外,高通还预告了骁龙 888 将取得的其他几项进展,包括第六代 AI 引擎(在 “重新设计的”高通 Hexagon 处理器上运行)和第二代传感中枢,该引擎承诺在 AI 任务的性能和功耗效率方面有很大的跳跃。该公司承诺将达到 26 TOPS。在游戏方面,高通将推出第三代骁龙 Elite Gaming,还将带来 “高通 Adreno GPU 性能最显著的升级”,支持 144fps 游戏,桌面级渲染。
    最后,高通预览了骁龙 888 将实现的新摄影功能,包括由于更新的 ISP,支持更快的十亿像素级处理速度,用户能够以每秒处理27亿像素的速度拍摄照片和视频,即每秒捕获120帧且每帧都是1200万像素,高通表示,在图像处理方面比上一代快了 35%。
    9、杭州国芯:超低功耗AI芯片GX8002
    7月21日,杭州国芯推出超低功耗AI芯片GX8002,主要用于TWS耳机等智能穿戴设备。
    据报道,GX8002采用了MCU+NPU的架构,集成国芯第二代自研神经网络处理器gxNPU V200和平头哥CK804处理器。芯片支持多级唤醒,集成硬件VAD,可实现超低功耗待机和自动人声感应。通过NPU的强大能力,实现语音唤醒、指令识别、AI降噪、声纹识别等众多功能。
    而在功耗方面,GX8002在VAD待机时的功耗只有70μW,运行功耗为0.6mW。同时,GX8002可以根据用户是否说话自动切换VAD待机和工作两种模式,因此通过VAD的有效过滤,芯片日常使用的平均功耗基本低于300μW。
    10、百度:昆仑2
    2020年9月15日,在百度世界2020大会上,百度智能芯片总经理欧阳剑预发布了采用7nm 先进工艺的百度昆仑2,性能比百度昆仑1 提升3倍,还带有高速片间互联,多款细分型号,覆盖云训练、云推理以及边缘计算等优势。预计2021年上半年量产。
    小结:
    虽然我国人工智能企业在2020年推出不少AI芯片,但不可置否的是,虽然芯片数量多,但其更偏向于针对特定环境,同时与英特尔、英伟达等芯片相比,并未实现追平,更多的是“在某些指标的超越”。
    其次,芯片的发展与其他产业不同,其不仅仅需要多年的技术积累,同时还需要强有力的设计及制作能力,而我国大陆地区尚未实现全面突破。同时,基于美国的打压,我国芯片发展更是不断受阻——海思、中芯国际等世界领先的中国芯片企业面临众多困难。
    但就目前而言,我国AI企业面临的最大困难依然处于技术方面,如何进行突破,成为AI企业最大的难点。