人工智能的发展可能会对芯片行业带来哪些变革影响?

温戈

在聊人工智能对芯片行业可能带来的变革之前,先从一个从业者的角度聊聊AI对工程师的影响。
    这是我邮件的签名(打码了部分信息),可以看到有一栏是“Ask my assistant”,这就是我创建的一个我自己的数字分身的入口。
    
    点击这个链接,就会跳转到一个对话网页,你就可以和一位虚拟的工程师对话,你可以问它问题,要求它协助你解决工作上的问题,我特别希望每一个发邮件给我的人能先联系我的数字分身。
    我的数字分身它学习了我过往积累的技术知识和解决问题的经验,并且不断地在更新。这样做是因为,我发现在工作中的相当一部分时间,大概有30%~50%,我都是在帮助别人解决问题,对于在企业的员工来说,无非就是通过出卖自己的时间来赚钱,那么除了卖自己更多的时间外,如何节省自己的时间也非常重要,AI就可以帮助我做到这一点。尽管多数人有问题还是会直接给我发邮件,但我也慢慢的在向其他人介绍我的数字分身。
    芯片是AI的底层硬件基础,AI也在反哺芯片的设计和制造。
    AI给芯片行业带来的第一个变革影响就是芯片设计的智能化。
    这两年的芯片行业论坛几乎无法脱离AI的主题,尤其是EDA公司,比如Synopsys的 DSO.ai,Cadence的Cerebrus。
    AI可以通过机器学习和深度学习算法来加速芯片的设计过程。例如,自动布局布线(Place and Route, P&R)、逻辑综合等步骤可以利用AI进行优化,从而减少设计周期并提高效率。通过AI预测模型,可以在设计早期阶段识别潜在问题,避免后期昂贵的修改。
    对于AI芯片设计,备受关注的则是AlphaChip,AlphaChip是Google基于深度强化学习(Deep Reinforcement Learning, DRL)技术开发的系统,用于自动化芯片布局设计。
    事实上,早在2020 年,Deepmind 就已发布预印本论文《使用深度强化学习的芯片布局》,介绍了用于设计芯片布局的全新强化学习方法,我在《了不起的芯片》中人工智能与芯片设计那一章节也有介绍。
    AlphaChip通过对现有的芯片版图设计进行学习,并优化布局过程,进而提升设计效率。AlphaChip还会针对功率、性能和面积(PPA)等指标进行优化,并输出概率分布,显著缩短了设计周期。对这种超大规模芯片的布局绕线等繁琐的设计,非常适合让AI去做。工程师需要花数周才能完成的工作,AI只需要花几个小时。
    下面左图为零样本下AlphaChip布局开源Ariane RISC-V CPU的结果,右图为基于预训练策略(设计20个TPU)微调的效果。
    
    据我所知,目前超大规模的芯片设计,在整个设计周期中基本都借助AI来进行一些辅助工作。
    那么问题来了,AI会不会抢工程师的饭碗?我的答案是短期内(5年)不必有此顾虑,AI还不具备超大规模芯片的设计和全局优化能力,业界头部公司也不会把自己的芯片设计数据拿去给开源模型进行训练。而作为工程师或者行业从业者,理解并善用AI工具将成为职场中不可或缺的技能。利用AI进行设计不仅能显著提升工作效率,还能为自己的能力背书。对于广大职场人士来说,我强烈建议大家积极学习并运用这些先进的生产力工具。借助AI作为创作助手来提高创意和设计效率,做一个站在科技前沿的职场达人。
    AI给芯片行业带来的另一个变革影响就是它推动了芯片架构的革新
    区别于传统的CPU架构,各种xPU AI芯片为了处理AI相关的任务,都在架构上做了一些变化,为了更高效地执行机器学习任务,尤其是深度神经网络中的大规模矩阵运算,业界开发了专门针对这些任务优化的硬件。例如,NVIDIA的GPU(图形处理器)最初设计用于图形处理,但其并行计算能力使其成为训练深度学习模型的理想选择。随着需求的增长,NVIDIA推出了专门为AI设计的Tensor Core GPU。另一个例子是Google的TPU专为加速TensorFlow等机器学习框架中的操作而设计。TPU在处理特定类型的AI工作负载时比传统的CPU或GPU更高效。
    从商业的角度,AI也让芯片这个被很多人认为是“夕阳”的行业重新焕发生机。
    AI PC,iPhone 16,大模型训练,自动驾驶等AI需求,也给芯片公司带来了不错的业绩,各家芯片公司也是瞄准了AI这块大蛋糕。从公开资料获得的主要芯片公司的路线图可以看出,对AI芯片的布局和投入只增不减。
    
    AI虽好,但是对于芯片这样一个技术密度极高的行业,在很多方面都有局限性,比如:
    数据质量:AI要学得好,得有大量的高质量数据才行。但在芯片设计里,找到能准确反映各种复杂情况的数据集挺难的。如果数据不够或者不准,AI就可能出错,给出的设计建议也不靠谱,最后做出来的芯片可能会有问题。
    复杂算法:开发能够应对各种复杂设计情况的强大AI算法是个大难题。AI得能在不断变化的设计环境中适应,处理预料之外的问题。有时候,面对特别复杂的或有变化的情况时,这些算法可能很难给出准确的预测或建议。
    可解释性:AI很多时候像是个“黑盒子”,让人搞不懂它到底是怎么想的。要知道为什么AI推荐某个设计方案很重要,这样才能验证和接受它的建议。如果解释不清楚,人们就会对AI做的决定不太信任,工程师也难以理解和验证AI的选择。
    工具集成:把AI技术整合到现有的EDA工具里也是个难题。兼容性问题和需要合作开发新工具都可能让这个过程变得不顺利。工具整合上的困难可能会拖慢AI在芯片设计中的应用速度,并限制它改善现有流程的效果。
    人工智能和芯片两个领域已经深度融合,芯片加速AI发展,AI反过来又推动芯片进步总结起来就是:训练最好的芯片设计算法→用它设计更好的AI芯片→用这些芯片训练更好的模型→再设计更好的芯片→……就连谷歌的DeepMind CEO Hassabis都在twitter调侃:这下逻辑闭环了。