Syntiant:疫情挡不住AI芯片的热潮
电子工程世界尽管疫情导致许多企业倒闭,但对无晶圆厂半导体企业而言,情况基本与往常一样,只是提供了一些补贴。在与人工智能处理器公司Syntiant首席执行官Kurt Busch的谈话中,他透露,他们 正在全速进行客户合作,并测试其第二代硅芯片。
Busch表示:“这是一个非常有趣的时刻。当我们第一次开始居家办公时,我很担心……我以为目前的(客户)合作可能会放慢脚步,但他们肯定会继续下去,我不知道在没有面对面的情况下,新的合作是否会奏效,但事实证明,我们能够远程地与客户和合作伙伴达成新合作。”
Syntiant是一家超低功耗人工智能处理器初创公司,最近从晶圆厂收到了第二代硅芯片,但它能够带回样品并开始远程测试。根据Busch的说法,公司在1小时13分钟内就完成了新硅材料的安装和运行。
Syntiant的设备使用的是性价比较高的树莓派(Raspberry Pi) 电路板,作为被测硅的网络接口,通过SPI和树莓派上的其他接口连接到芯片上。该装置中的传感器通过产生音频、视频、振动或其他条件远程触发,以测试芯片。目前,有几十个芯片正在以这种方式进行测试,工程师可以远程编写软件和调试。
“我们可以远程完成90%的结转工作。Busch:“除了有些你必须进行身体测量的工作,为保持社交距离我们只派一个人去。我们已经能够远程制造出相当复杂的硅片;在我们公司之前没有人这样做过,这对我们来说是全新的。”
神经决策处理器
Syntiant是最早为边缘应用(而不是使用多核DSP或ARM核)构建神经网络处理器的公司之一。它的第一代架构是基于内存或内存附近的计算、大规模并行操作和适度的精度(Syntiant的第一代芯片可以处理机器学习推断中常见的4位或8位计算)。
“我们构建的是一个数据流架构,其中乘法和累加与内存紧密耦合。所以在我们的设备内部几乎没有内存移动。所有的存储都在里面。”“我们建立了这个基本并行的架构,精度也不高,它是8位的,内存与乘法累加紧密耦合,以极大地减少内存消耗。”
在软件方面,编译器步骤是不允许的。大多数具有新颖架构的AI处理器公司都在构建能够将代码从TensorFlow或Keras传输到在其处理器上运行的东西的编译器,这可能是一个巨大的挑战。
Busch:“编译器的步骤,试图让你编译的代码与你在TensorFlow中看到的匹配。最近有一场编译器选美比赛正在进行,评选谁的编译器做得最好。”“我们完全忽略了这一点——你在TensorFlow中看到的就是硅,我们只是把重量直接装载到设备中。”
超低功率
2017年,Syntiant在人工智能领域还处于萌芽阶段,联合创始人为其硅架构申请了18项专利。2017年10月,英特尔牵头的a轮融资,以及微软牵头的b轮融资,共融资3000万美元。这足以让Syntiant在5个月内完成重新检测,并在8个月内取回样品。
最终一个极低功率的芯片大功告成。Busch表示,与基于Arm m4的设计相比,Syntiant的芯片在语音工作负载方面的能效提高了200倍,吞吐量提高了20倍。芯片消耗有功功率低于140w。
Busch:“由于我们并不是按照传统工艺制作的,它的模具尺寸更小,所以在功率、性能和成本上这三个方面都有竞争力。但是天下没有免费的午餐。我们的芯片只做深度学习。它不会做任何其他事情。”
Syntiant于2019年9月获得首批生产订单,并被设计用于手机、智能音箱、耳塞和手表。其中90%以上的应用程序使用NDP10x进行语音识别,例如语音命令和尾迹词检测,而有些应用程序则进行更一般的声音检测(例如枪响或玻璃破碎)。Busch介绍,还有一些公司在使用音频领域之外的芯片,用于传感器应用,这些应用使用加速计、气体探测器、振动传感器或红外传感器进行人体检测。
Syntiant的第一代芯片,NDP100正在生产中。第二代硅芯片将于2020年第四季度问世
产品代码
Busch:“从目前的市场状况来看,很少有公司发布了生产机器学习模型。我们只有极少数客户自己做过,并获得了生产级代码。你可以在一小时内获得演示级代码。但是生产水平的机器学习,尤其是在嘈杂的环境下学习wake words,这是一种在市场上不太为人所知的技能。”
Syntiant因此提供了可生产的、经过训练的神经网络模型。他们还提供NDP10x的培训和开发工具包,但很少有客户建立了生产机器学习管道,很少有人能够利用它。相反, Syntiant已经投资于数据收集、清理和准备培训其内部模型。
1 2 下一页>