清华叉院“天才”入局大模型,创企获张一鸣押宝 引OpenAI警惕


    一个人的战斗力匹敌一个公司,这是一个怎样的人?
    2023 年大模型如火如荼,眼见业内他起高楼、他宴宾客,字节跳动在大模型上久不见动作,幕后操盘手张一鸣着了急。据传,在今年 3、4 月份,张一鸣疯狂见人补课 AI,其中,最为瞩目的是他频频请教“后生”杨植麟一举动。
    杨植麟是谁?简单来说,他是一个可怕的天才,师承中美 AI 大牛,中国顶尖的AI研究人员之一,作为队友让人安心,作对手让人忌惮。
    

    
    

    硅谷颇有名气的科技媒体 The Information 发起“谁将是中国 OpenAI ?”,候选榜单 Top.5 里面有 MiniMax(中科院一脉孵化)、智谱 AI(清华唐杰一脉)、光年之外(美团王慧文一脉)以及澜舟科技(创新工场李开复一脉),而另一个候选就是杨植麟,其他都是公司,而他是作为个人力量上榜。
    杨植麟最近刚成立一个新公司,公司名为“月之暗面”,业务聚焦 AGI(artificial general intelligence,通用人工智能),杨植麟持股 84.92%。此消息一出,各方资本激情下注,宝都压在了杨植麟身上。
    杨植麟其人
    高中时,毫无编程经验的杨植麟被选中参加奥赛,结果,他通过竞赛拿到保送清华入场券。
    保送专业受到限制,最开始杨植麟并非学计算机,直到大二他才如愿转去了卧虎藏龙的计算机系,师从 IEEE Fellow 唐杰。他所有程序设计课程均获得满分成绩,2015 年以年级第一名的优异成绩毕业。
    清华时期的杨植麟
    随后,他前往 NLP 研究全球排名第一的 CMU(卡内基梅隆大学)语言技术研究所(LTI),跟随苹果公司 AI 负责人Ruslan Salakhutdinov 和 Google AI 智能首席科学家 William W. Cohen 攻读博士学位。
    

    博导 Ruslan Salakhutdinov(最右)、杨(中)、博导William Cohen(最左)
    博士期间,他一度成为学术圈的风云人物——
    - 与图灵奖得主 Yoshua Bengio 合作发布「火锅问答」数据集HotpotQA。
    - 以一作身份发表 XLNet 与 Transformer-XL,在NLP领域产生重要影响,成为 NeurIPS 2019 与 ACL 2019 的最高引论文之一,谷歌学术引用次数直接破万......
    

        

        
        

        杨植麟的谷歌学术论文被引主页
        - 和众多学术明星合作论文,如 Yoshua Bengio(图灵奖得主,深度学习三巨头之一)、Yann LeCun(图灵奖得主,同为深度学习三巨头之一,差 Geoffrey Hinton 就凑齐了)、Quoc V. Le(Google Brain 创始人之一)、何恺明(Kaiming He,CV 之神不必多说)等。
        

        
        

        - 用了四年(2015-2019)从 CMU 博士毕业。一般来说,卡内基梅隆大学计算机专业的博士生往往要经过六年才能毕业。一名熟人形容他:“他是个天才,非常聪明。”
        毕业后,他得到了清华大学交叉信息研究院(大名鼎鼎的清华叉院)助理教授的职位,但是,天才怎么会局限于此呢?
        杨植麟在就业上从未给自己设限,不拘泥于大厂、研究所,抑或创业。杨植麟曾这样放话:“我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。”不难猜测,这条实现路径最好便是创业,亲自尝试无限可能。
        早在博二时(2016 年),杨植麟就开启了他和几位友人的第一次创业——创立循环智能(Recurrent.ai)。2019 年杨植麟毕业回国,负责纯算法研发,统领公司的产品经理队伍。2021 年,循环智能与华为云合作开发了千亿级 NLP 大模型盘古大模型,涉及 NLP、CV 等多个方向。
        

        
        

        循环智能创始人 F4:COO揭发、CTO张宇韬、CEO陈麒聪、杨植麟(左到右)
        在创业途中,杨植麟还抽身主导了智谱 AI(清华导师唐杰的公司)、智源研究院、清华研究团队的多个 AI 项目。
        ChatGPT 爆火之后,业内人也都盯着杨植麟的一举一动。有媒体爆料,去年年底他“消失”了两个星期,只身去了硅谷。一切对于自然语言的想象都在硅谷成倍的膨胀,这次硅谷归来,果然攒起一个新的打算。
        新公司“月之暗面”
        企查查显示,新公司名为“月之暗面”(“月之暗面”是摇滚史上最伟大专辑之一,杨植麟在学生时代组过乐队,公司名寄托着他独特的情怀),法人杨植麟,成立于今年 4 月 17 日,公司创始团队除杨外,还有 3 人。
        张宇韬,同为循环智能的联合创始人、CTO。张宇韬自清华大学计算机系博士毕业,和杨植麟师出同门,都是唐杰的学生——二人在清华大学 KEG 实验室(知识工程实验室)结识。张宇韬的研究方向是异构数据融合和知识图谱构建,在 KDD、CIKM等计算机顶会上发表多篇文章。
        周昕宇,清华大学 2011 级本科生,和杨植麟、张宇韬同为计算机系的学生。周昕宇在毕业后选择加入旷视,工作内容是算法量产。就职期间,他和旷视研究院基础科研负责人张祥雨一道,研究移动端模型,以共同一作的身份撰写 ShuffleNet 中了 CVPR 最佳论文。
        汪箴,毕业于复旦大学计算机科学系,后就读新加坡南洋理工大学计算机工程系,主要研究工作面向 AI 在鉴证科学上的应用。汪箴曾在 Google 担任高级软件工程师/技术主管、新加坡 AI 技术驱动独角兽领创集团(ADVANCE.AI)技术委员会负责人/技术副总裁,还有过投资机构的从业经历。
        周昕宇、杨植麟以及张宇韬一样同为清华计算机系出身,汪箴是四人中唯一没有清华背景的,但却有过投资机构从业经验。
        公司最大的股东是杨植麟,持股84.92%。显然,月之暗面也会是一家完全由他掌控的公司,各方投资完全是奔着杨植麟来的。新公司在 6 月份已获得红杉中国、真格基金、金沙江创投等机构的天使轮投资,市场估值被曝约在 3 亿美元。(据传,大量 VC 曾试图能够在项目早期联系上杨植麟商谈加入,杨植麟甚至没有通过这些带着钱找上门的好友请求。)
        为什么另外成立新公司?
        有读者会疑惑,既然“循环智能”也是杨植麟创立的,也有足够话语权,为什么不直接在“循环智能”搭好的台子上唱戏,偏要成立新公司?
        原因很简单,因为公司要融资。在被生成式 AI 搅得天翻地覆的 2023 年,“循环智能”主攻科技营销(SalesTech),业务想象空间有限,现有概念在投资人那已经卖不动了。
        “循环智能”并不差,只是 OpenAI 带来了改天换日般的冲击,直接冲垮了循环智能成立以来所遵循的参照系。比如,王慧文打着“打造中国 OpenAI ”旗号创办的“光年之外”,完成了 10 亿美元估值的融资,这样丰厚的融资数额引起了 AI 企业的焦虑,创始人和投资人都担忧起了明天,已经睡不好了。
        这轮生成式 AI 创业浪潮的估值已经有了新的坐标。杨植麟创立的第二家公司“月之暗面”目前的天使轮投后估值,已经超过了循环智能。
        循环智能没有太多的融资能力,ToB 的生意对杨植麟这样的头脑来说也太过拘束,他也需要一个更能放开手脚的地方。成立新公司是必然举措。如果把背后资本的角色加进来,这更像一次必须完成的二次创业,主角必须是杨植麟。
        一个天才被解放了手脚,是证明他自己的时候了。
        

        
        

        不过,这场跳出循环的新创业故事,其实与这家旧公司仍有联系。某种程度上,是一个“换壳”的故事。
        首先,新公司办公地址仍在循环智能的办公空间里。
        其次,原本在循环智能时期所带的技术团队,大多数跟随杨植麟去了新公司。
        另外,与杨植麟一起出现在月之暗面创始团队阵容中的张宇韬,并没有卸任循环智能 CTO 一职。
        可谓:人脉仍在、框架捡现成的、钱也在在路上了,杨植麟和他的“月之暗面”只等起飞。