车万翔教授:ACL 2010-2020 研究趋势总结

将门创投

    本周要跟大家分享的是来自TechBeat社区的一篇优质好文。本文中,车万翔教授从ACL的投稿及录用趋势,到各个研究领域的发展现状,都发表了自己的一些看法,希望对相关领域的研究者能有所帮助!
    导读:
    2020年5月23日,有幸受邀在中国中文信息学会青年工作委员会主办的AIS(ACL-IJCAI-SIGIR)2020顶会论文预讲会上介绍了ACL会议近年来的研究趋势,特整理成幻灯片配文字版,希望对相关领域的研究者有所帮助。由于视野所限,时间仓促,特别是ACL 2020的录用论文列表刚发布不久,因此统计的数据和得出的结论难免有失偏颇,如有不当之处,还敬请指出。另外,特别感谢组内的多位博士生帮助进行数据整理。
    首先来看一下2010年到2020年这11年来,ACL长文的录用情况和趋势,可以看出从2018年开始,投稿和录用的数量急剧上升,说明作为人工智能皇冠上的明珠,自然语言处理领域越来越受到研究界的关注。另外,ACL的录用率多年来基本保持稳定,一直在25%左右。
    
    再来看一下今年录用文章标题的词云,从中可以看出大家关注比较多的任务有生成、翻译、对话、问答、抽取、句法等方向,用到的方法多涉及到神经、网络、注意力、图等。另外,从文章作者的词云可以看出前几名的基本都是中国的大姓,这也反应出华人作者在ACL顶会上已经占据非常大的比例。
    
    为了更直观的了解近年来ACL各个研究领域的变化趋势,我们做了一个领域趋势竞赛图,帮助大家更好地看出各个研究领域此消彼长的变化过程。特别说明的是,我们的领域是参考ACL 2019进行划分的,由于其它年份的领域划分方式不尽相同,我们采用人工的方式进行了映射。另外,由于2020年目前只有文章列表,还没有领域数据,所以也是人工逐篇文章分的类,因此具有一定的主观性,有可能不是特别准确。
    从这段视频中,我们可以看到几个非常明显的趋势,比如人机对话等新兴领域上升势头迅猛,而句法分析、机器翻译等传统领域有所衰落。下面,就几个变化比较明显的领域分别加以介绍。
    人机对话异军突起
    2015年之前,ACL上几乎没有人机对话的文章发表,但是从2016年开始,随着语音识别技术的突破,NLPer开始重视人机对话的研究,今年ACL该方向上的研究重点和研究趋势如下图所示。
    
    机器学习持续热门
    可以看到近10年来,机器学习的热度一直居高不下,特别是随着预训练模型的成功,NLP模型大有被大一统的趋势。下面的一些机器学习研究方向为今年ACL所重点关注。
    
    
    
    1  2  3  下一页>