首届中文NL2SQL挑战赛启动，NLP打破数据库壁垒

2024.07.08 科技眼

    随着人工智能蓬勃发展，NLP等AI认知技术，也开始取得了积极进展，创新技术和应用不断突破，其中NLP在数据库交互，也逐步引起学界和工业界瞩目。
    6月3日，国内首届中文NL2SQL挑战赛正式上线启动。大赛由国内领先的智能语义公司追一科技主办，将发布全球首个中文数据集，向海内外高校学生、研究机构、企业开发者开放，共同推进NLP在数据库交互上的创新研究与普惠应用。

    据了解，本届NL2SQL比赛目标是利用NLP解决传统数据库交互问题，打通人与结构化数据间的壁垒，更有效地利用结构化数据，实现人机交互体验升级。涉及到结构化数据、文本等多个不同领域的多分类问题。追一科技将提供预处理好的数据集，并建立一个数据交换库，以实现数据驱动型学习。参赛者最终提交NL2SQL模型方案，在多个全新的测试数据集上盲测，按盲测的效果进行最终排名。
    “我们相信，随着NLP进入AI领域研究的焦点位置，越来越多场景将被解锁，并激发出创新的应用和商业模式。数据库的创新交互，将拥有巨大的潜力。”追一科技联合创始人兼CTO刘云峰表示，此次NL2SQL大赛，只是一个起点，追一科技作为智能语义领跑者，期待与更多NLP和AI开发者一起努力，不断探索NLP赋能新秘境。
    众多人工智能学术大咖将担任本次大赛评委，包括新加坡南洋理工大学副教授、博士生导师毛可智，南京大学教授、博士生导师俞扬，东南大学教授漆桂林等。整个NL2SQL赛制从2019年6月3日到9月中旬，共分为4个阶段，报名、线上初赛、复赛、总决赛线下答辩并颁奖。
    此次比赛，也是中文研究领域首次举办NL2SQL相关比赛。
    NL2SQL作为新兴的研究领域，在国外由SalesForce耶鲁大学等发布了WikiSQL和Spider数据集，但在国内市场，目前还处于起步阶段。
    作为智能语义领跑者，追一科技聚焦核心AI交互能力和周边技术，从语义到多模态机器人、从应用到技术平台、从算法到产品化工程化，形成技术能力聚变，以更加丰富完备的技术矩阵，构建起追一独特的竞争力，稳固企业服务NLP领域No．1领先地位，并不断抢占阅读理解、自动机器学习等前沿高点。
    在数据库交互应用上，除了NL2SQL等技术外，追一科技还在不断探索NL2SQL与阅读理解、文本挖掘、人机对话等技术融合，进一步挖掘结构化数据库价值，并积累了大量成果。此次大赛，有望进一步推动中文NL2SQL的研究和应用，让交互AI技术，激活更多场景创新，为企业、社会带来更大的价值。