首届中文NL2SQL挑战赛启动,NLP打破数据库壁垒

科技眼

    随着人工智能蓬勃发展,NLP等AI认知技术,也开始取得了积极进展,创新技术和应用不断突破,其中NLP在数据库交互,也逐步引起学界和工业界瞩目。
    6月3日,国内首届中文NL2SQL挑战赛正式上线启动。大赛由国内领先的智能语义公司追一科技主办,将发布全球首个中文数据集,向海内外高校学生、研究机构、企业开发者开放,共同推进NLP在数据库交互上的创新研究与普惠应用。
    
    据了解,本届NL2SQL比赛目标是利用NLP解决传统数据库交互问题,打通人与结构化数据间的壁垒,更有效地利用结构化数据,实现人机交互体验升级。涉及到结构化数据、文本等多个不同领域的多分类问题。追一科技将提供预处理好的数据集,并建立一个数据交换库,以实现数据驱动型学习。参赛者最终提交NL2SQL模型方案,在多个全新的测试数据集上盲测,按盲测的效果进行最终排名。
    “我们相信,随着NLP进入AI领域研究的焦点位置,越来越多场景将被解锁,并激发出创新的应用和商业模式。数据库的创新交互,将拥有巨大的潜力。”追一科技联合创始人兼CTO刘云峰表示,此次NL2SQL大赛,只是一个起点,追一科技作为智能语义领跑者,期待与更多NLP和AI开发者一起努力,不断探索NLP赋能新秘境。
    众多人工智能学术大咖将担任本次大赛评委,包括新加坡南洋理工大学副教授、博士生导师毛可智,南京大学教授、博士生导师俞扬,东南大学教授漆桂林等。整个NL2SQL赛制从2019年6月3日到9月中旬,共分为4个阶段,报名、线上初赛、复赛、总决赛线下答辩并颁奖。
    此次比赛,也是中文研究领域首次举办NL2SQL相关比赛。
    NL2SQL作为新兴的研究领域,在国外由SalesForce耶鲁大学等发布了WikiSQL和Spider数据集,但在国内市场,目前还处于起步阶段。
    作为智能语义领跑者,追一科技聚焦核心AI交互能力和周边技术,从语义到多模态机器人、从应用到技术平台、从算法到产品化工程化,形成技术能力聚变,以更加丰富完备的技术矩阵,构建起追一独特的竞争力,稳固企业服务NLP领域No.1领先地位,并不断抢占阅读理解、自动机器学习等前沿高点。
    在数据库交互应用上,除了NL2SQL等技术外,追一科技还在不断探索NL2SQL与阅读理解、文本挖掘、人机对话等技术融合,进一步挖掘结构化数据库价值,并积累了大量成果。此次大赛,有望进一步推动中文NL2SQL的研究和应用,让交互AI技术,激活更多场景创新,为企业、社会带来更大的价值。