腾讯云小微提出的CQR-SQL模型,在年12月、年4月先后取得国际权威榜单SparC榜单和CoSQL榜单两项第一名的成绩。
云小微NL2SQL取得两大榜单第一
SparC和CoSQL是美国耶鲁大学于年陆续发布的面向对话交互场景的大规模多表匹配NL2SQL数据集,是目前对话交互场景下表格语义解析任务公认的最难最复杂的测试基准(benchmark),吸引了来自微软、Salesforce、Facebook、阿里巴巴等国内外知名企业和北大、华盛顿大学以及Yale等国内外知名高校提交测试结果,竞争十分激烈。
其中SParC数据集有个对话,1.2万多个单独问题,每个对话平均4-5个子问题,涵盖个领域的个复杂数据库。CoSQL数据集有3,个对话,且在交互过程中增加了拒识、澄清等轮次,平均对话轮次更多,更加考验模型对上下文的理解。
某写字楼租赁中介,向客户讲解当前北京市海淀区中关村软件园租赁情况时,被问到:北京中关村软件园各写字楼每一层的租赁情况、可覆盖的工位数、保洁人员配比如何?
某汽车经销商与某地出租车公司在召开线上会议时,客户问道:这个品牌的汽车返修率与交付平均周期如何,与行业数据对比如何?
某仓储货运集团在天津有一个国际物流港,如何根据市场行情和客户要求,及时通知一线人员进行发货囤货等货运周转操作,并通过人机对话方式实时将关键数据信息进行同步?
当用户面对这些问题时,希望得到的是及时且准确的回答和互动,但人类大脑记忆和运转效率是有限的,这时就需要拥有着海量数据库和数据提取分析能力的计算机发挥作用。然而,这个过程中最大的难点是,如何把完全遵从于用户视角和语言习惯的问题表述,高效转化为机器的分析语言请求,从而让用户通过简单的提问方式,即可获取全面的、准确的数据洞察分析结果。
人们长期以来都在追求,实现用自然语言与计算机的顺畅有效通信,即自然语言处理。自然语言处理是体现语言智能十分关键的技术,推动着人工智能体系的进步。近年来,腾讯云小微AI团队重点
转载请注明:http://www.0431gb208.com/sjsbszl/2323.html