Google推出Gemini-SQL2,自然语言转SQL查询,数据分析更简单
数据问答场景,但难点在于表结构理解、字段歧义和复杂业务规则。33.4GB,还包含脏数据与外部知识需求,因此比早期基准更接近真实企业使用环境,评测难度也更高。在实际场景下,业务人员可以通过该模型自助式分析,可直接用自然语言查询营收、流失和区域表现。接口、模型卡或技术报告,也未确认哪些产品会率先接入。
自然语言查数据库终于不再鸡肋
6月12那日, Google宣称推出Gemini – SQL2模型, 此模型是以Gemini 3.1 Pro为基础精心打磨造就的。该项技术使得使用者用不着去书写SQL代码, 仅仅借由以口语化方式表述需求, 系统便能够自行生成可以运行的数据库查询语句。于数据分析师以及业务工作人员而言, 这兴许是降低数据运用门槛的关键一步。
核心难点在于表结构和字段歧义
Text-to-SQL技术看上去好像挺简单, 然而实际上要落地的话却困难重重, 数据库里面的表结构很复杂, 字段命名常常存在歧义, 就比如“日期”字段, 它有可能指的是下单日期, 也有可能是发货日期, 又或者是退款日期, Gemini-SQL2借助更精准的模型训练, 在理解表关系以及解析业务规则方面有了显著的进步。
BIRD榜单验证真实能力
Gemini – SQL2于BIRD文本转SQL评测基准的单模型赛道当中, 获取到80.04%的执行准确率, 此准确率超过了谷歌先前的Gemini – SQL。BIRD涵盖95个数据库, 还有37个专业领域以及12751组问题与SQL的配对, 其总数据量达到33.4GB , 其中包含脏数据以及外部知识需求, 相较于早期基准, 更趋近于真实企业环境。
业务人员可直接用自然语言查询
实况情景之中, 从事业务的人员没再存有依靠信息技术部门撰写结构化查询语言的需求了。举例来讲, 身为市场经理能够径直询问“上个月华东地区营业收入降低幅度最大的产品是哪一款”, 系统会自动生成与之对应的结构化查询语言并给出相关结果。自我服务式分析在营业收入查询、客户损耗分析以及区域表现比较等情景里变得具备可操作性了。
企业级应用场景广泛
这项技术适用于多个领域, 这些领域包括数据分析、自助报表、企业搜索以及SaaS数据问答等。企业用户能够在内部BI工具里嵌入该模型, 如此一来非技术人员也能够快速获取数据洞察。特别是于电商、金融以及制造业而言, 日常查询需求时常出现, 降低沟通成本这一价值显著。
谷歌尚未公布具体产品计划
如今, 谷歌并未去公布Gemini – SQL2的模型标识, 也没有公布其API接口, 还未公布模型卡或者技术报告, 并且也未曾确认哪些产品会首先接入, 这意味着企业用户当下没办法直接去调用该模型, 然而, 从技术指标方面来看, 它已然是接近商用水平了, 预计后续会渐渐集成到谷歌云和大数据产品里头。
竞品对比显示明显优势
其他Text-to-SQL方案与之相比, Gemini-SQL2在复杂查询以及脏数据处理方面展现出更稳定的态势。此前谷歌的Gemini-SQL准确率已然较高, 然而新模型在BIRD榜单上再度提升超过3个百分点。对于那些日均处理大量查询的企业来讲, 每1%的准确率提升都能够减少大量的人工纠错成本。
当下, 你是不是乐意试着运用自然语言去替换SQL来查询公司的数据库呢? 欢迎于评论区去分享你的实际运用体验, 点赞并且转发从而让更多的人知晓这个技术的进展情况。