首页 > 业界 > 关键词  > 模型最新资讯  > 正文

SQLCoder:将自然语言问题转化为 SQL 查询的先进模型

2023-08-23 10:10 · 稿源:站长之家

站长之家(ChinaZ.com)8月23日 消息:SQLCoder 是由 Defog.ai 开发的一款先进模型,用于将自然语言问题转化为数据库查询。它在通用 SQL 架构中表现出色,并且在针对特定数据库架构进行优化时,性能超过了 gpt-4。

image.png

项目地址:https://github.com/defog-ai/sqlcoder

SQLCoder 的模型大小适合在单个 A100-40GB 或8位量化的高端消费级 GPU(如 RTX3090/4090)上执行。评估 LLM 生成的 SQL 的机制也是开源的。评估 SQL 代码可能很困难,研究人员希望进行广泛、公开和可重现的测试,以推动开源文本到 SQL 系统的极限。

SQLCoder 的模型权重遵循 CC BY-SA4.0许可。该模型可供个人和商业使用。如果你改变了结果(例如通过微调),你必须按照相同的许可将这些改变发布为开源。

SQLCoder 是 StarCoder 的优化版本,使用了150亿参数。SQLCoder 已经在逐渐具有挑战性的手工创建的 SQL 查询上进行了微调。通过对数据库模式进行特定调优,它可以实现或超越 GPT-4的性能。

过去三个月,研究人员已经与医疗保健、金融服务和政府部门的企业客户一起使用 SQLCoder。对于那些在使用 LLMs 时不希望敏感数据离开他们的服务器的客户来说,自托管模型是唯一的选择。

核心功能:

1. 将自然语言问题转化为正确高效的 SQL 查询。

2. 快速而轻松地生成 SQL 查询。

3. 生成符合 SQL 规则的查询语句。

4. 可根据程序需求进行定制化修改。

举报

  • 相关推荐
  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

    本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估:1)核心能力对比,包括通用任务表现和特定领域专长;2)成本与效率,考量API调用成本和响应速度;3)本地化与数据安全,满足合规要求;4)生态与社区支持,关注开发者活跃度和文档完善度。为解决模型对比难题,推荐使用专业平台如AIbase模型广场,可一站式对比主流模型的多维参数和评测数据。通过系统化评估,开发者能更高效地选择契合业务需求的AI模型。

  • AI模型选型太耗时?三分钟精准匹配需求的多维对比库

    文章介绍了AI模型选择面临的三大痛点:模型爆炸式增长导致选择困难、信息碎片化增加搜集成本、多维度对比效率低下。针对这些问题,AIbase模型库(https://model.aibase.cn/llm)提供了解决方案:一站式聚合主流AI模型信息,实时更新模型状态;结构化表格直观对比核心参数;支持自定义筛选条件快速锁定目标模型。该工具能帮助开发者、产品经理和研究者节省前期调研时间,将精力集中在更有价值的应用构建和创新探索上。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • 刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器

    疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。 各大厂商你方唱罢我登场,昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们先后开源了数十款大模型。根据 Hugging Face 发布的中国 AI 社区七月开放成果,短短一个月开源模型总数达到了惊人的33款。 进入到八月,国产大模型「上新」的势头丝毫不减,重量�

  • 智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

    智元机器人合伙人在2025世界机器人大会上发表演讲,系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品,建成规模化生产线与训练场,并在算法领域实现多项创新。为解决数据难题,智元开源了AgiBot World百万真机数据集,并推出具身智能基座模型GO-1,该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念,通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具,并计划下半年发布新一代机器人AgiBot G2。过去一年,智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。

  • 昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

    2025年8月11日,昆仑万维启动SkyWork+AI技术发布周,将连续五天发布五大领域AI模型:视频生成模型Skyreels、世界模型、生图一体化模型、智能体(Agent)模型和AI音乐创作模型Mureka。首日发布的Skyreels-A3是全球首个支持分钟级长视频生成的模型,通过四大技术创新解决直播电商等场景痛点,可实现180秒连贯视频生成、影视级运镜控制与自然动作交互。该模型采用多模态协同生成范式,突破传统视频生成技术误差累积限制,并通过Step蒸馏技术将推理步数压缩至4步,生成时间缩短至80秒。商业化方面,昆仑万维已形成"研发-产品变现-现金流反哺"闭环,2025年Q1经营性现金流净额增长58.3%,旗下DramaWave、Mureka等产品年化流水分别达1.2亿和1200万美元。此次技术周标志着中国AI企业首次跑通规模化盈利路径。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • Anthropic天价赔款?大模型“盗版”的100000种花样

    ​AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。 这几乎是行业内公开的秘密。2023年,《纽约时报》一纸诉状将OpenAI和微软告上法庭,正式拉开了这场战争的序幕。很快,战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告,一时间,几乎所有头部玩家都被推上了被告席。 这场大模型与版权�

今日大家都在搜的词: