首页 > 业界 > 关键词  > Gorilla最新资讯  > 正文

微软大语言模型Gorilla在编写 API 调用方面击败了 GPT-4

2023-08-11 10:51 · 稿源:站长之家

本文概要:

1. 微软研究人员开发的 Gorilla 是一种大语言模型,能够准确生成 API 调用。

2. Gorilla 通过减轻幻觉问题和适应文档更改,在测试中表现优于 GPT-4等其他语言模型。

3. Gorilla 已在 GitHub 上提供代码、模型、数据和演示,并计划扩展到更多领域。

站长之家(ChinaZ.com)8月11日 消息:最近,加州大学伯克利分校和微软研究院的研究人员共同开发了一种名为 Gorilla 的大型语言模型。与其他语言模型相比,Gorilla 在生成准确的 API 调用方面表现出色。

据了解,该模型基于 LLaMA(Learning Language Models with Limited Human Feedback)方法进行训练,通过减轻幻觉问题和适应测试时的文档更改,取得了比最先进的语言模型 GPT-4更好的性能。

在测试中,Gorilla 展示了它在生成 API 调用方面的优势。通过对大量数据集进行训练,包括来自 Torch Hub、TensorFlow Hub 和 Hugging Face 的数据,Gorilla 能够生成准确且符合要求的 API 调用。这对于开发人员和软件工程师来说是一个巨大的进步,因为他们可以使用 Gorilla 生成准确的 API 调用,从而节省了编写和调试代码的时间和精力。

Gorilla 的代码、模型、数据和演示已经在 GitHub 上提供,这使得其他开发人员可以使用和探索这个强大的工具。

此外,研究人员计划将 Gorilla 扩展到更多的领域,例如 Kubernetes、GCP、AWS 和 OpenAPI。这将进一步提高 Gorilla 的适用性和实用性,并为开发人员提供更多的选择和便利。

从测试来看,Gorilla 是一个具有巨大潜力的语言模型,它在生成 API 调用方面表现出色。通过减轻幻觉问题和适应文档更改,Gorilla 能够产生准确且符合要求的 API 调用,为开发人员节省了时间和精力。

image.png

项目网址:https://github.com/gorilla

举报

  • 相关推荐
  • DeepSeek崩了引热议 官方深夜回应:网页/API已恢复

    8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。 许多网友也通过微博话题#DeepSeek崩了#反馈服务异常。

  • 八年深耕铸就“即刻精彩”,HOLLYLAND猛玛2025秋季新品发布会前瞻

    猛玛将于2025年8月26日举办品牌战略暨秋季新品发布会,系统呈现其全球战略布局与技术成果。深耕无线音视频领域八年,猛玛致力于打造全球创作者信赖的“创作底座”,通过技术创新降低专业设备门槛,推动创作工具智能化与普惠化。发布会将首次系统阐释品牌使命“科技助力轻松表达,丰富人类精神世界”,并带来秋季重磅新品,展现对创作全流程需求的深入覆盖。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • GPT-5横空出世:API最低0.40美元,人人享“博士级智慧”

    OpenAI正式发布新一代旗舰模型GPT-5,CEO奥尔特曼称其智能水平如同与博士级专家对话。该模型在写作、编码、医疗等核心领域表现突出,幻觉率大幅降低80%,输出token数量减少50%-80%。GPT-5系列包含多个版本,其中GPT-5nano的API价格低至0.4美元/百万token,极具竞争力。基准测试显示GPT-5以68分位居榜首,超越Grok-4等对手。OpenAI同时宣布向所有用户开放使用,并计划升级语音模式,探索

  • “Nerd之王”做的App,不到一个月登顶美国总榜

    本周,一款名为 Focus Friend 应用冲榜,笔者撰稿期间看着其先后超过 Grok、Google、ChatGPT,登顶美国 iOS 下载总榜。

  • 功能不“性感”,也能月入千万,工具App重新迎来窗口期?

    随着直播、短视频、AI 等新潮应用陆续爆发,工具类的热度似乎在逐渐降温。但社媒平台和榜单情况来看,却显示出另一番样貌。在 TikTok 上,以“iPhone storage”为标签的短视频达到了1.3万个,与之对应的是美国 iOS 工具畅销榜长期被一款清理工具占据榜单 Top1,类似的情况也出现在其它工具品类,海外用户为“找不到遥控器”买单、为识别花草长期订阅。它们看似“不性感”,

  • 从头像到乐队,Soul App的数字文创的次元突破

    社交平台Soul推出"NOISE宇宙噪点"数字文创系列,以虚拟乐队为载体,将宇宙微波背景辐射转化为可交互的数字社交体验。该系列延续原IP"莫比乌斯",推出由四位虚拟乐手组成的新乐队,融合电子摇滚与实验噪音音乐。项目通过AI虚拟偶像互动、换装玩法等形式,为用户提供表达与共鸣空间。Soul将Z世代情绪比作宇宙信号,通过数字头像、音乐作品等具象化呈现,构建"创作-互动-情感共鸣"的内容生态。数据显示,61.38%的年轻人通过兴趣社交获得情绪满足,平台持续加码数字文创战略,精准把握Z世代对Y2K、摇滚等潮流元素的喜好。在算法驱动时代,该项目展现了科技守护人性微光的社交哲学。

  • 卢伟冰回应格力能否接入米家App:技术上没问题

    今日,小米米家App宣布,西门子家电正式接入米家App,支持小米澎湃智联、超级小爱控制等功能。 小米集团总裁卢伟冰表示,欢迎更多的家电品牌接入米家,一起加速传统家电的智能化,让更多用户更早地体验到智能科技所带来的美好生活。” 有网友向卢伟冰提问:格力能接吗”,卢伟冰回复称技术上没问题”。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

今日大家都在搜的词: