首页 > 业界 > 关键词  > 大语言模型LLM最新资讯  > 正文

新视角! 研究发现:大语言模型通过阅读文档学会使用工具

2023-08-07 11:09 · 稿源:站长之家

本文概要:

1. 研究发现,语言模型通过阅读文档成功学会使用工具,甚至能够发明新的方法。

2. 使用文档训练的模型在零样本性能上与仅使用演示训练的模型相当甚至更好。

3. 通过阅读文档,语言模型可以学习复杂的图像处理和视频跟踪功能。

站长之家(ChinaZ.com)8月7日 消息:根据一篇新的研究论文,语言模型可以通过阅读工具和API文档来学习使用工具,并在某些情况下甚至发明新的方法。与传统的通过演示训练的方法相比,仅使用文档的模型在零样本性能上表现相当或更好。

该团队使用文档和演示对六种不同任务的多个模型进行了训练,并比较了它们的性能。仅使用文档,零样本性能等于或优于仅从演示中学习的模型。然后,在扩展到包含200个工具的数据集后,第一个模型的性能显着优于第二个模型。

在图像处理领域,该模型能够通过学习新的、最先进的图像处理模块的文档来执行复杂的图像处理和视频跟踪功能,而无需进一步演示。该团队特别强调,该模型能够重现最近发布的图像处理技术,例如 Grounded-SAM 和 Track Anything 的视频跟踪,展示了该方法在自动知识发现方面的潜力。

image.png

论文指出:“总的来说,我们通过关注LLM的内部规划和文档推理能力,而不是通过演示明确指导他们的行为,揭示了LLM使用工具的新视角。”

这项研究揭示了阅读文档对于语言模型学习工具使用的重要性,以及文档对于扩展和自动知识发现的潜力。

举报

  • 相关推荐
  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • APOLLO年中展望:在滞胀的十字路口——下一步是什么?

    美国关税政策调整引发经济波动。特朗普政府推行的新关税制度使平均关税率升至15.8%,为近90年来最高水平,加剧市场不确定性。经济学家预测经济增长放缓、通胀上升,利率将长期维持高位。企业投资计划波动加剧,消费者信心下滑,预计2025年美国GDP增长仅1.2%。尽管衰退概率上升至25%,但专家认为短期内不会出现全面衰退,供需双方均面临阻力。全球经济增长预期下调至2.6%,低于此前3%的预期。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 淘宝直播请call赵露思

    今年的暑假大戏,赵露思直播告一段落。 截至目前,距离她上次公开直播已经过去了十余天,她的社交动态也基本停留在这一刻暂未更新。就在8月19日直播中,赵露思首次表态,表示“现在很愿意做网红”,这一宣言并非偶然,就在前一天,她注销了拥有3119万粉丝的微博账号,彻底切断传统明星的流量锚点。

  • 中国品牌四登苹果发布会!SmallRig亮相发布会助力iPhone 17 pro系列影像功能

    SmallRig斯莫格于9月10日推出专为iPhone 17 Pro系列设计的专业拓展配件,与新品同步发售。该系列以全面化、模块化、专业化的拓展系统为核心,旨在释放iPhone影像潜能,提升手机影像创作体验。产品采用快拆式设计,支持快速切换组件,覆盖从日常拍摄到专业创作的多样化需求。该品牌曾多次亮相苹果全球发布会,产品获官方认可,在全球用户中具有较高认可度。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

今日大家都在搜的词: