首页 > 业界 > 关键词  > Octopusv2最新资讯  > 正文

斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4

2024-04-07 14:04 · 稿源:站长之家

划重点:

- 🔥20亿参数的 Octopus v2模型一夜下载量超过2k,受到开发者社区极大关注。

- 📱 Octopus v2在智能手机、汽车、个人电脑等端侧运行,超越 GPT-4的准确性和延迟表现。

- ⚡ Octopus v2比 Llama7B + RAG 方案快36倍,标志着设备端 AI 智能体时代的到来。

站长之家(ChinaZ.com)4月7日 消息:近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。

image.png

这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。Octopus v2还比 Llama7B + RAG 方案快了整整36倍,展示了端侧 AI 智能体的崛起。

Octopus v2的设计独特之处在于其函数性 token 策略,使其能够实现与 GPT-4相当的性能水平,同时大幅提高推理速度,超越基于 RAG 的方法,对边缘计算设备特别有利。模型在生成单独的、嵌套的和并行的函数调用时表现优异。为了训练该模型,研究团队采用了高质量数据集,并使用 Google Gemma-2B 作为预训练模型框架。训练过程中采用了完整模型训练和 LoRA 模型训练两种方法,展现了 Octopus v2在推理速度和准确性方面的优异表现。

在基准测试中,Octopus v2表现出卓越的推理速度,比 Llama7B + RAG 解决方案快36倍,在准确率上也超越了其他方案。这种效率和性能的提升归功于 Octopus v2的函数性 token 设计,使其成为端侧设备上极具竞争力的 AI 智能体。设备端 AI 智能体时代即将到来,Octopus v2的发布为这一趋势注入了新的活力。

论文:https://arxiv.org/abs/2404.01744

产品入口:https://huggingface.co/NexaAIDev/Octopus-v2

举报

  • 相关推荐
  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 苹果新配件iPhone Pocket 1299元起售

    苹果公司与三宅一生合作推出iPhone收纳包配件“iPhone Pocket”,11月14日正式发售。产品以“一块布”为设计灵感,采用3D针织一体结构,适配所有iPhone型号,可收纳钥匙、卡片等小物,支持手提、系包或贴身佩戴。短带款售价1299元(八色可选),长带款1899元(三色可选)。高定价引发争议:部分用户赞赏其设计独特性,认为联名值得购买;更多网友质疑性价比,称其为“智商税”。产品命名因与华为折叠屏手机“华为Pocket”相近,一度引发消费者误解,相关话题冲上热搜。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 50人团队、1亿美元ARR,AI PPT还在续写“神话”?

    AI 生成 PPT 可以说是去年的热门赛道,尤记得关于这类产品是否具有真正竞争力的热烈讨论,而2025年9月份的数据显示,赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且,今天官宣了由 a16z 领投的6800万美元 B 轮融资,融资后估值达到21亿美元。 而不仅 Gamma,根据 AI 产品榜数据,9月份,AIPPT 赛道的 Top3产品流量平均涨幅30%+,更有一款

  • 1299元起售!iPhone Pocket发布:采用3D 针织一体结构

    今日下午,苹果发文称,三宅一生携手苹果正式推出新配件iPhone Pocket。 其中短带款提供八种色彩外观:柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。 长带款提供三种色彩外观:宝石蓝色、肉桂色和黑色。 短带款iPhone Pocket售价为1299元,长带款售价为1899元。

  • iPhone Pocket被吐槽像保温水瓶套 网友:韭菜太好割

    苹果联合日本设计师品牌三宅一生推出iPhone Pocket配件,售价1299元。产品采用3D针织工艺,支持七种佩戴方式,但被质疑与普通手机套功能无异。社交媒体上“1299元买块会变形的布”引发热议,消费者对比9.9元帆布手机套直指苹果收割粉丝。支持者认为定价符合奢侈品逻辑,反对者则拒绝为设计概念支付溢价。该产品在设计价值与实用功能间引发两极争议。

  • 新品预售 | Switch 2专属卡皇!佰维 ME300 Express高速存储卡首发

    随着Switch2性能提升,玩家对存储卡速度和容量需求升级。佰维推出专为Switch2设计的ME300 microSD+Express高速存储卡,采用SD7.1新标准,读取速度高达900MB/s,写入速度800MB/s,提供1TB超大容量。该卡能大幅缩短游戏安装、加载时间,确保流畅体验,支持4K输出和掌机模式高帧率渲染。ME300兼顾现有设备兼容性与未来扩展性,现已开启预售,提供三种容量选择。

今日大家都在搜的词: