Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源

2023-12-08 10:18 · 稿源：站长之家

**划重点:**
- 🚀 Stability AI发布StableLM Zephyr3B，3B参数的大语言模型，优化用于聊天应用，包括文本生成、摘要和内容个性化。
- 🔍 新模型比之前的7B模型更小更快，可在更广泛的硬件上部署，资源占用更低，同时提供快速响应。
- 🌐 使用直接偏好优化（DPO）训练，结合优化的数据集，StableLM Zephyr3B在性能评估中表现出色。

站长之家（ChinaZ.com）12月8日消息:Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名，但这已不再是该公司的全部业务。

最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型，专为聊天应用场景进行了优化，包括文本生成、摘要和内容个性化。这款新模型是Stability AI早在今年四月首次提及的StableLM文本生成模型的较小、优化版本。

StableLM Zephyr3B的承诺在于，它比7B的StableLM模型更小，带来了一系列好处。由于体积更小，它可以在更广泛的硬件上部署，占用更低的资源，同时仍然提供快速响应。该模型经过优化，特别适用于问答和指令跟随类型的任务。

Stability AI首席执行官Emad Mostaque表示:“相对于以前的模型，StableLM经过更长时间、更高质量数据的训练，例如与LLaMA v27b相比，尽管体积只有其40%，但在基础性能上却能够匹配。”

StableLM Zephyr3B并非全新模型，而是Stability AI定义的现有StableLM3B-4e1t模型的扩展。Zephyr的设计方法受到HuggingFace的Zephyr7B模型的启发。HuggingFace的Zephyr模型是在开源MIT许可下开发的，旨在充当助手。Zephyr采用一种称为Direct Preference Optimization（DPO）的训练方法，StableLM现在也受益于这一方法。

Mostaque解释说，Direct Preference Optimization（DPO）是一种替代以前模型中使用的强化学习的方法，用于调整模型以符合人类偏好。DPO通常用于更大的70亿参数模型，而StableLM Zephyr是首批在更小的30亿参数大小中使用该技术的模型之一。

Stability AI使用了来自OpenBMB研究组的UltraFeedback数据集进行DPO。UltraFeedback数据集包含超过64，000个提示和256，000个响应。DPO、较小的体积和优化的数据训练集的组合为StableLM提供了在Stability AI提供的指标中表现出色。例如，在MT Bench评估中，StableLM Zephyr3B能够胜过包括Meta的Llama-2-70b-chat和Anthropric的Claude-V1在内的更大模型。

StableLM Zephyr3B是Stability AI近几个月推出的一系列新模型之一，该初创公司继续推动其能力和工具的发展。虽然公司忙于进入不同领域，但新模型并没有让Stability AI忘记文本到图像生成的基础。上周，Stability AI发布了SDXL Turbo，作为其旗舰SDXL文本到图像stable diffusion模型的更快版本。

Mostaque还明确表示，Stability AI还将推出更多创新。他表示:“我们相信，针对用户自己的数据进行调整的小型、开放、性能良好的模型将胜过更大的通用模型。随着我们新的StableLM模型的未来全面发布，我们期待进一步实现生成语言模型的民主化。”

（举报）

相关推荐

关键词：

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

AI数据智能体TabTabAI正式上线，以“零门槛交互+全流程自主处理”为核心优势，打破数据分析技术壁垒。该工具通过自然语言对话，支持多源数据采集、智能处理、深度洞察与可视化，让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力，覆盖从数据收集到决策建议的全链路，助力用户将原始数据高效转化为精准决策依据，真正实现“人人都是数据分析师”。

数据分析数据驱动 AI数据智能体
重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析，覆盖数据获取、建模到可视化全流程。用户可用自然语言交互，系统自主规划任务并输出可维护结果，支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手，旨在降低分析门槛，助力企业高效挖掘数据价值，适用于数据分析师、营销人员等各类用户。

AI数据分析 Multi-Agent系统数据可视化
1.3亿美元！LiblibAI拿下国内最大AI应用融资

2025年AI应用公司LiblibAI完成1.3亿美元B轮融资，由红杉中国等机构领投，创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式，整合图像、视频、3D等多模态能力，覆盖从灵感到成片的完整AI工作流，已孵化超2000万创作者。平台将加速全球化布局，打造多模态内容生态，标志着AI投资正从底层模型转向应用层落地。

AI应用 B轮融资多模态模型
荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

十年前，AI还停留在算力、模型与数据此消彼长的层面。如今，技术的发展早已超乎想象。 2025年上半年，Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”，它结合了Gemini模型的创造性问题解决能力，以及自动化评估器（Evaluator）的反馈学习机制，能够判断“什么是好的”，并据此不断自我优化。 �

AI 自进化系统 Google
“全球Robotaxi第一股”文远知行：港股上市临近，商业化进程加速

文远知行通过港交所聆讯，正式进入港股上市冲刺阶段，将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业，其产品已在7个国家获自动驾驶牌照，在11国30城开展测试运营，安全运营超2200天。技术层面，预测算法误差控制在0.2米内，感知模型延迟小于10毫秒，系统检测精度达99%。成本大幅下降，单车成本降至几十万元，二季度营收同比增长60.8%，自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试，向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证，万亿级自动驾驶市场正迎来规模化运营拐点。

文远知行自动驾驶 Robotaxi
iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开关

苹果公司10月21日向iPhone用户推送iOS 26.1开发者预览版Beta4更新，新增Liquid Glass液态玻璃透明度切换开关，用户可将界面调整为“色调”模式以增强通知可读性。此次更新延续iOS 26的液态玻璃设计语言，带来更沉浸的视觉体验。同时支持关闭锁屏滑动相机功能避免误触，并扩展Apple Intelligence对丹麦语、荷兰语、繁体中文等七种语言的支持，让更多地区用户享受智能服务。

iOS26.1 Liquid Glass
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
澎湃OS 3 Beta版第三批截止招募：正式版11月15日前推送覆盖小米14/K70等

澎湃OS 3 Beta版内测招募将于10月23日结束，覆盖12款机型，包括小米14系列、MIX Fold 4/Flip及Redmi K70系列等。正式版不晚于11月15日陆续推送，用户可通过小米社区报名参与。新系统采用自研底层技术，任务执行效率提升19%，流畅度与稳定性显著增强，支持“三岛并存”显示快递提醒、导航等信息。超级小爱同学全面升级，实现智能场景化交互。

澎湃OS 小米14 内测招募
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。

今日大家都在搜的词：

热文

3 天
7天

Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

1.3亿美元！LiblibAI拿下国内最大AI应用融资

荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

“全球Robotaxi第一股”文远知行：港股上市临近，商业化进程加速

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开关

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

澎湃OS 3 Beta版第三批截止招募：正式版11月15日前推送覆盖小米14/K70等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

鸿蒙智行：全新问界M7上市36天交付破20000台

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

OPPO ColorOS 16正式版推送：首批适配11款机型

微信红包封面现已支持跳转「微信小店」

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

iPhone 18系列或将首发自研基带C2

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

鸿蒙智行：全新问界M7上市36天交付破20000台

站长商机