Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源

2023-12-08 10:18 · 稿源：站长之家

**划重点:**
- 🚀 Stability AI发布StableLM Zephyr3B，3B参数的大语言模型，优化用于聊天应用，包括文本生成、摘要和内容个性化。
- 🔍 新模型比之前的7B模型更小更快，可在更广泛的硬件上部署，资源占用更低，同时提供快速响应。
- 🌐 使用直接偏好优化（DPO）训练，结合优化的数据集，StableLM Zephyr3B在性能评估中表现出色。

站长之家（ChinaZ.com）12月8日消息:Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名，但这已不再是该公司的全部业务。

最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型，专为聊天应用场景进行了优化，包括文本生成、摘要和内容个性化。这款新模型是Stability AI早在今年四月首次提及的StableLM文本生成模型的较小、优化版本。

StableLM Zephyr3B的承诺在于，它比7B的StableLM模型更小，带来了一系列好处。由于体积更小，它可以在更广泛的硬件上部署，占用更低的资源，同时仍然提供快速响应。该模型经过优化，特别适用于问答和指令跟随类型的任务。

Stability AI首席执行官Emad Mostaque表示:“相对于以前的模型，StableLM经过更长时间、更高质量数据的训练，例如与LLaMA v27b相比，尽管体积只有其40%，但在基础性能上却能够匹配。”

StableLM Zephyr3B并非全新模型，而是Stability AI定义的现有StableLM3B-4e1t模型的扩展。Zephyr的设计方法受到HuggingFace的Zephyr7B模型的启发。HuggingFace的Zephyr模型是在开源MIT许可下开发的，旨在充当助手。Zephyr采用一种称为Direct Preference Optimization（DPO）的训练方法，StableLM现在也受益于这一方法。

Mostaque解释说，Direct Preference Optimization（DPO）是一种替代以前模型中使用的强化学习的方法，用于调整模型以符合人类偏好。DPO通常用于更大的70亿参数模型，而StableLM Zephyr是首批在更小的30亿参数大小中使用该技术的模型之一。

Stability AI使用了来自OpenBMB研究组的UltraFeedback数据集进行DPO。UltraFeedback数据集包含超过64，000个提示和256，000个响应。DPO、较小的体积和优化的数据训练集的组合为StableLM提供了在Stability AI提供的指标中表现出色。例如，在MT Bench评估中，StableLM Zephyr3B能够胜过包括Meta的Llama-2-70b-chat和Anthropric的Claude-V1在内的更大模型。

StableLM Zephyr3B是Stability AI近几个月推出的一系列新模型之一，该初创公司继续推动其能力和工具的发展。虽然公司忙于进入不同领域，但新模型并没有让Stability AI忘记文本到图像生成的基础。上周，Stability AI发布了SDXL Turbo，作为其旗舰SDXL文本到图像stable diffusion模型的更快版本。

Mostaque还明确表示，Stability AI还将推出更多创新。他表示:“我们相信，针对用户自己的数据进行调整的小型、开放、性能良好的模型将胜过更大的通用模型。随着我们新的StableLM模型的未来全面发布，我们期待进一步实现生成语言模型的民主化。”

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Stability AI发布Stable LM2模型更新，参数增至120亿

站长之家（ChinaZ.com）4月9日消息:Stability AI在最新的Stable LM2模型更新中，宣布将参数增至120亿，以提升性能与可访问性。该更新为用户提供了更强大、更精确的文本内容生成能力。Stability AI指出，该模型在特定基准测试下表现优异，超过了Llama270B等更大型模型。新的Stable LM212B模型包括基础版本和经过指导调整的变体，旨在增强七种语言（英语、西班牙语、德语、意大利语、法�

StabilityAI StableLM2 AI头条
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

StableAudio StableAudio2.0 AI头条
Stability AI发布CosXL模型图像处理能力更精细

StabilityAI最近推出了CosXL模型，这是一项包括基础版CoXL和增强版EditCosXL的创新技术。这些模型的发布，标志着图像生成和编辑技术的新里程碑，为用户提供了更加强大和精细的图像处理能力。特别是ComfyUI，它还为用户提供了详细的工作流程和指导，帮助用户更加高效和便捷地使用CosXL模型。

CosXL AI头条
据称Stability AI资金告急，无法支付租用的云GPU账单

生成式AI明星StabilityAI的热门文本到图像生成模型StableDiffusion所需的大规模GPU集群似乎也部分导致了前首席执行官EmadMostaque的失败-因为他找不到支付这些GPU的方法。根据引用公司文件和数十位知情人士的详尽报道，据称这家英国模型构建公司的极高基础设施成本耗尽了公司的现金储备，导致截至去年十月时，公司只剩下400万美元。计划将其在CoreWeave的GPU容量转售给风险投资公司

StabilityAI AI头条
Stability AI宣布裁员20人，约占员工总数的10%

英国AI公司StabilityAI宣布裁员20人，占其员工总数的约10%。该公司刚刚宣布扩大其旗舰模型的使用范围。这起案件将很快在英国进行审理。

StabilityAI AI头条
Midjourney指控Stability AI员工入侵其数据库并窃取图像

据AI爱好者NickSt.Pierre最近在X上分享的消息，周六发生了一起被指称为侵犯知识产权的事件。StabilityAI的员工入侵了Midjourney的数据库，窃取了所有的提示和图像对，这一行为还导致了长达24小时的服务中断。在这场AI公司之间的冲突中，让我们拭目以待进展，看看这一事件是否会对这两家公司之间的关系产生持久影响。

Midjourney StabilityAI AI头条
荐AI日报：北大开源最强aiXcoder-7B代码大模型；OpenAI创始大神手搓千行C代码训练GPT；Stability AI图像模型竟能精细到这程度；在Vercel上一键部署Morphic

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

aiXcoder-7B
Mutable AI：自动将你的GitHub代码库转换维基文档

MutableAI是一款创新的工具，它通过将GitHub代码库自动转换成易于理解的维基文档，极大地提高了代码的可访问性和透明度。这项服务不仅对开发者有用，也使得非专业人士能够更好地理解和参与到项目中来。目前还有限时优惠活动，使用优惠码XDOT COM，用户可以以每月1美元的价格享受MutableAI的服务，这对于预算有限的开发者或小型团队来说是一个巨大的吸引力。

Mutable GitHub AI头条
突发！Stable Diffusion 3，可通过API使用啦

4月18日，著名开源大模型平台Stability.ai在官网宣布，最新文生图模型StableDiffusion3和SD3Turbo可以在API中使用。本次继续由知名API管理平台FireworksAI提供服务。在山顶上有一位巫师创作了一幅令人惊叹的艺术作品，他用魔法创造了文字"StableDiffusion3API"。

StableDiffusion3 API AI头条
荐模型未发API先至！Stable Diffusion 3 API 发布性能比肩 Midjourney v6

其开发者平台API现已支持最新版本的StableDiffusion3及其增强版本StableDiffusion3Turbo。这一发布标志着StabilityAI在文字到图像生成领域的技术进步，其性能已经达到甚至超越了行业内的一些领先模型，如DALL-E3和Midjourneyv6。公司承诺提供99.9%的服务可用性，这对于企业用户来说尤为重要，因为他们在使用开发者平台进行关键的生成型AI工作时，需要确保服务的稳定性和可靠性。

StableDiffusion3

今日大家都在搜的词：

热文

3 天
7天

Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源

今日大家都在搜的词：

热文

站长商机