首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源

2023-12-08 10:18 · 稿源:站长之家

**划重点:**

- 🚀 Stability AI发布StableLM Zephyr3B,3B参数的大语言模型,优化用于聊天应用,包括文本生成、摘要和内容个性化。

- 🔍 新模型比之前的7B模型更小更快,可在更广泛的硬件上部署,资源占用更低,同时提供快速响应。

- 🌐 使用直接偏好优化(DPO)训练,结合优化的数据集,StableLM Zephyr3B在性能评估中表现出色。

站长之家(ChinaZ.com)12月8日 消息:Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名,但这已不再是该公司的全部业务。

最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型,专为聊天应用场景进行了优化,包括文本生成、摘要和内容个性化。这款新模型是Stability AI早在今年四月首次提及的StableLM文本生成模型的较小、优化版本。

StableLM Zephyr3B的承诺在于,它比7B的StableLM模型更小,带来了一系列好处。由于体积更小,它可以在更广泛的硬件上部署,占用更低的资源,同时仍然提供快速响应。该模型经过优化,特别适用于问答和指令跟随类型的任务。

image.png

Stability AI首席执行官Emad Mostaque表示:“相对于以前的模型,StableLM经过更长时间、更高质量数据的训练,例如与LLaMA v27b相比,尽管体积只有其40%,但在基础性能上却能够匹配。”

StableLM Zephyr3B并非全新模型,而是Stability AI定义的现有StableLM3B-4e1t模型的扩展。Zephyr的设计方法受到HuggingFace的Zephyr7B模型的启发。HuggingFace的Zephyr模型是在开源MIT许可下开发的,旨在充当助手。Zephyr采用一种称为Direct Preference Optimization(DPO)的训练方法,StableLM现在也受益于这一方法。

Mostaque解释说,Direct Preference Optimization(DPO)是一种替代以前模型中使用的强化学习的方法,用于调整模型以符合人类偏好。DPO通常用于更大的70亿参数模型,而StableLM Zephyr是首批在更小的30亿参数大小中使用该技术的模型之一。

Stability AI使用了来自OpenBMB研究组的UltraFeedback数据集进行DPO。UltraFeedback数据集包含超过64,000个提示和256,000个响应。DPO、较小的体积和优化的数据训练集的组合为StableLM提供了在Stability AI提供的指标中表现出色。例如,在MT Bench评估中,StableLM Zephyr3B能够胜过包括Meta的Llama-2-70b-chat和Anthropric的Claude-V1在内的更大模型。

StableLM Zephyr3B是Stability AI近几个月推出的一系列新模型之一,该初创公司继续推动其能力和工具的发展。虽然公司忙于进入不同领域,但新模型并没有让Stability AI忘记文本到图像生成的基础。上周,Stability AI发布了SDXL Turbo,作为其旗舰SDXL文本到图像stable diffusion模型的更快版本。

Mostaque还明确表示,Stability AI还将推出更多创新。他表示:“我们相信,针对用户自己的数据进行调整的小型、开放、性能良好的模型将胜过更大的通用模型。随着我们新的StableLM模型的未来全面发布,我们期待进一步实现生成语言模型的民主化。”

举报

  • 相关推荐
  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

  • 小米14无缘澎湃OS 3首批Beta版:张国全解释原因

    小米软件部张国全发文表示,澎湃OS 3 Beta版第二版今天已经外发,欢迎大家升级体验,如果没有重大问题,8款机型第二批Beta版明天逐步外发。 值得注意的是,12306行程助手明天开始外发(澎湃OS 2/OS 3同时外发),NFC上岛/秒表上岛,第一版开始外发,大家升级试用后有问题随时反馈。 张国全还提到了小米14系列Beta版计划,称去年在规划澎湃OS 3 Beta版的时候,怕大家觉得不公�

  • 7年来首次!苹果罕见发布iOS 26 Beta 9更新

    今日,苹果发布iOS 26开发者预览版Beta 9更新,内部版本号23A5336a。 值得注意的是,这是继2018年iOS 12之后,苹果首次推出第9个测试版更新。 据悉,从iOS 13到iOS 18,苹果在正式版发布前最多只会推出8个测试版,更新节奏一向稳定。 而iOS 12则因频繁修复弹窗问题,一度创下12个测试版的纪录。 根据往年发布节奏,苹果预计将在9月10日发布iOS 26 RC版(准正式版)更新,9月16日发�

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • 澎湃OS 3第二批Beta来了!小米回应推送时间

    小米澎湃OS3首批Beta版内测已于8月29日开启推送。 今日,小米澎湃OS官方就大家关心的第二批Beta版(首批Beta版机型)推送时间作出回应。 官方表示,即使推送Beta版本也极为重视交付质量,为了给参与Beta招募的用户提供良好可靠的使用体验,小米社区会按照用户提交招募申请的先后顺序,分两批逐步放量推送,这一举措将提供更充分的质量保障。 当前,由于用户报名热情,�

  • 一款专为日常需求设计的超值平板:三星Galaxy Tab S10 Lite正式发布

    三星电子于2025年8月25日发布Galaxy Tab S10 Lite平板电脑,配备10.9英寸大屏、S Pen手写笔及多项智能功能,支持高效学习、创作与娱乐。搭载升级处理器、8000mAh电池和快充技术,确保长续航。提供星空灰、星川银、星语红三款配色,9月5日起陆续上市。

  • 小米澎湃OS 3首批Beta版正式推送!手机、平板8款机型升级

    根据小米社区网友反馈,小米澎湃OS3首批Beta版内测更新目前已开启推送。 有内测资格用户可以点击手机设置-我的设备-击版本号查看是否收到推送。 升级页面显示,小米15 Pro的澎湃OS3Beta安装包大小7.7GB,小米15 Ultra安装包大小9GB。

  • 小米应用软件部总监:澎湃OS 3 Beta招募不设门槛、不设上限

    小米8月27日官宣澎湃OS3系统,将于28日正式发布,并同步开启Beta版招募。首批支持15款机型,招募无门槛限制,用户只需答题通过即可参与。系统以“顺”为核心目标,围绕AI生态展开。小米提醒此为测试版,可能存在bug,不建议主力机升级,希望用户多反馈意见以持续优化。

  • 小米澎湃OS3发布会官宣 首批Beta版招募机型公布

    今日,小米官方正式宣布,备受期待的小米澎湃OS3 将于 8 月 28 日正式发布,其Slogan定为“事事顺心”,预示着新系统将带来更加流畅、顺心的用户体验。与此同时,小米澎湃OS3 的Beta版招募活动也同步开启,用户可前往小米社区-内测中心进行报名。 此次Beta版招募的首批机型阵容强大,涵盖了六款手机和两款平板。手机方面包括小米15、小米15 Pro、小米15S Pro、小米15 Ultra、REDM

  • 小米回应升级Beta后手机很烫:系统编译致短期功耗增加

    ​今日,小米正式向8款机型推送澎湃OS3首批Beta版内测更新,涵盖小米15系列(含小米15、15Pro、15S Pro、15Ultra)、REDMI K80系列(K80Pro、K80至尊版)以及小米平板7系列(7Pro、7S Pro12.5)。不过,部分用户在升级后反馈手机出现发热现象,引发关注。 针对这一情况,小米官方在社区问答中回应称,升级后系统需自动对应用进行重新编译,以适配新内存管理机制和运行效率优化。这一后台�

今日大家都在搜的词: