首页 > 业界 > 关键词  > Stability最新资讯  > 正文

Stability AI发布两款日语语言模型

2023-10-25 17:42 · 稿源:站长之家

划重点:

1. 最新发布:Stability AI Japan发布了两款日语语言模型

分别是“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”,前者有30亿参数,后者则拥有70亿参数。

这两款模型基于之前发布的英语语言模型构建,后来通过引入大量日语和英语数据进行预训练,提升其日语语言处理能力。

站长之家(ChinaZ.com)10月25日 消息:Stability AI Japan最近发布了两款令人瞩目的日语语言模型,分别命名为“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”。

前者具有大约30亿参数,而后者则拥有高达70亿参数的庞大规模。这两款模型以Apache2.0许可证发布,允许商业使用,为日本的自然语言处理领域带来了一次革命性的突破。

image.png

这两个模型的背景可追溯到之前发布的英语语言模型,具体为“Stable LM3B-4E1T”和“Mistral-7B-v0.1”。最初,它们在主要使用英语数据进行训练,因此在英语处理方面表现出色,但在日语处理能力上受限,这是因为日语数据相对较少。

image.png

image.png

为了提高其日语语言能力,这两个模型经历了持续的预训练,利用了来自维基百科、mC4、CC-100、OSCAR和SlimPajama(不包括Books3)等数据源的大约1000亿token。

这两款模型的性能评估采用了与之前发布的“Japanese Stable LM Alpha”相同的方法。评估包括了日本语言理解基准(JGLUE)任务,涵盖了句子分类、句子对分类、问题回答和文本摘要等八项任务。结果显示,尽管只有30亿参数,但“Japanese Stable LM3B-4E1T”在多项任务上表现出色,而“Japanese Stable LM Gamma7B”甚至获得更高的分数,展示了这些模型在日语自然语言处理方面的卓越进展。

举报

  • 相关推荐
  • AI日报:Claude Opus 4. 7发布;阿里开源 Qwen3.6-35B-A3B;Perplexity推出Mac端AI助手

    本期AI日报聚焦多领域技术进展:Anthropic发布Claude Opus 4.7,强调模型可靠性与任务执行稳定性;阿里开源MoE模型Qwen3.6-35B-A3B,以300亿激活参数实现高效编程能力;OpenAI升级Codex,增强Mac桌面操控与多智能体并行;Opera推出“浏览器连接器”,集成多款AI助手;英伟达Lyra2.0实现单图生成90米3D环境;谷歌Gemini接入个人相册推动图像生成个性化;Perplexity发布Mac端AI助手,支持系统级操作;iOS 27 Beta曝光多项Apple Intelligence功能,涵盖营养标签解析与智能照片管理。

  • 从“我”到“我们”:一场定义好生活的女性合声正在响起丨CBNData报告

    文章探讨了当代女性自我认知与社会角色的深刻变革。女性正从个体觉醒走向集体共鸣,通过消费等直接方式表达真实需求,拒绝单一标签,接纳复杂真实的自我。90后与00后女性成为核心引领者,带动跨年龄层广泛共议。消费不仅是个人选择,更是为“我们”的需求投票,推动市场规则与社会认知改变。品牌需以专业设计回应“她需求”,融入女性叙事,并以实质性行动助推社会进步,让女性友好从口号走向日常。

  • Klickl 随阿布扎比王储访华 深化中阿数字金融基础设施协同

    2026年4月,阿联酋高级别代表团访华,推动两国全面战略伙伴关系提质升级。期间,阿联酋金融科技核心企业Klickl与阿布扎比全球市场(ADGM)签署战略合作协议,聚焦数字金融基础设施建设、跨境支付与数字资产合规服务,旨在拓展中阿在数字经济与跨境金融领域的合作空间。此次合作反映了中阿经贸合作正从传统贸易往来迈向更高层次的产业协同与制度衔接,为双边关系发�

  • 京东开源图像模型JoyAI-Image-Edit:达到世界一流水平

    京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。

  • 健合Solid Gold素力高深耕宠物营养健康领域,打造低脂高蛋白优质猫粮

    随着情感陪伴需求上升,宠物深度融入中国家庭,成为不可或缺的“家庭成员”,也驱动着相关消费市场持续扩容。养宠方式正加速迈向科学化、精细化,品牌需精准解决特定场景下的健康痛点。素力高品牌洞察中国室内猫喂养趋势,针对“足不出户”导致的肥胖、肠道健康等核心困扰,推出低脂高蛋白猫粮新品。该产品采用科学配方,并添加自主研发的专利猫源益生菌HHP003,旨在从源头控制脂肪摄入,同时温和呵护猫咪肠道,为室内猫的体重管理与肠道健康提供更有效的支持。

  • 亮相巴塞罗那MWC,被国际大厂反复选择的无线讲解器品牌IndoorLink

    在巴塞罗那MWC展会上,中国讲解器品牌IndoorLink凭借稳定信号、超远距离传输、AI降噪和抗干扰等硬核技术,赢得华为、法国电信巨头Orange等国际客户的信赖。其产品通过多项国际认证,已广泛应用于英国宾利工厂、阿联酋国家博物馆等高端场景,以可靠品质成为全球展会及专业领域的“省心”之选。

  • 安利一个11万Star的必装插件,能让你的Agent体验直接质变。

    ​最近一直在聊Agent、聊Vibe Coding。 但是在给越来越多的朋友安利的时候,发现其实,一直有一个问题被忽略了。 就是,真正卡住大多数人的,是自己没有一个标准的工作流程。 特别在创造一个你想要的软件或者程序的时候,没有标准流程,其实是一件非常可怕的事情。 所以,我想给大家分享一个我自己在vibe coding的时候,一直在用的一个超好用的帮我提高Coding体验的一个

  • Soul CEO张璐团队开源SoulX-LiveAct:从“能生成”到“能长时间稳定生成”

    Soul CEO张璐团队开源实时数字人生成模型SoulX-LiveAct,旨在解决长时连续生成难题。模型基于AR Diffusion框架,采用分块生成与上下文传递机制,结合Neighbor Forcing和ConvKV Memory优化性能与一致性。在多项基准测试中表现优异,支持数字人直播、AI教育等在线场景。该模型与团队此前开源的SoulX-FlashTalk、SoulX-FlashHead共同完善技术布局,推动AI应用生态发展。

  • 华为Pura X MAX即将开售,小艺翻译扫清语言障碍,覆盖21种常用语言

    五一假期临近,出境游热度持续上升。鸿蒙生态出境服务针对用户在境外出行中常见的网络连接、行程规划及语言沟通等问题,通过场景化服务整合,覆盖行前与行中环节,解决用户出境游过程中的实际需求。出境前一站式配齐行程攻略,问问小艺轻松规划游玩路线出境游前期准备通常涉及大量信息查询,包括当地入境政策、出行资料整理、酒店预订及行程规划。五一期间,�

  • LiGHT SKY 构建舞台灯光技术创新体系

    随着演艺娱乐产业发展,舞台灯光设备正从“效果驱动”迈向“技术驱动”新阶段。在大型演唱会、剧院演出及文旅灯光项目等专业场景中,灯具不仅需具备出色的光效表现,更需在长时间高负荷运行环境下保持稳定可靠的性能,同时实现更精准的色彩控制和更高效的工程部署能力。LiGHT SKY 作为专业舞台灯光设备制造商,始终坚持以技术创新驱动企业发展,围绕舞台灯光在真实应用环境中的核心需求,持续投入研发资源,在散热系统、光学技术以及结构设计等多个关键领域开展技术创新。近年来,LiGHT SKY 陆续推出 DTCS™、iCC™ 及 iM-Lock™ 等多项核心技术成果,并逐步构建起面向舞台应用的 LiGHT SKY 技术创新体系,持续推动舞台灯光设备在稳定性、精度以及工程效率方面的技术升级。

今日大家都在搜的词: