首页 > 业界 > 关键词  > Llama最新资讯  > 正文

基于Llama 2的日语LLM发布,参数量达70亿、可与GPT3.5匹敌

2023-09-11 15:13 · 稿源:站长之家

文章概要:

1. ELYZA发布了基于Meta的Llama2的日语LLM「ELYZA-japanese-Llama-2-7b」,参数数量达到70亿,性能媲美GPT3.5。

2. 该模型经过追加事前学习和独特的事后学习,性能在5级手动评估中获得最高分,尽管还未达到封闭型LLM的水平,但已经与GPT3.5相匹敌。

3. ELYZA成功地将英语等其他语言的LLM能力引入日本语,并通过减少日本语学习量来改进Meta的Llama2基础上的模型。

站长之家(ChinaZ.com)9月11日 消息:最近,日本的人工智能初创公司ELYZA宣布发布了一款基于Meta的「Llama2」的日本语言模型(LLM),该模型被命名为「ELYZA-japanese-Llama-2-7b」,拥有70亿参数。此举使得该模型能够与开放AI领域的巨头GPT3.5相媲美。

为了达到这一性能水平,ELYZA采用了多重学习策略。首先,他们进行了日本语的追加事前学习,然后进行了独特的事后学习。此外,通过增加日本语词汇表,他们实现了模型的高速化,进一步提高了性能。这一系列措施使得「ELYZA-japanese-Llama-2-7b」成为一个强大的日本语言模型。

性能方面,ELYZA使用了「ELYZA Tasks100」数据集,进行了5级手动评估。评测时,三人进行盲测,隐藏型号名称、打乱顺序,通过得分平均来计算分数。

image.png

结果显示,「ELYZA-japanese-Llama-2-7b-instruct」在与其他已公开的日本语模型进行比较时,获得了最高分。虽然它还没有达到闭源LLM的水平,但已经能够与GPT3.5相匹敌。

image.png

值得注意的是,ELYZA在模型的开发中采用了一种聪明的方法,将其他语言的LLM能力引入到了日语中,从而减少了日语学习的难度和成本。这一策略为模型的性能提升做出了重要贡献。

ELYZA的「ELYZA-japanese-Llama-2-7b」模型标志着日本语LLM领域的一项重要突破。虽然目前在参数数量上仍不及一些国际级模型,但这一进展为日本语自然语言处理和生成领域带来了更多可能性,未来可望进一步提高日本语LLM的性能。

举报

  • 相关推荐
  • 腾讯发布浏览器龙虾QBotClaw:内置自研Skill

    今日,腾讯发布了国内首个浏览器“小龙虾”QBotClaw,这一创新产品不仅完全兼容OpenClaw技能,还支持用户自由配置国内各大主流大模型的API Key,为用户带来了前所未有的便捷体验。 腾讯方面表示,从现在起,只要用户会使用浏览器,就能立即拥有一只随时待命的“专属小龙虾”,只需简单一句话,就能让QQ浏览器自动执行任务。

  • openclaw github installation guide:官方安装全流程!

    本文介绍了2026年AI行业已进入注重落地和实际应用的智能体阶段,并推荐了开源智能体框架OpenClaw。文章提供了详细的保姆级部署教程,支持Windows、macOS、Linux全平台,涵盖网关搭建、认证配置、模型对接等步骤,帮助用户快速拥有专属的私有化AI助手,实现隐私自主与强大执行能力。教程包括环境准备、一键安装、模型选择(如Kimi、OpenAI等)、API配置及TUI界面使用,并解答了常见问题。最终目标是让用户轻松部署并开启专属AI的高效应用之旅。

  • AI日报:OpenAI官宣终止Sora项目;闲鱼AI相机正式发布;AI开发者“神器”litellm遭教科书级投毒

    本期AI日报涵盖多个热点:OpenAI终止Sora项目,影响与迪士尼合作;AI开源库litellm遭供应链攻击,引发安全警示;腾讯元宝派电脑版上线,支持多端同步与AI智能体创建;ChatGPT推出商业协议,变身购物助手;闲鱼AI相机简化二手商品上架流程;男子利用AI生成歌曲诈骗800万美元被定罪;MiniMax推出Office Skills提升文档生成专业性;Gap联手谷歌Gemini实现AI直购,革新时尚购物体验。

  • AI日报:爱诗科技发布 PixVerse V6;美图AI开放平台发布Meitu CLI;支付宝支付集成skill首发上线魔搭

    本期AI日报聚焦多项AI技术进展:爱诗科技发布PixVerse V6,AI视频在真实感与物理模拟上实现突破;小米自研输入法集成大模型,支持智能纠错与语义联想;美图AI开放平台发布Meitu CLI,开放8大影像能力;支付宝推出国内首个支付集成Skill,降低开发门槛;通义千问发布Qwen3.5-Omni多模态模型,在多项评测中表现优异;苹果国行版AI功能短暂上线引发关注;中兴通讯与字节跳动合作研发新一代AI手机,预计2026年发布;阿里Qwen3.6 Plus预览版上线OpenRouter,提供免费体验。

  • Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。

    上周直播的时候,发现Anthropic的skills仓库居然有更新了。 点进去一看,然后居然发现了一个超级刚需的Skills迎来了更新。 图片 就是这个,甚至可以说是整个Skills生态的基石。 Skill-creator。 可以说,现在小龙虾的能力能这么强,有一半的原因都要归功于Skills,而

  • 首个为新兴市场打造的龙虾智能体传音TECNO EllaClaw 将开启Beta测试

    TECNO即将开启EllaClaw Beta版测试。EllaClaw是全球首款基于OpenClaw、专为新兴市场打造的移动AI智能体,深度融合OpenClaw代理框架与TECNO AI助手Ella,实现系统级运行,能承载高复杂度、多流程链路的任务。相比OpenClaw,EllaClaw体验更流畅,对普通用户更友好,用户无需额外入口,在Ella中可直接唤起。Beta版本设有三个功能层级,基础层级为“一句话自动化”,用户只需下达简单指令,Ell

  • AI日报:MiniMax发布全模态订阅计划;千问上线打车skill;腾讯推出微信ClawBot插件

    本期AI日报聚焦多款AI产品动态:腾讯推出微信ClawBot插件,让个人AI助手“龙虾”直连微信聊天界面,提升交互便捷性;MiniMax发布全球首个全模态订阅计划Token+ Plan,支持M2.7及视频语音模型,降低开发者构建复杂Agent门槛;字节跳动Seedance 2.0 AI视频生成模型全球上线,支持多模态输入,可生成1080p高保真视频;网易云音乐全面接入OpenClaw,成为业内首个向AI Agent深度开放核心服务能力的音乐平台;千问上线打车技能,用户可用自然语言表达复杂需求;蚂蚁集团入股跃然创新,推动传统玩具智能化转型;MiniMax宣布MaxClaw接入个人微信,降低AI使用门槛;腾讯内测“AI问股”小程序,大模型全面接入证券咨询服务。

  • AI日报:腾讯研发新AI产品探梦DreamNow;MiniMax 2.7 确认本周开源;千问3.6Plus登顶OpenRouter 全球大模型调用榜

    本期AI日报聚焦多领域进展:腾讯推出AI互动影游平台“探梦DreamNow”,降低创作门槛;阿里千问3.6 Plus单日调用量破万亿Token,登顶全球模型调用榜;谷歌发布离线AI听写应用Eloquent,保障数据安全;国产模型MiniMax 2.7确认开源,降低成本提升可用性;宇树科技移动机器人专利获授权,简化感知架构;专业动画工具OiiOii上线,AI赋能动画制作;通义千问上线财经分析模块,接入实时行情与财报;前迪士尼工程师与Midjourney打造仿生机器人Éloi,探索情感交互。

  • 从产品出海到生态出海,乐其创新SmallRig 以共创构建全球影像创新生态

    中国企业全球化正从早期成本竞争、渠道拓展,转向深度本地化与全球共创。深圳企业乐其创新旗下SmallRig以“共创”为核心,从“产品出海”升级为“生态出海”,构建全球协同创新网络,成为企业出海升级的典型。其通过用户共创、场景驱动创新等模式,形成产品从用户中来、再回到用户中的良性循环,既加快产品迭代效率,也提升用户粘性。这一模式为中国企业在海外建立长期信任与品牌口碑提供了可落地路径,展现了从单向“走出去”到双向赋能、协同创新的新阶段。

  • 骁龙与梅赛德斯-AMG:下一个弯道之后,是更深的连接

    2023年2月,高通骁龙标志出现在梅赛德斯-AMG W14赛车上,起初被误认为仅是品牌赞助。但随后三年,双方合作不断深化:2024年,高通在上海F1赛场部署5G-A网络,提升现场观赛体验;2025年,引入毫米波与8K3D VR直播,实现“家中如临赛道”的沉浸观赛。至2026年,19岁车手驾驶带有骁龙标识的W17赛车夺冠,标志着合作已超越商业层面,成为技术伙伴关系,共同在创新极限上寻求突破——无论是赛道速度还是算力连接,都指向同一目标:我们能跑多快,连接多远。

今日大家都在搜的词: