首页 > 业界 > 关键词  > 语言模型最新资讯  > 正文

日本政府与科技巨头联手投资数亿美元开发日语语言模型

2023-09-18 09:51 · 稿源:站长之家

文章概要:

1. 日本政府与NEC、富士通、软银等主要科技公司正在合作投资数亿美元,旨在开发一款文化敏感的日语语言模型,超越现有的ChatGPT等模型,更好地体现日本文化和语言。

2. 这一新模型将在国家超级计算机Fugaku上进行训练,并计划于明年以开源形式发布,具备至少300亿个参数,预计性能明显优于现有模型。

3. 为了评估语言模型对日本文化的敏感度,研究人员开发了Rakuda排名,其中GPT-3.5目前排名第一,表现优异,但日本LLM在该排名中排名第四。

站长之家(ChinaZ.com)9月18日 消息:最新报道,日本政府与NEC、富士通、软银等主要科技公司正共同投资数亿美元,旨在开发一款文化敏感的日语语言模型。这一举措旨在超越现有的ChatGPT等模型,更好地代表日本文化和语言,解决当前模型在日本市场上的一些不足之处。

由东京工业大学、东北大学、富士通和政府资助的 RIKEN 开发的日本 LLM 预计将于明年开源,并将拥有至少300亿个参数。

日本,秋叶原,日语,动漫

新的日语语言模型将使用国家超级计算机Fugaku进行训练,这将使其性能远远超越现有的模型。

研究人员指出,现有模型如ChatGPT存在一些问题,例如生成一些罕见的字符和未知单词,以及在文化上适当且礼貌的沟通规范方面存在不足。这些问题可能是由于日语具有多达48个字符的字母系统,以及汉字汉字的使用,每个字符都有不同的发音,以及大约50,000个很少使用的汉字。新模型的开发旨在解决这些问题,提供更准确和文化敏感的日语生成。

为了评估语言模型对日本文化的敏感度,研究人员还开发了Rakuda排名系统。根据排名结果,目前最优秀的开源日本LLM在该排名中排名第四,而GPT-3.5表现卓越,名列榜首。随着新模型的发布,预计其性能将明显超越目前的情况,使其成为更好的文化代表。

日本文部科学省正在建立一个更大的模型。该模型拥有至少1000亿个参数,也将基于日语并针对科学应用进行优化:根据已发表的研究,它将产生新的假设以加速研究。该模型将耗资约2亿美元,预计将于2031年向公众开放。

最近,日本文部科学省还发布了指导方针,允许小学、初中和高中有限地使用ChatGPT等生成式人工智能,以促进教育和研究领域的发展。这一举措显示了日本政府对人工智能领域的积极投资和支持。

举报

  • 相关推荐
  • AI日报:OpenAI官宣终止Sora项目;闲鱼AI相机正式发布;AI开发者“神器”litellm遭教科书级投毒

    本期AI日报涵盖多个热点:OpenAI终止Sora项目,影响与迪士尼合作;AI开源库litellm遭供应链攻击,引发安全警示;腾讯元宝派电脑版上线,支持多端同步与AI智能体创建;ChatGPT推出商业协议,变身购物助手;闲鱼AI相机简化二手商品上架流程;男子利用AI生成歌曲诈骗800万美元被定罪;MiniMax推出Office Skills提升文档生成专业性;Gap联手谷歌Gemini实现AI直购,革新时尚购物体验。

  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • 3年1亿模型,年收入2.8亿:当AI大佬开始做游戏

    过去一年多,游戏行业对AI的态度渐渐回归理性。最初大家惊叹于各种大模型的生成效果,现在大家往往更关心现实问题:能嵌入开发管线吗?工作流是什么样?成本和效果又如何? Meshy AI创始人兼CEO胡渊鸣在今年GDC上用一组对比强烈的数据作为开场,向大家展示了3D生成工具Meshy(meshy.ai)的生产力: “Meshy拥有超过1000万注册用户,三年内用AI生成了超过1亿个3D模型;相比之下,在整�

  • AI 音乐赛道再进阶:音潮V3.0全链路自研模型突围,平民创作时代已至

    2026年,AI音乐赛道进入“好用”的专业进阶阶段,竞争焦点转向音乐审美、情感表达与创作平权。音潮音乐大模型V3.0凭借全链路自研技术与“音乐平权”理念,成为国产AI音乐工具中的全能选手。它通过三大核心技术实现演唱质量、旋律悦耳度、编曲多样性的突破,解决了AI音乐“顺畅易忘、质感单薄”的行业痛点。产品定位跳出“专业辅助”,以降低创作门槛为核心,支持文字、图片、哼唱等多模态输入,让零基础用户也能通过极简操作在短时间内生成带有人声演唱、情感饱满的完整歌曲,实现“人人皆可写歌”。音潮V3.0已完成全平台覆盖,生成歌曲版权归用户所有,通过技术实力与人文温度双线突围,重新定义了一键生成歌曲软件的体验标准。

  • 月流水破2000万美元,可灵成全球最吸金的AI视频模型

    3月25日,快手公布2025Q4及全年财报,Q4快手收入396亿元,同比增长11.8%,创历史新高,经调整净利润5.5亿元,同比增长16.2%,维持了较为强势的表现。全年业绩方面,快手2025总收入1428亿元,同比增长12.5%,经调整净利润206亿元,同比增长16.5%,经调整净利润率为14.5%。

  • AI日报:阿里发布Wan2.7视频模型;红果下架AI剧桃花簪;广电严禁AI演员换脸

    本期AI日报聚焦多领域进展:阿里通义实验室发布Wan2.7-Video模型,提升视频创作自由度;红果短剧因AI换脸侵权下架,引发行业法律风险讨论;腾讯云推出“龙虾”记忆服务,增强AI代理长期记忆能力;千问3.6发布,编程能力达国际先进水平;广电行业组织严禁AI换脸和声音克隆侵权;ElevenLabs进军AI音乐创作市场;谷歌开源Gemma4模型;小米MiMo大模型推出商业化订阅套餐。

  • 腾讯发布浏览器龙虾QBotClaw:内置自研Skill

    今日,腾讯发布了国内首个浏览器“小龙虾”QBotClaw,这一创新产品不仅完全兼容OpenClaw技能,还支持用户自由配置国内各大主流大模型的API Key,为用户带来了前所未有的便捷体验。 腾讯方面表示,从现在起,只要用户会使用浏览器,就能立即拥有一只随时待命的“专属小龙虾”,只需简单一句话,就能让QQ浏览器自动执行任务。

  • AI日报:爱诗科技发布 PixVerse V6;美图AI开放平台发布Meitu CLI;支付宝支付集成skill首发上线魔搭

    本期AI日报聚焦多项AI技术进展:爱诗科技发布PixVerse V6,AI视频在真实感与物理模拟上实现突破;小米自研输入法集成大模型,支持智能纠错与语义联想;美图AI开放平台发布Meitu CLI,开放8大影像能力;支付宝推出国内首个支付集成Skill,降低开发门槛;通义千问发布Qwen3.5-Omni多模态模型,在多项评测中表现优异;苹果国行版AI功能短暂上线引发关注;中兴通讯与字节跳动合作研发新一代AI手机,预计2026年发布;阿里Qwen3.6 Plus预览版上线OpenRouter,提供免费体验。

  • 悠然远智大模型服务平台正式上线:首发行业级AI视觉智能体

    考拉悠然发布“悠然远智”大模型服务平台,实现AI视觉智能体“定义即运行”。该平台基于全栈自研多模态大模型,让业务人员通过自然语言指令即可定义、创建并驱动具备专业理解与执行能力的AI智能体,将事件检测算法上线周期从“数周”缩短至“分钟级”。平台提供三种开箱即用的智能体工作模式,覆盖审核、增强与检测等场景,支持零样本视觉推理,无需标注数据与模型训练即可直接分析视频流,输出结构化判断结果,形成“感知-理解-决策”的完整执行闭环。

  • 声网对话式AI ×ClawStage:让大模型成为你的专属家庭智能体

    当前智能家居仍停留在“你下指令,我执行”的被动模式,功能虽多却各自为战。随着大模型进入家庭,交互逻辑正发生根本变化:用户无需逐个控制设备,而是以AI为核心,实现家庭设备的统一协同,只需与大模型对话即可。这推动了家庭运行方式从“被动触发”走向“主动服务”。未来智能家居将向“家庭智能体”演进,如ClawStage这类具身AI终端,为大模型提供可定位、可感知、可执行的物理接口,解决AI长期“悬浮”在云端、无法干预真实世界的痛点。声网等实时互动技术让用户与AI的对话更自然流畅,推动大模型能力在家庭场景中落地为可感知的服务。

今日大家都在搜的词: