首页 > 业界 > 关键词  > NTT最新资讯  > 正文

日本NTT将于明年3月发布高效能大语言模型

2023-11-02 17:54 · 稿源:站长之家

划重点:

NTT 计划于明年3月向公司提供大规模语言模型(LLM),为学习日语的生成式人工智能提供基础。

通过专注于特定行业(如医疗保健),可以降低模型学习和运行所需的成本。

NTT 打算通过提供该模型来与美国信息技术巨头竞争。

日本电报电话公司(NTT)于11月1日宣布,将于明年3月向公司提供大规模语言模型(LLM),为学习日语的生成式人工智能提供基础。

机器人 AI 人工智能223

图源备注:图片由AI生成,图片授权服务商Midjourney

NTT 计划通过专注于特定行业(如医疗保健)来降低模型学习和运行所需的成本。NTT 总裁岛田明表示,在11月1日的新闻发布会上,他希望将这个 LLM 定位为解决社会问题的解决方案。

NTT 打算通过提供这个 LLM 来与领先的美国信息技术巨头竞争。NTT 利用其长期的自然语言处理研究(教会计算机人类语言的技术),并独立开发了名为 “tsuzumi” 的 LLM。

tsuzumi的一个关键特点是其成本效益。美国初创企业 Open AI 的 Chat GPT-3具有1750亿个参数,这是其人工智能学习规模的指标,而鼓则有两个版本:一个具有6亿个参数,另一个具有70亿个参数。拥有更多的参数可以处理更复杂的任务,但同时也会增加学习过程中的能耗。

通过将tsuzumi量身定制为特定行业,可以降低能耗和操作所需的设备。10月份,在京都大学医院和东京海上日动火灾保险公司的呼叫中心进行了试运营。该服务提供日语和英语,计划以后添加更多语言。

NTT 目标是在2027财年实现超过1000亿日元(6.65亿美元)的年销售额。

越来越多的日本公司正在加入生成式人工智能服务市场。软银公司计划到2024年底建立一个专注于日语的有3500亿个参数的 LLM。NEC 公司已经开始提供针对每个公司定制的生成式人工智能服务。

举报

  • 相关推荐
  • 迄今最先进的AI模型!ChatGPT-5具备博士级别的认知能力

    ChatGPT-5在多个领域表现出色,包括编程、数学、写作、健康和视觉感知等。 它具备增强的推理能力,能够根据对话类型选择最佳模型,并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示,ChatGPT-5在知识工作方面表现卓越,其知识水平在40多种职业中均达到或超过专家水平,涵盖法律、物流、销售和工程等领域。 在基准测试中,ChatGPT-5 展现了出色的认知能力。 例如,�

  • 男子用3种语言辱骂乘客 上海地铁回应:可立刻报警

    近日,上海地铁7号线车厢内发生一起恶性不文明事件。 据悉,一名男子冲过来碰撞到邻座乘客贺先生腿部的伤口,在对方提醒后不仅未道歉,反而情绪失控。 该男子使用上海话、英语和普通话三种语言,对贺先生进行持续辱骂,期间还多次喊出乡下人滚出去”等歧视性、侮辱性词汇。

  • OpenAI正式发布GPT-5模型 网友:写作像诗人

    OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。 分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送,免费用户与付�

  • 因为GPT-5,这群人决定在Reddit上起义。

    ​这个周末,对OpenAI的抗诉,好像从未如此热闹过。 起因自然还是因为GPT-5。 OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。

  • 酷睿Ultra Day 0适配部署大模型,率先赋能驱动人生AIGC助手

    腾讯发布新一代开源大语言模型"混元",英特尔通过酷睿Ultra平台实现该模型的Day0部署与优化。基于OpenVINO工具套件,英特尔助力ISV生态伙伴快速完成模型适配,加速AI应用落地。混元模型包含0.5B至7B四种参数规模,支持消费级显卡运行,适用于PC、手机等低功耗场景。在酷睿Ultra平台上,7B模型INT4精度下吞吐量达20.93token/s,0.5B模型FP16精度达68.92token/s。英特尔通过"硬件+模型+生态"协同,实现新模型发布当日即完成硬件适配,推动AI技术快速转化应用。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

  • vivo以Rust语言自研的蓝河操作系统内核正式开源

    7月23日,2025开放原子开源生态大会召开。vivo宣布其自主研发的蓝河操作系统(BlueOS)内核正式开源。该系统采用Rust语言编写,具备智慧、流畅、安全三大特性,是行业首个从内核到框架全栈使用Rust的操作系统。蓝河内核内存占用仅13KB,兼容RISC-V、ARM等架构,支持POSIX接口标准,包含系统调度、内存管理等五大核心能力。vivo表示,此次开源将为国产操作系统发展提供新思路,推动行业迈向新高度。未来vivo将持续推进Rust语言在国内的普及,并举办第三届蓝河操作系统创新大赛。

  • 北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

    北京大学张牧涵团队在昇腾算力支持下,研发出一套高效大模型训练推理架构,实现百万tokens输入成本低至1元。该成果包含三项关键技术:1)通过分离注意力头中的位置与非位置信息,仅用3%位置信息即可维持模型性能;2)采用联合KV低秩压缩方法,仅保留12.5%的KV Cache;3)基于昇腾硬件并行计算能力,实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本,验证了昇腾算力平台支撑尖端科研的实力。