首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

谷歌的野心:通用语音识别大模型已经支持100+语言

2023-03-08 15:27 · 稿源: 机器之心公众号

谷歌表示,推出通用语音模型(USM)是其未来支持1000种语言的关键一步。去年11月,谷歌宣布推出「1000种语言计划」,旨在构建一个机器学习 (ML) 模型,支持世界上使用最广泛的1000种语言,从而为全球数十亿人带来更大的包容性。然而,其中一些语言的使用人数不到两千万,因此核心

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • OpenAI计划四季度上市 已聘请新高管

    ​据知情人士向《华尔街日报》透露,全球人工智能龙头企业OpenAI正密集推进上市进程,计划最早于2026年第四季度启动首次公开募股(IPO),目标估值高达5000亿美元(约合人民币3.48万亿元)。为保障这一资本市场的"超级事件"顺利落地,公司已启动高管团队扩容计划,并就上市细节与多家华尔街顶级投行展开非正式磋商。 此次上市筹备工作

  • 3D领域的NanoBanana也来了,万物皆可用嘴操控。

    本文介绍了AI驱动的3D建模工具Hyper3D,其核心功能是支持通过文本提示对现有3D模型进行局部编辑。用户可上传任意第三方模型(如OBJ、FBX格式),通过简单的文字指令(如“将斧头改成大剑”)即可完成修改,而无需重新生成整个模型。这种“局部、可控、可回滚的增量修改”方式,能保留模型的骨骼绑定、动画等原有资产属性,解决了传统3D工作流中修改复杂、一致性难保�

  • AI日报:OpenAI推出macOS版Codex应用;智谱发布0.9B轻量级GLM-OCR;火狐Firefox 148浏览器即将上线

    本期AI日报涵盖多项AI领域动态:Adobe Firefly为订阅用户提供无限AI生成支持;OpenAI推出macOS版Codex应用,整合智能体化开发逻辑;智谱发布轻量级GLM-OCR模型,性能突出且成本低;火狐浏览器引入AI控制面板,支持一键屏蔽AI功能;腾讯回应红包刷屏质疑,强调为无门槛福利;港股大模型概念股走强;百度、小米等联手加持国家具身智能平台,完成超7亿融资;AI在“人类终极考试”中表现不佳,揭示其能力或被高估。

  • OpenAI宣布ChatGPT将引入广告 强调用户数据不会出售给广告商

    OpenAI宣布将在未来几周内,在美国的免费版和Go订阅版ChatGPT中测试广告投放,但Plus、Pro、Business和Enterprise订阅用户不受影响。广告将独立呈现,清晰标注,并与原始回答分开,且不会影响ChatGPT基于客观信息的回答。公司强调,用户数据和对话将受到严格保护,不会出售给广告商。此举旨在通过广告业务增加收入,以支持其确保AGI造福全人类的使命,同时让AI能以更广泛、更可及的方式服务大众。测试初期,广告将出现在相关回答底部,且不会向未满18岁的用户展示,也不会出现在身心健康、政治等敏感话题附近。OpenAI始终会提供不显示广告的付费选项。

  • AI日报:MiniMax Music 2.5 发布;蚂蚁灵波开源世界模型LingBot-World;谷歌 Gemini 3.5 泄露

    本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。

  • 双奖背后的基石:USANA葆婴以诚信铸就健康品牌信赖

    近日,USANA葆婴凭借卓越的综合表现,荣获北京经济技术开发区授予的“统计诚信示范企业”称号。这一荣誉是对其二十余年深耕中国市场、将“诚信”价值观融入企业血脉的肯定。该评选由政府主导,围绕生产经营、质量控制、依法纳税、劳动权益保障及环境保护等多维度进行系统性、高标准评估。USANA葆婴的脱颖而出,标志着其在合规经营、稳健发展与社会责任履行方面已达到区域标杆水平。这既是对企业综合实力的权威认可,也彰显了其长期坚守诚信理念的承诺。未来,USANA葆婴将继续以此为标准严格自律,将诚信基因深植于每一个运营环节,成为抵御市场风浪的“压舱石”和赢得消费者信赖的“金名片”。

  • 飞机起飞前广东男子往保温杯装雪 网友:DNA里的执念

    1月26日,在乌鲁木齐地窝堡国际机场上演了一幕充满趣味的场景。即将搭乘航班返回广州的陈女士目睹,一位男性旅客在登机前突然快步走向停机坪旁的空地,从积雪处小心翼翼地用保温杯接了满满一杯雪,随后带着这份特殊“行李”通过安检登机。 据陈女士回忆,当时距离航班起飞仅剩二十分钟,这位旅客的举动显得格外匆忙却专注。她推测对方可能是想将新疆的冰雪景观

  • 激活沉睡文档,迈向知识资产时代,博库致连AI文档管理一体机破解传统NAS困局

    博库致连AI文档管理一体机打破传统NAS“只存不用、低效检索”局限,以“存储+AI+办公”深度融合,为企业打造更懂需求的文档管理新选择。它从单纯存储升级为智能管理,AI自动分类、构建知识库,实现“即传即管”;支持全文语义检索,摆脱关键词束缚,秒级精准定位;集成AI问答、一键生成报告/PPT、会议管理、多语言互译等办公功能,覆盖学习、创作、协作全场景;搭载国产化硬件与系统,数据100%本地部署,确保安全可靠。该一体机不仅是更安全的存储设备,更是助力企业提效、降本、挖掘文档价值的智能办公伙伴。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

今日大家都在搜的词: