首页 > 业界 > 关键词  > 讯飞科技最新资讯  > 正文

星火语音大模型发布:在首批37个主流语种上超越OpenAI

2024-01-30 16:26 · 稿源: 快科技

快科技1月30日讯,星火语音大模型正式亮相。

该模型融合了多语言语音合成技术,覆盖37种主流语言,性能超越OpenAI的Whisper-large-v3,彰显了科大讯飞在智能语音技术领域的国际领先地位。

科大讯飞、讯飞星火大模型

此外,星火语音大模型在40种语言的平均MOS分提升显著,达到4.5,拟人度超过83%。

随着人工智能产业的蓬勃发展,预计2024年全球人工智能市场规模将达6158亿美元,其中大模型作为前沿技术,增长势头强劲。

数据显示,2024年全球人工智能大模型市场规模有望突破280亿美元,中国市场规模将达216亿元,保持两位数以上的增长率。

科大讯飞表示,将依托扎实的基础,持续推动技术创新和产业发展,把握人工智能时代带来的机遇。

举报

  • 相关推荐
  • AI日报:Kimi发布多模态图片理解模型API;周鸿祎参演AI短剧开拍;MiniMax-01系列模型开源;星火同传语音大模型发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、月之暗面Kimi多模态图片理解模型API发布2025年1月15日,北京月之暗面科技有限公司正式发布了全新多模态图片理解模型moonshot-v1-vision-preview,该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力,旨在帮助Kimi更好地理解世界。通过模块化设计,MiniCPM-o2.6集成了多种强大组件,支持实时处理和多语言功能。

  • 讯飞星火大模型升级发布会:语音同传大模型开启AI翻译新纪元

    讯飞星火大模型升级发布会:语音同传大模型开启AI翻译新纪元 1 月 15 日,讯飞星火大模型升级发布会拉开帷幕。作为人工智能国家队,科大讯飞重磅发布了星火语音同传大模型等一系列重大技术成果,不仅彰显了讯飞在人工智能语音领域深厚的技术积淀,也预示着AI翻译技术正迈向全新的纪元。星火语音同传大模型通过先进的端到端语音同传技术,其优势为翻译字幕呈现更快

  • 豆包实时语音大模型正式上线!端到端语音对话 情商智商双高

    今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包App全量开放,将App升级至7.2.0版本即可体验。豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。豆包大模型团队也坦言,现阶段的模型主要支持中文,其他语种尚未较好支持,中文范围内,模型也仅支持小部分方言和地方口音的理解和表达。

  • OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!

    OpenAI创始团队成员、高级研究科学家AndrejKarpathy很罕见地,分享了一个来自中国的开源大模型——DeepSeek-v3。Karpathy表示,DeepSeek仅用了280万小时的GPU算力,就训练出了比Llama-3405B更强的前沿模型,整体成本节省了11倍左右,将算力发挥到了极致。值得一提的是可以使用像o1模型那样的深度思考模式,并且会把整个推理过程全部写出来。

  • AI日报:1秒出图!英伟达开源文生图模型Sana;阿里妈妈推淘宝星辰视频生成大模型OpenAI发布经济蓝图

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震撼登场!英伟达开源图像生成模型Sana,1秒生图、支持中英文和emoji英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛

  • 刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性

    今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。同样模型在增加推理时间、算力情况下成功抵御攻击。

  • 重大突破!微软发布“自我进化”,帮小模型OpenAI-o1

    微软亚洲研究院发布了一种创新算法——rStar-Math。rStar-Math通过代码增强CoT、蒙特卡洛树搜索等,可以帮助小参数模型在不依赖老师模型蒸馏的情况下,实现多轮自我思维深度进化,极大增强模型的数学推理能力。代码地址:https://github.com/microsoft/rStar论文地址:https://arxiv.org/abs/2501.04519从昨天微软开源的最强小模型Phi-4,以及最新推出创新算法rStar-Math来看,未来小模型的性能和效�

  • 谷歌发力世界模型:从OpenAI挖来Sora核心负责人!

    谷歌正在组建一个新的团队,专注于开发可以模拟物理世界的人工智能模型。该团队的负责人是蒂姆布鲁克斯,他此前是OpenAI视频生成器Sora的联合负责人之一,后于2024年10月离开OpenAI,跳槽至谷歌的人工智能研究实验室谷歌DeepMind。Gemini是谷歌的旗舰AI模型系列,用于图像分析和文本生成等任务;Veo是谷歌的视频生成模型;Genie则是谷歌的基础世界模型,它支持用户通过文本、合成图像、照片甚至草图等方式,创造出具有高度可玩性的交互式环境和可控的虚拟世界。

  • AI日报:阿里通义开源多模态推理模型QVQ-72B;OpenAI考虑自研人形机器人;QQ音乐上线首个AI大模型音效

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升阿里巴巴最近推出的QVQ-72B多模态推理模型在语言和视觉能力上实现了显著提升,能够处理复杂的推理和分析任务,尤其在多步推理和数学推理方面表现突出。尽管o1-preview在某些方面表现优秀,但在实际应用中仍面临高成本和不切实际的测试建议等问题。

  • 讯飞同传搭载星火语音同传的模型,更快更准的AI翻译

    在人类社会不断发展演进的进程中,语言,这一独特的文化符号,既编织起了丰富多彩的文明锦缎,又在不经意间成为了人们相互理解与沟通的一道屏障。从古老的巴别塔传说所隐喻的语言隔阂,到如今全球互联互通时代下对高效交流的急切渴望,跨越语言的界限、实现无阻碍的沟通始终是人类不懈追求的目标。无论是在国际商务合作的广阔天地中助力企业拓展全球市场版图是在学术交流的知识海洋里促进前沿思想的广泛传播与共享,亦或是在文化交流的绚丽舞台上推动不同文化之间的相互欣赏与融合,讯飞同传凭借其不断精进的技术和服务,为构建一个更加紧密相连、沟通无碍的全球社会添砖加瓦,在人类跨越语言障碍、实现心灵相通的伟大征程中稳步迈进,书写出更加精彩的篇章。