首页 > 业界 > 关键词  > 音频模型最新资讯  > 正文

同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能

2025-04-27 09:09 · 稿源: 机器之心公众号

今天,kimi 又发布了新的开源项目 —— 一个全新的通用音频基础模型 Kimi-Audio,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十多个音频基准测试中实现了最先进的 (SOTA) 性能。结果显示,Kimi-Audio 总体性能排名第一,几乎没有明显短板。例如在 LibriSpeech

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • 模型公司纷纷卷向社区,kimi们能否扭转乾坤?

    内容社区能不能打破AI困境?大模型赛道卷上天 ,部分公司开始换新玩法了。据蓝鲸财经报道,月之暗面Kimi正灰度测试一个内容社区产品。从该媒体爆料来看,该社区内大部分内容由AI抓取新闻热点生成,重点关注科技、财经等垂类新闻。有趣的是,据财联社报道,另一个大模型巨头OpenAI也表示将做社交软件,对标的是X,但对于这个社区的定位还没清晰,不知道将来是单独开发

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 初中老师如何用deepseek 和 Kimi无痛做课件

    本教程指导初中教师如何利用Deepseek和Kimi两款AI工具高效完成备课全流程。Deepseek用于生成教学设计方案和PPT大纲,Kimi则根据大纲快速生成精美课件。操作步骤:1)在Deepseek输入教学需求生成教学设计;2)用Deepseek生成PPT大纲;3)将大纲粘贴至Kimi PPT助手一键生成课件。该方法特别适合日常备课、临时调课需求,能大幅提升备课效率,让教师既省时又高效。

  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • 赛博未来感足!小鹏全新纯电轿跑官宣:还叫P7

    小鹏汽车董事长何小鹏宣布全新纯电轿跑P7正式命名,采用GT风格设计,车长近5米,轴距3米,定位中大型纯电轿跑。新车延续P7系列命名,配备贯穿式灯带和可发光Logo,搭载自研图灵AI芯片,采用视觉辅助驾驶方案,预售价约20万元。该车将与特斯拉Model 3和小米SU7展开竞争,主打运动操控性能,与家用定位的P7+形成差异化。

  • 腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

  • iQOO Pad5系列官宣5月见:全新PC级性能巨幕

    据了解,数码博主数码闲聊站”此前爆料,称iQOO今年上半年将推出两台旗舰定位平板电脑,尺寸为13英寸和12.1英寸。 其中,13英寸平板将采用3.1K分辨率LCD屏幕,搭载天玑9400 芯片,支持66W充电。

  • 女子遛娃回来发烧十多天确诊恙虫病:脏器损害 错过治疗窗口期

    深圳一名32岁甄女士带幼儿户外游玩后,突发高烧39℃并伴随头痛、恶心等症状,自行服药后症状反复加重,出现肝功能异常、乏力和食欲下降。就医确诊为恙虫病东方体感染引发的多器官功能障碍。该病通过恙螨幼虫叮咬传播,潜伏期4-21天。患者因未及时发现叮咬痕迹错过早期抗生素治疗窗口,导致病情迁延至肝肾功能受损阶段。经针对性抗生素联合血液净化等综合治疗两周后康复。专家提醒夏季户外活动需避开植被茂密区域,若出现不明原因高烧和焦痂样皮损应及时就医并告知户外活动史。该病早期使用多西环素等抗生素治疗有效率超90%,延误诊治可能引发呼吸衰竭等严重并发症。