首页 > 业界 > 关键词  > 端到端语音大模型最新资讯  > 正文

国内首个!端到端语音大模型心辰Lingo在外滩大会正式发布上线

2024-09-05 22:42 · 稿源:站长之家

站长之家(ChinaZ.com) 9月5日 消息:9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。

“心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。作为国内首个端到端语音大模型,它开创了人机交互新方式。

(西湖心辰CEO发布国内首个端到端语音大模型心辰Lingo)

全球权威咨询机构IDC分析预测,到2030年,全球智能语音服务市场的价值将达到约731.6亿美元,年复合增长率预计将达27%。全球范围内的科技公司都敏锐地捕捉到了这一领域的增长潜力,纷纷投身智能语音技术的开发,一场全新的人机交互革命正在被点燃。

“心辰Lingo能捕捉到语音中的细微变化,不仅能理解你说了什么,还能理解更想表达什么,真正做到了为AI赋予‘高情商’,使其能够精准洞察言外之意。这也是西湖心辰作为持续深耕大模型情商能力又一个重要技术突破。”西湖心辰CEO醒辰在发布会现场表示。

据介绍,心辰Lingo语音大模型的能力在多个领域和中文上进行增强,使得心辰Lingo的中文语音效果,相较GPT4o更为出色。主要有三个技术特征。

一是原生的语音理解。作为端到端模型,心辰Lingo不仅能够识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,更全面地理解语音内容,从而提供更加自然和生动的交互体验。二是多种语音风格表达。心辰Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。三是,语音模态超级压缩。心辰Lingo采用具有数百倍压缩率的语音编解码器,能够将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。

心辰Lingo开放内测预约不到10天,已经有超千家企业用户预约测试,包括了教育、金融、医疗健康、政府与公共服务、媒体与娱乐、零售与商业服务、制造与工程等八大行业,数十个实际使用场景。

市场层面对心辰Lingo的应用空间作出了积极反馈。在心理健康咨询场景下,某医院拟运用心辰Lingo的语音技术提供患者心理咨询和干预,通过AI智能对话系统,为患者提供情绪支持,帮助他们应对疾病带来的心理压力;在客户服务与支持场景下,某知名产险企业,希望利用心辰Lingo的语音技术进行客户服务和外呼,针对退保挽留和续保挽留等自动外呼场景,通过智能语音系统提高服务效率和客户满意度。此外,陪伴领域还涌现出一系列个性化需求,如游戏语音陪伴、社交辅助助手、语音母婴看护等,这些需求的多样性和创新性为心辰Lingo提供了广阔的应用前景。

发布现场,醒辰透露,西湖心辰即将在10月份发布基于心辰Lingo进行领域深度训练的儿童陪伴、心理疏导、销售服务3大垂类语音模型,与更多行业领袖携手,共同推动AI技术的创新和应用,开启智能服务的新篇章。

西湖心辰是一家致力于人工智能多模态大模型技术研究及产业化应用的创新企业,背靠中国新型研究性大学“西湖大学”。外滩大会期间,西湖心辰创始人蓝振忠还获得了首届蚂蚁InTech科技奖。目前,西湖心辰已获得汤姆猫、蓝驰创投、凯泰资本、百度风投、西湖科创投,西湖教育基金会可持续发展平台等知名机构数千万美金投资。

举报

  • 相关推荐
  • Soul App全双工语音大模型升级,让AI在交互中拥有“主动性”

    社交平台Soul App近日升级端到端全双工语音通话大模型,重新定义"全双工"交互模式。新模型突破传统语音交互依赖VAD机制与延迟控制逻辑的局限,赋予AI自主决策对话节奏的能力,实现主动打破沉默、适时打断用户、边听边说、时间语义感知等类人交互体验。同时具备多维度感知、口语化表达、音色复刻等功能,让AI更具"真人感"。该技术将应用于虚拟人实时通话、AI匹配1V1互动等场景,并探索多人互动场景应用。Soul CTO陶明表示,社交是情绪价值和信息价值的双向关系,平台将持续通过技术创新为用户提供更智能、沉浸的社交体验。数据显示,71.1%年轻人愿意和AI做朋友建立情感连接,AI社交正成为重要趋势。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 小米MIX Flip 2开启预约:将于6月底正式发布

    今日,小米MIX Flip2在小米官网正式开启预约,该机将于6月底正式发布,引发众多消费者关注。 据数码博主“数码闲聊站”透露,小米MIX Flip2是目前唯一一款满配旗舰小折叠手机,其体验可看齐直板旗舰。它搭载了3nm骁龙8至尊版芯片,性能强劲,并且成功解决了小折叠手机常见的发热和续航问题,为用户带来更稳定、持久的使用体验。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 赛思获评国内通信大厂S级供方,跻身国产SLIC语音芯片领军者行列

    浙江赛思电子科技凭借卓越技术实力和产品质量,获国内头部通信大厂"2025年质量绩效S级供应商"认证,其自主研发的ASX630系列SLIC语音芯片填补了国内技术空白。该芯片具备高性能传输、可编程设计等优势,能快速提供电信级FXS解决方案,大幅降低硬件迭代成本。此前我国通信基建长期依赖进口SLIC芯片,每年需求达上亿颗。赛思通过"设计-制造-封测"全链条品控体系,确保产品性能稳定,已与国内通信大厂在技术创新、供应链协同等方面展开深度合作,共同推动通信核心器件国产化进程。

  • 雷军官宣YU7样车到店:月底正式发布

    在外观细节方面,YU7亮点颇多。它拥有镂空水滴大灯,造型凌厉,同级中唯一嵌入贯穿式风道,光环尾灯简洁立体,辨识度极高。此外,车辆配备电动内翻门把手,当用户靠近时,门把手会自动内翻,关门时则自动闭合。 为提升性能,小米对YU7进行了全车40多处的风阻优化,使其风阻系数仅为0.245Cd。这一优化成果显著,相比优化前,车辆的CLTC续航增加了59km。

  • 罗马仕深夜正式发布停工停产通知:宣布停工停产半年

    今天凌晨1点左右,罗马仕正式发布停工停产放假通知。通知中称,鉴于市场环境的不断变化以及公司业务发展的实际需求,经公司股东会慎重研究决定,公司将于近期停工停产。 此次停工自2025年7月7日起,预计持续6个月,除召回相关工作所需员工外,其余员工均将停工停产。在停工首月,罗马仕将按照既定标准正常支付员工工资;而从次月起,则将依据当地最低工资标准的80%