首页 > AI头条  > 正文

8月30日上线!科大讯飞星火语音大模型更新“极速超拟人交互”

2024-08-19 09:14 · 来源: AIbase基地

科大讯飞星火语音大模型迎来了全新的升级,推出了名为“星火极速超拟人交互”的新一代交互体验。这一升级在多个方面进行了优化和增强,旨在为用户提供更加自然、流畅和富有情感的对话体验。

首先,新模型实现了更快的响应速度,采用了端到端的语音到语音建模技术,使得即便在频繁打断的情况下也能迅速反应,更加贴近日常对话的实际情境。

其次,星火极速超拟人交互在情绪感知方面进行了显著提升,不仅能够根据语音文本判断用户情绪,还能识别咳嗽、宠物叫声等非语言信号,实现更深层次的情感共鸣。新版本能够识别高兴、悲伤、生气、害怕等多种情绪,并自动调整回复的语气和情绪,使对话更加贴心和有温度。

微信截图_20240819091316.png

此外,新模型在表达方式上更加灵活,可以根据用户的指令控制数十种情感、风格、方言,甚至调节语速,为用户提供更加个性化的交流体验。

同时,星火极速超拟人交互支持多种人设的任意切换,用户可以与孙悟空、蜡笔小新、小猪佩奇等角色进行互动,享受与不同角色对话的乐趣。

星火极速超拟人交互计划于8月30日在讯飞星火APP上线,届时将向全民开放体验,让用户能够亲身感受这一创新交互技术带来的全新体验。

  • 相关推荐
  • 共创欧美本土品牌破局之路:科大讯飞×出海启明星品牌游学圆满收官

    8月15日,由讯飞AI营销联合出海启明星、万里汇WorldFirst主办的"走进科大讯飞"品牌游学活动在深圳圆满收官。活动聚焦"共创欧美本土品牌营销的破局之路"主题,40余家出海头部品牌负责人通过深度洞察、实战分享与圈层交流,探讨中国品牌全球化进程中的核心痛点。讯飞AI营销展示了其AI驱动的程序化广告平台GrowOne、红人营销平台iFLYTalent等解决方案,已服务1800+客户,覆盖20亿用户和100个国家。活动通过行业大咖实战经验分享,为出海企业提供了从产品营销到品牌落地的全链路策略,助力中国品牌突破全球化壁垒,实现从本土品牌到"全球爆款"的跨越。

  • OpenAI和科大讯飞,瞄准了同一件事

    OpenAI正式发布GPT-5大模型,距离GPT-4推出已29个月。GPT-5虽仍是当前最全面的模型,但性能提升未与主流模型拉开显著差距,部分场景甚至被Grok4和Claude+Opus4.1超越。OpenAI强调此次升级重点在于减少幻觉、提升指令遵循能力和降低模型谄媚性,而非单纯追求性能突破。与此同时,国产大模型代表星火X1也在7月25日升级,同样聚焦解决幻觉问题,在事实性幻觉和忠诚性幻觉治理上取得突破。全球顶尖大模型正从"能用"向"好用"转变,OpenAI和科大讯飞都通过多目标奖励机制和思维链监控等技术手段改善模型可靠性。星火X1已全面赋能教育、医疗、企业应用等行业,在复杂场景任务上满足用户核心需求。大模型产业已进入规模化落地关键期,中国人工智能产业正从追赶走向领先阶段。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 8月27日-30日,每日互动与您相约数博会,不见不散!

    2025中国国际大数据产业博览会将于8月27日至30日举办,由国家数据局主办,聚焦"数聚产业动能,智启发展新篇"主题。每日互动作为数据智能领军企业,将重点展示其AI系列产品,特别是10万元级AI一体机GAI+Station,内置8大模型能力,为企业提供一站式AI落地解决方案。同时推出"发数站"战略,促进数据要素流通。展会期间将开展产品体验活动,现场可测评AI工具,�

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 从多语破壁到生态共建 科大讯飞如何以全栈自主可控大模型赋能中国AI出海?

    2025世界人工智能大会(WAIC)上,科大讯飞展区成为焦点,展示20余款AI产品,呈现技术创新与产业赋能成果。其星火语音大模型支持37种主流语言,效果超越OpenAI Whisper v3,并覆盖130+语种和8万专业词汇。讯飞还举办多语言国际研讨会,汇聚20国30位专家,构建亚欧学术交流平台。作为中国AI领军企业,讯飞坚持自主可控技术路线,打造开放共赢生态,已在新加坡等地建立站点,拥有52.4万海外开发者。从大阪世博会到WAIC,讯飞正推动中国AI技术走向全球舞台中央,展现中国智慧。

  • 8月健康投资指南:燕荚护心爆品+儿童营养,花1份钱享3份健康

    文章介绍了现代人心脏健康面临的挑战,以及燕窝平台推出的健康管理方案。主要内容包括:1)心脏健康问题日益严重,我国超40%死亡与心血管疾病相关;2)燕窝平台推出Brillowel辅酶Q10等护心产品,帮助改善心脏功能;3)inne儿童营养品针对不同年龄段需求提供科学配方;4)816超级优惠季活动,包含限时特惠、满赠福利等多项优惠。平台优势在于全球甄选品质保障、科学定制化管理和全程健康护航服务。文章呼吁重视健康管理,通过燕窝平台获取专业健康解决方案。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • vivo Vision官宣8月21日发布:佩戴舒适 设计超前

    就在刚刚,vivo正式官宣了自家新产品的发布时间。根据vivo官方公告,8月21日下午14点30分,备受期待的Vision将正式与大众见面。 vivo Vision被看作是类苹果Vision Pro的MR头显设备,从目前透露的信息来看,它在交互体验方面有着超前的设计。vivo产品经理韩伯啸提前剧透了不少关键细节,引发了众多科技爱好者的关注。 韩伯啸着重强调了vivo Vision的佩戴舒适性,他表示这款设备非�

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

今日大家都在搜的词:

热文

  • 3 天
  • 7天