首页 > AI头条  > 正文

字节跳动豆包大模型支持实时语音通话:可随时打断、实时秒回

2024-08-09 14:05 · 来源: AIbase基地

今日,字节跳动旗下云服务平台火山引擎宣布,豆包大模型已支持实时语音通话新功能。

据悉,火山引擎提供的对话式 AI 实时交互解决方案,结合了火山方舟大模型服务平台和豆包的语音识别与合成模型,简化了语音到文本和文本到语音的转换过程。这一方案实现了高效的语音数据采集、处理和传输,提供了卓越的智能对话和自然语言处理能力。

字节跳动抖音豆包大模型

火山引擎 RTC 基于音频3A 处理技术,有效解决了“双讲”现象,确保语音识别的准确性和实时性。同时,利用 WebRTC 传输网络,实现了全球范围内的超低延迟、稳定可靠的实时音视频传输服务。

火山引擎还提供了灵活、多样化的接入方案,包括自集成方案和基于 WebRTC 标准协议的传输网络方案,以满足不同企业的具体需求。

此外,火山引擎的大模型多模态实时交互服务已为国内一些头部 AI 虚拟人物聊天应用提供了 AI 实时语音能力,带来了全新的互动体验。火山引擎将持续提供高质量的音视频能力和 AI 能力,助力企业在 AI 实时音视频领域实现创新。

  • 相关推荐
  • 奔驰新款CLA接入豆包大模型

    4月22日,奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构,接入火山引擎大模型,支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈,交互效率提升50%,唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型,结合生成式AI和大数据技术,为中国用户打造更智能的用车体验。

  • 长安马自达EZ-60全球首秀,接入豆包大模型

    4月23日,长安马自达EZ-60在2025上海国际车展全球首发。作为品牌新能源战略转型产品,该车在美学设计、AI智能座舱、电感驾控及主被动安全性能等方面实现突破。最大亮点是全面接入豆包大模型,用户可通过语音指令实现复杂操作、互联网信息问答及短视频搜索等功能,打造"人-车-环境"跨模态交互体验。专属AI助手支持超700项功能语音调用,实现"所说即所得"的智能交互。长安马自达与火山引擎达成深度合作,将持续推进大模型在智能座舱领域的创新应用。

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • 伟世通×火山引擎:发布基于豆包大模型的智能座舱解决方案

    2025年上海车展期间,火山引擎与伟世通联合发布基于AI大模型的下一代智能座舱解决方案。该方案融合豆包大模型AI能力和伟世通高性能域控平台,通过端云协同架构和多模态交互技术,实现离线功能闭环运行和快速响应。方案接入火山丰富的内容生态,支持个性化推荐和"千人千面"自适应设计,同时具备多模态交互能力,实现更自然的人机交互。双方还将共同探索AI大模型在智能座舱场景的优化适配,助力车企打造差异化智能座舱体验。

  • 宝马×字节跳动:以AI赋能汽车营销创新变革

    4月18日,华晨宝马旗下领悦数字信息技术公司与字节跳动旗下火山引擎达成合作,双方将围绕AI技术在汽车营销服务的创新应用展开深度合作。通过AI+场景的高效匹配,实现产品精准推荐、内容智能引导,提升用户购车体验与经销商运营效率。宝马集团大中华区总裁高翔表示,此次合作是宝马"360度全链AI战略"在营销领域的重要实践。领悦公司将借助火山引擎的大模型技术,打造专属智能营销工具,提供24小时在线客服、个性化推荐等服务。这是双方自2019年以来的第三次合作,此前已在数字化运营、直播营销等领域取得成果。此次合作标志着宝马加速推进AI技术在全业务链的应用,持续深化中国市场数字化转型。

  • 字节跳动AI眼镜有新动作! 已和供应商“搭上线”

    有知情人士透露了字节跳动在AI硬件领域的又一重大布局计划推出自家的AI智能眼镜。字节跳动自去年起便已启动AI眼镜项目。意在为豆包寻找更广泛的C端应用场景,提升用户粘性和使用频率;另一方面,通过打通软硬件,构建更加完整的生态系统,为公司的长远发展奠定坚实基础。

  • 腾讯稳居全球移动发行商收入榜第一!字节跳动排第二

    近日,SensorTower发布了《2024年全球移动发行商收入TOP50》榜单。在2024年,全球消费者在移动应用市场的付费首次突破1500亿美元,同比增长13%。来自中国的厂商莉莉丝游戏、三七互娱、叠纸网络等也出现在了榜单中。

  • 突破经验依赖!字节跳动放宽招聘年限:毕业三年内人才招聘量将扩大一倍

    近期,字节HR团队召开内部政策会,要求招聘突破经验依赖”,不止招经验丰富的人,也要多招毕业不久的优秀的人。今年计划对毕业三年以内的青年人才招聘量扩大一倍,毕业三年以上社招占全年社招的比例还是会保持在70%。招聘开放10大技术领域,共计44个课题,涵盖大模型应用、搜索/推荐/广告、计算机体系结构与系统优化、安全/AISafety、硬件、AICoding、视频架构、AIGC、AIforScience、机器人等技术领域。

  • AI日报:昆仑万维开源Skywork-OR1系列模型;讯飞星辰Agent开发平台全面支持MCP;字节跳动布局AI智能眼镜

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4oMoonshot AI 最近开源了 Kimi-VL 和 Kimi-VL-Thinking 两款视觉语言模型,展现出卓越的多模态理解与推理能力。这些模型采

  • 字节发布豆包1.5深度思考模型:“实拍级”图像生成

    快科技4月17日消息,据报道,今日,在火山引擎AI创新巡展杭州站的现场,字节跳动旗下火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出,豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任务方面,同样表现出色。该模型采用MoE架构,总参数为200B,激�

今日大家都在搜的词: