首页 > AI头条  > 正文

豆包上线视频通话功能:支持实时互动 融合视觉语言输入能力

2025-05-24 09:19 · 来源: AIbase基地

豆包官方正式宣布豆包App推出实时视频通话功能。这一新功能的上线,为用户带来了全新的交互体验。

当用户在豆包App电话界面开启视频画面后,豆包便能依据真实场景与用户展开实时问答互动。其背后的模型具备融合视觉与语言输入的能力,可进行综合的深度思考和创作。

豆包上线视频通话功能:支持实时视频问答

据了解,此次豆包的升级依托于视觉推理模型。借助该模型,用户在生活、工作和学习中遇到问题时,能够随时与豆包进行视频对话,且豆包还支持联网搜索相关问题的答案。

官方详细介绍了用户开启与豆包视频对话的操作流程。用户只需将豆包App更新至最新版本,打开App对话框,选择“打电话”按钮选项,再点击右侧的“视频通话”,即可开启与豆包的视频对话。

  • 相关推荐
  • 豆包上线视频通话功能支持实时视频问答

    豆包官方微信公众号今日发文,宣布豆包App上线实时视频通话功能,用户在电话界面开启视频画面后,豆包能基于真实场景与用户进行实时问答互动,模型能够融合视觉与语言输入,进行综合的深度思考和创作。 据介绍,豆包本次升级基于视觉推理模型,支持联网搜索工作、生活和学习遇到的问题,随时可以和豆包视频对话。 官方表示,用户将豆包App更新到最新版后,打开�

  • 支付宝官宣好友语音通话功能上线:方便转账核实身份 防被骗

    支付宝5月12日上线好友语音通话功能,支持转账双方直接语音核验身份。该功能特点包括:通话过程展示对方认证真实姓名;不支持变声功能确保真实性;不保存通话内容保护隐私。用户可在隐私设置中选择是否向好友公开真实姓名,通话界面会显示昵称及"已认证"标识。功能支持麦克风和扬声器开关,可开启小窗模式查看支付记录等。通话界面除显示昵称外,还会在头像下方直接展示对方真实姓名。

  • 用AI图像融合工具创造无缝图像融合,带来震撼视觉体验!

    AI图像融合工具正式上线,为您带来最先进的AI图像融合技术。借助这款工具,用户可以轻松地将多张图片融合成一张创意十足的视觉作品,展现无与伦比的艺术效果。

  • 谷歌推出 Beam AI:将普通视频通话,转为逼真的 3D 沉浸式体验

    一位测试用户表示: “你甚至会忘记自己是在用科技交流。眼神是真实的,你能看出对方什么时候想说话,就像现实生活中一样。”

  • 努比亚首款!Z70S Ultra摄影师版支持无网实时通话

    努比亚Z70S Ultra摄影师版将于4月28日发布,支持无网实时通话功能。该机搭载双向卫星通信技术,可在无信号盲区实现通话和短信功能,相比地面网络更稳定可靠。新机还支持1公里内无网通话,适合地震救灾等应急场景。配置方面采用1.5K真全面屏,搭载骁龙8 Gen3平台,预计配备16GB内存+1TB存储和6600mAh大电池。相比卫星通信需空旷环境,该无网通话功能在障碍物遮挡时仍可使用,更适合地下场所等特殊环境。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 即梦总算赢了一次豆包

    进入5月份以来,字节进一步加大了对旗下视频生成应用即梦AI的重视程度。直观表现之一是,即梦AI在苹果中国区App Store免费应用下载榜上排名急速上升。 从5月13日开始,即梦AI已经超越字节旗下豆包和红果短剧两大常年霸榜前二的应用,首次登顶。

  • 中国移动推出AI速记功能:自动将通话转为文字记录

    快科技5月17日消息,在日常生活中,不少人养成了打电话录音的习惯。然而即便有录音,后期想要回顾其中的内容时,往往也会面临诸多不便。针对这一困扰,中国移动推出了极具实用性的AI速记功能。它能够自动将通话内容精准地转化为文字记录,还能贴心地为用户整理出摘要,极大地提高了信息获取的便利性。这项备受瞩目的功能,诞生于最近刚刚召开的移起AI2025年中国移

  • 腾讯混元上线“游戏工业级”视觉生成平台:效率最高提升数十倍!

    腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。

  • 腾讯云与宝德计算深化战略作,打造融合创新生态标杆

    5月13日,国产算力领军企业宝德计算机系统与腾讯云签署战略合作协议。双方将基于腾讯自研操作系统TencentOS与宝德自强®系列国产服务器,推出软硬一体化解决方案,共同推动国产计算能力向"好用"和"易用"发展。此次合作将加速创新产品在各行业核心业务场景的规模化落地,为中国数字经济发展注入新动能。宝德在服务器硬件领域积淀深厚,其ARM架构服务器连续多年蝉联中国市场占有率第一;腾讯云TencentOS已通过千万级设备部署验证。双方计划每年向全行业客户交付超万台软硬件一体机,构建覆盖全行业核心场景的"国产数字基座",助力形成良性的技术演进循环。

今日大家都在搜的词: