首页 > 传媒 > 关键词  > 语音转文字最新资讯  > 正文

腾讯会议发布腾讯天籁inside3.0,为厂商提供AI音视频算法解决方案

2024-04-17 17:21 · 稿源: 站长之家用户

AI时代,会议室的良好拾音和区分说话人技术,是实现语音转文字、字幕翻译和智能纪要等能力的前提。

4月17日,腾讯会议天籁实验室发布腾讯天籁inside3.0升级,在腾讯AI Lab多项技术加持下,推出16mic多模态人像分割解决方案,具备智能音幕功能,能够准确区分和定位会议室里的发言人,并升级了去混响效果。

同时,在本届InfoComm展会现场,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多家硬件厂商均推出了与腾讯会议合作的新一代场景方案和产品能力。通过领先的音视频与AI技术,腾讯会议正在持续助力厂商提升会议硬件的表现,提供听觉、视觉、内容上更加沉浸专注的会议体验。

发布腾讯天籁inside3.0,升级多项新能力

对线上参会人来说,线下会议室里多人并坐、仅有一个小窗口画面,想要准确分辨出是谁在说话,难度很大。

腾讯天籁inside3.0方案,涵盖AI+16阵列麦拾音矩阵+音视频多模态识别算法。具备智能音幕功能,能够准确区分和定位会议室里的发言人,并升级了去混响效果。

智能音幕能力,相当于在会议室里建立起虚拟音频屏障,让线上发言人只听到特定区域的声音,减少区域外的人声和噪声干扰。据介绍,智能音幕支持实时调整方向。

通过音视频多模态AI算法,腾讯天籁inside3.0还支持准确区分、定位发言人。基于这项能力并结合腾讯会议Rooms的多流技术打造的硬件,可以为每位发言人提供单独的视频画面,更接近在同一个会议室开会的体验,提升沟通的临场感。

天籁inside3.0还提升了去混响表现,并基于天籁16麦音频方案优化了降噪模型。实测显示,在多种会议室噪声的干扰下,无论发言人距离屏幕远近,线上都能清晰听到声音。

腾讯会议与MAXHUB联合发布了集成腾讯天籁inside3.0方案的两款产品。据介绍,腾讯天籁inside开放了底层坐标给合作厂商,厂商可自行定制发言人的画幅比例、多人对话时的切换速度、切换逻辑等,进行二次开发。

目前,天籁inside音频解决方案已覆盖一体机大屏、扩展麦、天花麦等产品,应用在MAXHUB、Newline、海信商显、耳目达、TCL、维海德、开得联、皓丽、大华以及华创等多家知名厂商的会议室硬件中。

生态伙伴超300家,与厂商联合推出多款硬件

本届InfoComm现场,多家参展厂商均在醒目位置展示了与腾讯会议合作的硬件解决方案。

例如,MAXHUB展示的腾讯会议Rooms21:9超宽屏沉浸式剧场布局,以及罗技展示的腾讯会议Rooms会议室三屏异显方案,能让参会者在不同屏幕中获取更多信息。其中,MAXHUB 视讯智真款 V7 21:9超宽屏在显示16:9屏幕共享内容的同时,左侧面板可展示文字聊天内容,右侧展示实时语音转写和翻译内容。

与poly联合展示的腾讯会议Rooms分体式+MRA方案,则为企业传统的会议终端扩展出更多新能力。在保护企业硬件资产投资的同时,让参会者更聚焦内容讨论。

在教育场景,腾讯会议与耳目达、维海德共同打造的AI培训教室方案,通过实时音视频能力与设备,支持跨校区、跨校际、跨国家教学交流,助力师生之间的有效互动交流更聚焦课程内容本身,课堂笔记交给智能纪要,让思考更沉浸。

在应急指挥场景,基于腾讯会议Rooms的多流能力,亿联推出的Meeting Board 65大屏,可以帮助指挥大厅看清远程指挥中心每个人的工作状态,有效提升工作沟通效率。

目前,腾讯会议的合作伙伴数量已超过300家,涵盖销售生态、硬件生态、天籁生态、ISV等多种场景,并涵盖多种场景解决方案。

腾讯会议于2019年11月上线,至今已稳定服务超25亿次协同,支撑了海量的办公、教学场景,助力各行业的办公人群实现日常办公、远程问诊、金融路演、互动营销等场景线上化,并推动线上教学、智慧教室成为教育行业的常见配置。在腾讯会议的助力下,大量企业实现提质增效。例如,助力腾讯公司自身一年节省成本5.7亿元。

IDC报告显示,腾讯会议位列中国云视频会议行业企业级市场第 一。目前,腾讯会议已经广泛服务金融、互联网、教育、医药、工业制造等行业,包括中国人民银行、清华大学、国家电网、中国交建、中国银行、美的、卫龙、国泰君安证券、北京朝阳医院等众多企事业单位,在多个行业的头部客户渗透率超过50%。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 思必驰RTOS大模型解决方案丨当玩具遇上AI,陪伴更有温度

    文章介绍了多款AI陪伴机器人产品,如LOVOT、Moflin、FoloToy等,它们通过创新交互方式引领消费新潮流。针对不同场景需求,思必驰推出RTOS大模型解决方案,融合智能对话技术与DFM-2大模型,整合第三方内容资源,赋予产品情感陪伴与寓教于乐功能。该方案具备智能打断、上下文记忆、多轮对话等能力,实现自然流畅的人机交互。在儿童教育领域,AI玩具可成为智慧伙伴,提供个性化学习支持。未来,AI赋能玩具将解锁更多应用场景,持续优化用户体验。

  • AICosts.ai深度评测:一站式AI成本管理解决方案

    随着ChatGPT等大模型的爆发式发展,企业AI支出正成为新的财务黑洞。AICosts.ai应运而生,这款专为AI密集型团队设计的成本管理平台,能聚合所有AI服务商的账单数据,提供可视化分析和优化建议。核心解决三大痛点:1)碎片化账单管理;2)异常监控;3)跨平台优化。通过实时仪表盘、多维筛选和预算预警等功能,某客户使用三个月后总支出降低28%。专业版定价49.99美元/月,特别适合月AI支出超1000美元的团队和使用多个AI服务的开发者。平台计划Q3推出Slack/Teams实时通知和AI优化方案自动生成功能。

  • 儿童排痰难题解决方案:易坦静与科学饮水

    文章讨论了儿童呼吸道感染时痰液滞留的危害及应对措施。主要内容包括:1)痰液滞留会加重咳嗽、喘息症状,阻碍康复,甚至延长病程;2)儿童因生理特点难以有效排痰;3)介绍了氨溴特罗口服溶液作为常用祛痰药的作用机制,能稀释痰液、促进排出;4)强调日常护理中少量多次饮水的重要性;5)提醒家长若症状持续或加重应及时就医。全文着重阐述了有效排痰对治疗儿童呼吸道感染的关键作用。

  • 企业如何安全应用DeepSeek?Gartner®推荐采用云厂商模型即服务(MaaS),腾讯作为云服务提供商之一被报告提及

    Gartner最新报告《如何安全使用DeepSeek》指出,企业在部署和应用DeepSeek大模型时需注意潜在安全风险,包括未授权访问、数据泄露等六大风险领域。报告建议预算有限的企业优先选择主流云服务商提供的MaaS(模型即服务)方案,腾讯云等具备完善安全机制的云厂商被重点推荐。对于私有化部署的企业,必须具备专业安全团队和长期运营能力。报告强调,随着生成式AI应用普及,企业需借助AI安全态势管理工具(AI-SPM)持续监测模型和数据安全状态。腾讯云依托成熟的安全架构,可提供企业级安全功能整合和合规保障,帮助客户应对AI应用带来的安全挑战。

  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 成本低、耗时少,华为鸿蒙智家后装解决方案破解老房改造难题

    2025年6月20-22日,华为开发者大会2025在东莞松山湖举行。会上华为终端BG董事长余承东宣布鸿蒙智能硬件生态品牌升级为"鸿蒙智选",已有25+生态伙伴加入。华为推出后装智能家居改造方案,最快24小时完成改造,无需破墙布线,支持混合组网稳定可靠。方案针对2.7亿套20年以上旧房改造需求,提供AI康养等场景化解决方案。鸿蒙智联生态已有2900+品牌伙伴,7800+款设备。华为还展示了新一代主动健康空气方案和空间智能化平台,推动行业创新。6月20-30日将举办"鸿蒙智选品牌周"促销活动。

  • Agent成了腾讯AI最大的牌面

    抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。 元宝、ima等原生AI应用是腾讯进行探索的最前线。腾讯元宝通过大规模市场投入获得用户增长后,继续拓展了更多能力,包括将元宝放入微信好友列表,打通与腾讯地图、腾讯文档的连接,以及上线Chrome浏览器插件。腾讯管理层目前还在观察用户对这些新增功能的反馈,判断哪些功能可以�

  • 小鱼易连亮相2025北京网络安全大会,筑牢新时代安全可信音视频底座

    2025北京网络安全大会(BCS2025)于6月5日在北京国家会议中心开幕。本届大会以"安全突围:重塑内生安全体系"为主题,汇聚全球顶尖专家和行业领袖,探讨AI安全创新与全球网络安全生态融合。小鱼易连作为中国电子自主计算产业体系代表参展,展示其"高安全·超融合·全连接"视频会议解决方案,通过自主可控技术构建覆盖"云-管-端-用"的全链路安全防护架构,已广泛应用于党政机关、金融、能源等关键领域。大会强调在"十四五"规划开局之年,网络安全已成为国家战略重点,需要各方共同推动数字中国安全发展。

  • Mediatom快应用聚合变现解决方案即将上线,敬请期待!

    Mediatom将全面支持快应用变现服务,为开发者提供高效灵活的解决方案。该平台通过动态分层优化和全竞价体系,帮助开发者对接多平台广告资源,最大化流量价值,预计可提升变现收益30%以上。其四大核心功能包括:一键接入主流广告平台、智能匹配最优广告形式、全样式素材支持及实时数据追踪。平台已服务5000+开发者,覆盖2万+款App,累计为开发者创收数十亿元。作为数字广告技术标杆,Mediatom凭借十年技术沉淀和安全可靠的聚合SDK平台,持续优化开发者变现效率。