首页 > 传媒 > 关键词  > 正文

钉钉会议更新数字分身、对话生成虚拟背景等AI功能

2023-08-24 17:43 · 稿源: 站长之家用户

8 月 22 日,“骑到AI背上去” 2023 钉钉生态大会在上海举办。在数字员工专场分论坛上,钉钉副总裁、音视频事业部负责人赵加雨发表主题演讲,分享了钉钉音视频在智能化方面的进展和应用,以及基于钉钉AI PaaS,视频会议场域未来的开放展望。

赵加雨谈到,钉钉从 4 月就宣布要全面接入大模型,完成智能化再造,随着AI与音视频的结合越来越深入,钉钉会议里也实现了诸多创新应用,除了之前的实时翻译、字幕转写、智能摘要,这次还发布了数字分身代替参会、自然语言控制会议操作、文生虚拟背景三项新功能。其中,数字分身可以在会议时间发生冲突时,替代用户列席参会,并能实时同步相关会议信息和结论。

他表示,未来,钉钉音视频希望能将更多的场域开放给生态伙伴,共同构建丰富的、有价值的应用,提升用户的体验和效率。同时,钉钉也计划将音视频SDK嵌入生态伙伴的应用中,共同打造优质、易用的音视频解决方案,满足不同行业和场景的需求。

以下为赵加雨的演讲全文:

体验和智能化,是钉钉音视频事业部过去一年两个核心的关键词。

在体验方面,去年我们成立了专项,从内到外做了大量的优化,现在钉钉会议的整个界面交互上,会更美观、更便捷、更沉浸。同时,在底层技术架构上,从采集、播放、编解码、网络到服务端,我们也做了全链路的优化。音视频尤其是视频会议,我们开会的时候最基本的诉求就是能够开好会,听得到对方的声音,所以我们在音频算法、抗弱网方面做了提升,也期待大家可以多使用我们的钉钉会议。

讲到智能化,其实视频会议这个领域在这次大模型之前,就和AI做了非常多的结合,在音频算法、视频算法中融入了AI技术。比如,视频算法相关的AI应用,有美颜、虚拟背景,这些都是大家非常熟悉的场景应用。而音频算法也结合了AI实现更好的降噪效果,目前,钉钉会议上已经支持消除 300 多种常见噪音,比如汽车喇叭声、键盘敲击声,让用户开会更专注。

我们在会议里还有一种常见的需求就是字幕,本质上也是AI能力。现在钉钉会议里也全面接入了阿里通义听悟,支持中英日三种语言的互译,实现实时的转写和翻译。此外,还有智能导播,大家在会议室开会时,如果有线上同事一起加入讨论,就会出现坐得太远听不清,或者说个话对方听不到的情况。我们的蜂鸣鸟音频实验室将AI和原创差分阵列技术相结合,可以实现单会议设备 10 米远举例拾音。当发言人说话时,支持准确的声源定位,实时跟踪并放大他的头像,让每个发言人都成为C位,营造更好的对话感。

随着大模型时代的到来,我们也进行了相关的研究,希望用大模型把钉钉会议重做一遍。今天钉钉推出了全新的AI PaaS智能化底座,并面向生态伙伴开放。在钉钉会议里,我们利用AI PaaS也实现了非常多有意思的功能。

第 一,是会议数字分身代替开会。职场人士每天都会面临文山会海,文山现在我们通过智能文档帮大家解决掉,会海我们也做了一些尝试,为用户提供了数字分身这个能力。如果你会议冲突或者这个会议和你的关联度没那么高,就可以让你的数字分身代替你去开。开会过程中,你可以通过钉钉魔法棒的对话框,主动给它设置一些任务,比如关注特定的话题,当有人讨论到这个话题时,AI就会自动通知你而且告诉你相关内容。你也可以设定数字分身每隔几分钟给你发送一个会议总结,还可以主动和数字分身对话,了解各种信息,比如会议里有哪些人、大家有没有产生什么争议,会议结束还会自动推送会议摘要给你。

第二,是用自然语言做会议智能控制。过去有很多用户吐槽钉钉功能太多,入口不好找,钉钉会议其实也面临这个问题,虽然我们做了大量简化,但是钉钉会议这个产品对一些用户来说使用门槛依然有点高。今天我们通过钉钉魔法棒里的智能助手把功能操作简化掉,你只需要通过自然语言提出你的需求,AI会自动识别意图并帮你完成操作,比如会议里人太多的时候,有人不小心开麦了,你去找到这个人并把它静音掉会比较麻烦,你可以告诉AI把正在说话的人静音,拉人加入会议的时候也可以直接打字拉人无需关心入口在哪里。通过这些能力,我们让会议的操作、管理变得更简单。

第三,是文生虚拟背景。虚拟背景一直很受用户喜爱,尤其是过去几年,我们“祖国的小花朵”们把这个功能玩出了花,一会在“太空里上课”,一会在“大草原上上课”,我们日常工作中也会用到,可以有效避免背景杂乱的尴尬。以前大家用虚拟背景除了已有的模板图片外,自己需要导出去搜索下载图片上传,现在不用了,我们通过文生图自动生成虚拟背景,彻底解放想象力。

接下来,钉钉会议也将通过AI PaaS逐步做应用的开放,帮助合作伙伴做场景升级,未来更多的生态产品可以嵌入到钉钉会议中使用,比如面试、白板等应用。比如我们近期正在和招聘合作伙伴共创的面试助手,面试过程中对话AI就可以通过简历内容、沟通信息得到实时的辅助。我们希望做好体验和开放,在智能化的时代,和生态伙伴一起给用户带去更多有意思、有价值的场景应用。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • 小米15推送HyperOS 2.0 Beta更新:新增长按电源键与超级小爱持续对话功能

    小米昨日晚间面向小米15用户推送了HyperOS 2.0.230.18.WOCCNXM Beta版系统更新,更新包大小约为360MB。本次更新主要针对电源键功能和设备重启体验进行了优化。这也是小米15自从7月3日以来推送的第三版基于安卓16的HyperOS Beta版推送。

  • 腾讯旗下AI工作台ima上线新功能:支持上传文件生成AI播客

    腾讯旗下AI工作台ima迎来重大升级,以活知识库 大模型的深度耦合重构知识管理体系。 此次更新突破性地实现了多模态知识转化用户上传文件即可生成AI播客,Xmind思维导图经智能解析后自动沉淀为结构化知识库,共享知识库更支持关键信息置顶功能。 这些创新使得碎片化知识如同被注入生命力,通过动态重组转化为驱动组织进化的智能中枢。

  • 马斯克母亲发帖支持儿子:演示Grok视频生成功能

    近日,马斯克母亲梅耶-马斯克发帖演示支持马斯克的Grok视频生成功能。 她表示,这次我把手指放在了最近在X上发布的这张照片上,提示是用Grok制作视频”,现在自己的狗摇着尾巴了,自己玩得很开心。 她还特别提示,这个视频由@grok Imagine制作。

  • 跨境卖家如何用AI“偷懒”还多赚钱?揭秘卖家精灵AI功能矩阵的躺赢秘诀

    文章介绍了AI在跨境电商运营中的重要作用,重点推荐了"卖家精灵"AI工具。该工具提供三大核心功能:1)AI市场洞察,3分钟生成包含市场规模、竞争格局等9大模块的深度分析报告;2)AI-Keepa分析,自动识别竞品价格策略、断货情况等关键数据;3)AI评论分析,从海量评论中提炼6大维度消费者需求。此外还有AI Listing生成器,能快速产出高转化率的产品描述。这些AI工具能帮助卖家节省时间,将精力集中在发现商机、制定策略等高价值事务上。目前注册用户每天可免费使用10次分析功能。

  • 销售易×腾讯会议:线上沟通效率开挂,别让会议拖垮打工人

    文章探讨了销售人员线上会议面临的三大痛点:会前准备低效、会中信息零散、会后跟进乏力。通过销售易CRM与腾讯会议的深度集成,实现了会前自动同步客户资料、智能邀约;会中实时识别关键决策者、记录沟通要点;会后自动生成会议纪要并同步至CRM系统。数据显示,87%的销售人员需切换3个以上系统筹备会议,23%的会议因人员缺席被迫改期。集成方案使会议筹备时间从1小时缩短至30分钟,客户到会率提升,信息遗漏减少,有效解决了销售团队跨系统操作、数据割裂的难题。

  • Try Galaxy更新!在自己手机即可体验更便捷、直观、可定制化的Galaxy创新功能

    三星8月7日推出新版"Try Galaxy"应用,让用户在购买最新Galaxy旗舰产品前,能在现有手机上体验三星创新功能。该应用支持iOS和安卓用户体验One UI 8界面、照片助手、音频橡皮擦等AI功能,以及折叠屏旗舰的创新体验。新版主要更新包括:1)采用One UI 8界面和最新壁纸;2)新增照片助手的"消除建议"AI功能;3)提供Fold7/Flip7的3D交互体验;4)展示穿戴设备新品。用户无需换机即可通过扫码下载最新版应用,全面了解Galaxy产品的独特优势。

  • 87%从业者推荐:AI工具产品库版本更新实时追踪方案

    当前AI工具市场存在严重信息过载问题:87%从业者难以甄别有效工具信息,38%用户因信息滞后错过重要升级,平均每周浪费3.7小时验证工具功能。AIbase通过三大核心机制破解困局:1)动态更新的工具数据库,每日人工审核300+主流AI工具变更记录;2)多维筛选系统,支持按行业/预算/技术栈精准过滤;3)透明对比矩阵,直观展示工具评分和版本差异。实际案例显示,使用该平台的企业平均月省1400美元,工作效率提升50%。平台突破传统导航站局限,实时标注工具变更、揭露隐藏条款,让用户不再需要记忆30个官网更新或社群求证。

  • 美乘客疑拍到超清晰UFO 喷气后消失:网友认为是AI生成

    ​近日,一则关于美国乘客在航班上拍摄到超清晰不明飞行物(UFO)的视频在网络上引发了广泛关注和热议。据视频显示,这起事件发生在从拉斯维加斯飞往西雅图的航班上,一名乘客在万米高空意外捕捉到了令人震惊的画面:一个圆盘状飞行物以稳定轨迹飞行,随后突然加速并喷出蓝色尾焰,在短短0.5秒内完全消失于云层之中。 该视频迅速在网络上发酵,登上社交媒体热搜�

  • KTV用AI生成的MV惊现骷髅:顾客直呼“辣眼睛” 门店回应可切换

    ​近日,多名消费者在社交平台发帖吐槽魅KTV新上线的AI视频功能,称其生成的抽象画面严重破坏K歌体验。 走访多家魅KTV门店发现,部分门店已全面启用该AI系统。某门店工作人员透露,系统更新后所有歌曲默认播放AI生成视频,“但90%的顾客都会要求切换回原版MV,包厢服务人员可现场操作”。另一未更新系统的门店则表示,顾客仍可正常观看原唱MV。

今日大家都在搜的词: