首页 > 传媒 > 关键词  > 正文

钉钉会议更新数字分身、对话生成虚拟背景等AI功能

2023-08-24 17:43 · 稿源: 站长之家用户

8 月 22 日,“骑到AI背上去” 2023 钉钉生态大会在上海举办。在数字员工专场分论坛上,钉钉副总裁、音视频事业部负责人赵加雨发表主题演讲,分享了钉钉音视频在智能化方面的进展和应用,以及基于钉钉AI PaaS,视频会议场域未来的开放展望。

赵加雨谈到,钉钉从 4 月就宣布要全面接入大模型,完成智能化再造,随着AI与音视频的结合越来越深入,钉钉会议里也实现了诸多创新应用,除了之前的实时翻译、字幕转写、智能摘要,这次还发布了数字分身代替参会、自然语言控制会议操作、文生虚拟背景三项新功能。其中,数字分身可以在会议时间发生冲突时,替代用户列席参会,并能实时同步相关会议信息和结论。

他表示,未来,钉钉音视频希望能将更多的场域开放给生态伙伴,共同构建丰富的、有价值的应用,提升用户的体验和效率。同时,钉钉也计划将音视频SDK嵌入生态伙伴的应用中,共同打造优质、易用的音视频解决方案,满足不同行业和场景的需求。

以下为赵加雨的演讲全文:

体验和智能化,是钉钉音视频事业部过去一年两个核心的关键词。

在体验方面,去年我们成立了专项,从内到外做了大量的优化,现在钉钉会议的整个界面交互上,会更美观、更便捷、更沉浸。同时,在底层技术架构上,从采集、播放、编解码、网络到服务端,我们也做了全链路的优化。音视频尤其是视频会议,我们开会的时候最基本的诉求就是能够开好会,听得到对方的声音,所以我们在音频算法、抗弱网方面做了提升,也期待大家可以多使用我们的钉钉会议。

讲到智能化,其实视频会议这个领域在这次大模型之前,就和AI做了非常多的结合,在音频算法、视频算法中融入了AI技术。比如,视频算法相关的AI应用,有美颜、虚拟背景,这些都是大家非常熟悉的场景应用。而音频算法也结合了AI实现更好的降噪效果,目前,钉钉会议上已经支持消除 300 多种常见噪音,比如汽车喇叭声、键盘敲击声,让用户开会更专注。

我们在会议里还有一种常见的需求就是字幕,本质上也是AI能力。现在钉钉会议里也全面接入了阿里通义听悟,支持中英日三种语言的互译,实现实时的转写和翻译。此外,还有智能导播,大家在会议室开会时,如果有线上同事一起加入讨论,就会出现坐得太远听不清,或者说个话对方听不到的情况。我们的蜂鸣鸟音频实验室将AI和原创差分阵列技术相结合,可以实现单会议设备 10 米远举例拾音。当发言人说话时,支持准确的声源定位,实时跟踪并放大他的头像,让每个发言人都成为C位,营造更好的对话感。

随着大模型时代的到来,我们也进行了相关的研究,希望用大模型把钉钉会议重做一遍。今天钉钉推出了全新的AI PaaS智能化底座,并面向生态伙伴开放。在钉钉会议里,我们利用AI PaaS也实现了非常多有意思的功能。

第 一,是会议数字分身代替开会。职场人士每天都会面临文山会海,文山现在我们通过智能文档帮大家解决掉,会海我们也做了一些尝试,为用户提供了数字分身这个能力。如果你会议冲突或者这个会议和你的关联度没那么高,就可以让你的数字分身代替你去开。开会过程中,你可以通过钉钉魔法棒的对话框,主动给它设置一些任务,比如关注特定的话题,当有人讨论到这个话题时,AI就会自动通知你而且告诉你相关内容。你也可以设定数字分身每隔几分钟给你发送一个会议总结,还可以主动和数字分身对话,了解各种信息,比如会议里有哪些人、大家有没有产生什么争议,会议结束还会自动推送会议摘要给你。

第二,是用自然语言做会议智能控制。过去有很多用户吐槽钉钉功能太多,入口不好找,钉钉会议其实也面临这个问题,虽然我们做了大量简化,但是钉钉会议这个产品对一些用户来说使用门槛依然有点高。今天我们通过钉钉魔法棒里的智能助手把功能操作简化掉,你只需要通过自然语言提出你的需求,AI会自动识别意图并帮你完成操作,比如会议里人太多的时候,有人不小心开麦了,你去找到这个人并把它静音掉会比较麻烦,你可以告诉AI把正在说话的人静音,拉人加入会议的时候也可以直接打字拉人无需关心入口在哪里。通过这些能力,我们让会议的操作、管理变得更简单。

第三,是文生虚拟背景。虚拟背景一直很受用户喜爱,尤其是过去几年,我们“祖国的小花朵”们把这个功能玩出了花,一会在“太空里上课”,一会在“大草原上上课”,我们日常工作中也会用到,可以有效避免背景杂乱的尴尬。以前大家用虚拟背景除了已有的模板图片外,自己需要导出去搜索下载图片上传,现在不用了,我们通过文生图自动生成虚拟背景,彻底解放想象力。

接下来,钉钉会议也将通过AI PaaS逐步做应用的开放,帮助合作伙伴做场景升级,未来更多的生态产品可以嵌入到钉钉会议中使用,比如面试、白板等应用。比如我们近期正在和招聘合作伙伴共创的面试助手,面试过程中对话AI就可以通过简历内容、沟通信息得到实时的辅助。我们希望做好体验和开放,在智能化的时代,和生态伙伴一起给用户带去更多有意思、有价值的场景应用。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:即梦3.0内测直出2K商业海报;ChatGPT又更新图片生成功能;饿了么推“AI入驻智能经理”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。7、Genspark发布自动化AI代理SuperAgent具备自主思考、调用工具的能力Genspark最近推出了其全新的自动化AI代理SuperAgent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。用户只需输入感兴趣的主题,系统便能�

  • iPhone17有望全系配12GB内存 为强化AI功能做准备

    天风国际分析师郭明錤最新报告指出,苹果iPhone17系列中的Air、Pro及Pro Max机型将统一搭载12GB内存,较前代产品显著提升。苹果正在评估是否将12GB内存扩展至标准版机型,但因供应链产能存在不确定性,最终方案预计2024年5月敲定。此次升级被认为是苹果为强化AI功能适配性所做的技术妥协,此前iPhone16系列因AI框架Apple Intelligence需至少8GB内存被迫打破长期采用的差异化内存策略。行业观察人士指出,随着设备端AI能力要求提升,现有8GB内存已难以满足本地化AI模型的高效运行需求。

  • AI暂时生成不了鲁迅和张爱玲,但别高兴太早

    “你看看篇文章,像不像是AI写的?”一个普通的工作日,我把一篇稿子发给编辑部的同事,随后对此展开AI文风大讨论。这篇稿子短短两千字,却出现了三个“有人认为”,外加三个“有网友认为”。倘若不加以修正,人类语料所要经受的“大屠杀”,或许也将成为AI时代的固有可能。

  • ChatGPT上线图库功能:可管理AI生成图片

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

  • MAXHUB亮相数字中国建设峰会:AI重构会议体验,数据驱动企业决策

    第八届数字中国建设峰会以"数智引领高质量发展"为主题,聚焦数据要素价值释放。MAXHUB推出AI会议解决方案2.0,通过智能硬件升级和国产化系统,实现会议全流程数字化:会前自动匹配日程、会中精准记录多模态信息、会后5秒生成图文纪要。其领效星云平台打通企业数据孤岛,构建统一数字基座,满足金融等高安全需求行业的国产化部署要求。该方案将传统会议室升级为智能协作空间,实现从"手动低效"到"AI增效"的转变,助力企业释放数据价值。

  • 全球首部AI电影登陆院线:70分钟的长片,AI怎么做?|对话主创

    全球首部AI长片《海上女王郑一嫂》在新加坡上映,标志着AI影视制作进入新阶段。该片由FizzDragon团队耗时两年完成,通过AI技术生成70分钟完整剧情和流畅画面,突破了AI内容时长限制。制作过程中面临剧本复杂度、人物一致性、镜头调度等挑战,团队采用分镜训练AI、后期人工修正等方式解决技术瓶颈。影片原型为传奇女海盗郑一嫂,展现了女性在男性主导领域的奋斗历程。 文章指出AI影视制作已从短片扩展到长片领域,但技术仍存在局限:长镜头和复杂对白处理困难,人物形象难以保持完全一致。Netflix、芒果TV等平台已尝试AI动画和综艺制作,而《流浪地球2》《封神第一部》等商业大片也运用AI技术提升特效效率。 业内态度从抵触转向接纳,AI可降低60%重复性工作成本,成为创作效率的"双轮驱动"。快手、字节等互联网大厂加速开发AI工具,推动影视工业基建完善。专家认为AI不会完全取代人类创作,而是成为提升质量与效率的新工具,为行业带来新的解题思路。

  • 海信商用显示联合英特尔发布端侧会议领域垂域模型,以AI技术重构会议效率与安全边界

    4 月 16 日至 18 日, 2025 北京InfoComm展在国家会议中心拉开帷幕。海信商用显示携旗下全阵容产品亮相,展位号为EF1-01。现场,海信商用显示联合英特尔共同推出端侧会议领域垂域模型,基于Windows系统与离线端侧方案,支持会中稳定生成会议原文、纪要及问答记录,为政府、央国企等高保密场景提供合规、可靠的智能会议体验。现场,海信商用显示公司总经理罗勇,产品线运营�

  • 更新!电脑微信取消收红包功能

    微信官方于近日推出PC端4.0.3版本更新,首次实现Windows与macOS多桌面端功能统一,并引入包括朋友圈发布、深色模式切换、朋友圈内容置顶等多项核心功能升级。但同步移除了此前测试版中备受关注的“收红包”功能。你更新新版本了吗?感觉实用吗?欢迎评论区说说你的使用感受。

  • 日销破千元!AI生成的3D梗图挂件,被我们卖爆了

    先说结论:我们花15天做的AI3D挂件,在线下卖爆了,单日营收破千元!故事的开始,是因为我们发现把AI3D打印手办做成一门小生意的可行性越来越高,这也激发了我们的“搞钱基因”。再加上前不久新榜在上海举办了「新榜内容节」,一拍即合,我们于是做了一批模型去大会现场摆摊试水!最后结果还不错,单日最高收入突破1000元,是我们“创业史”上的一个高光表现。欢迎大家

  • 简单AI:零门槛AI修图!3分钟免费生成专业级春日写真,摄影师要慌了!

    春天看什么展?看人类花枝招“展”!四月的阳光、樱花、露营趴......拍照三件套搞起来!本工具人亲测了一款零门槛、超简单、巨好用的 AI 神器——搜狐简单 AI,从拍照到文案一站式搞定,全程不用下载,微信搜搜就能用哦~一、智能修图:路人消失术/背景替换满心期待拍出绝美的“春日花海大片”,但碰上阴天让鲜花都看起来灰突突的!还有乱入的路人甲乙丙丁和满地的�