首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

音视频会议神器!阿里云通义听悟正式发布:轻松记录总结、实时翻译

2023-06-01 11:00 · 稿源: 快科技

快科技6月1日消息,今天上午阿里云正式发布了新品通义听悟

这是一款基于通义千问语言模型、音视频AI模型能力,能为用户带来音频、视频内容记录和阅读全新体验的AI助手,在工作和学习中提供更高的效率和帮助。

目前通义听悟已经在官网正式上线,用户使用阿里云账号登录,公测期可体验所有AI功能,含全文概要、章节速览、发言总结等高阶AI功能,并获赠使用权益。

据介绍,通义听悟可以进行实时的语音转文字、多语言同步翻译,1小时的音视频仅用5分钟就能转写完成,还能精准区分发言人。

同时还能进行智能总结,会议中的关键内容清晰罗列,总结核心内容,比如关键性的问答内容,轻松存档会议内容。

并且还能高效有序的整理笔记,支持下载原文、笔记、音视频和译文,一键导出所需内容,同时也支持word、pdf和srt字幕文件等多种格式一键导出,本地、云盘均可进行存储。

从目前已上线的功能来看,通义听悟特别适合职场开会、上课复习、媒体采访、分析师访谈、新媒体工作者整理视频、外语交流等诸多知识类场景。

举报

  • 相关推荐
  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • 阿里云助力集思科技升级电商直播数字人——拓展AI直播市场边界,剑指万亿销售市场 | 看见新力量NO.144

    AI技术正加速渗透电商直播领域,奢侈品牌Burberry通过数字人主播实现618期间成交额同比增长超500%。集思科技推出的"实时替身"金牌主播2.0产品,突破非标品直播边界,实现视觉自然化+沟通智能化+内容协同化。阿里云通义千问3大模型为数字人提供精准语料支持,无影云电脑保障24小时稳定直播。未来AI销售将向"人货场"重构方向发展,数字人不仅能实现7×24小时直播,更将向一对一精准销售升级,打造万亿级市场新机遇。

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • 微信聊天可以引用部分文字了!还可用表情包回复

    今日,微信派正式对外宣布,微信聊天新增引用部分文字功能,为用户交流带来全新便捷体验。 在过去,微信用户进行引用回复时,存在明显局限,只能将整条文字消息完整引用。当好友发来大段文字,而自己仅想引用其中某段精华内容时,就显得十分不便。 如今,这一状况得到极大改善。用户收到好友发来的大段文字消息后,若只想引用其中特定部分,可手动进行选择,�

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

今日大家都在搜的词: