首页 > 热点 > 关键词  > 正文

阿里云通义听悟上线三大新功能:包括视频自动提取PPT等

2023-08-02 15:10 · 稿源:站长之家

站长之家(ChinaZ.com)8月2日 消息:阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。

其中,视频自动提取PPT的功能通过引入视觉AI算法,将PPT讲解视频自动分割为演示文稿,并总结每页PPT的重点内容,形成一份图文并茂的大纲,从而解决了培训、网课学习等场景中难以获取PPT的问题。

阿里云通义听悟大升级 三大实用功能上线:视频能自动提取PPT了

此外,通义听悟还增加了浏览器插件和移动端的支持。用户在开会、上网课、看直播、看视频时,可以使用Chrome和Edge浏览器插件全程录制,并实时生成双语字幕,帮助用户更轻松地浏览视频内容。在移动端,通义听悟的钉钉和微信小程序支持PC端的基础功能,还可以一键转写手机和聊天记录的音视频文件,只需一部手机即可记录、回顾和整理音视频内容。

阿里云通义听悟的这些新功能上线期间,阿里云联合各大平台和社区推出定制口令码,用户可以根据口令码抽取免费转写时长,从而让更多用户体验到这些功能。通义听悟集成了阿里云先进的语音、语言和视觉AI技术,未来还将上线适用于更多场景的新功能。

举报

  • 相关推荐
  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 微信推出“后悔药”:新功能上线“删除聊天可撤销”

    近日,微信团队针对安卓用户推出了8.0.63内测版本,其中一项新增功能——“删除联系人同时清除聊天记录”的选项备受关注,不过更引人注目的是其带来的“删除聊天可撤销”的便利,这一改动被网友们誉为“救了手滑党的命”。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 飞猪AI“问一问”新功能:拍文物即可听讲解

    飞猪AI“问一问”推出拍照讲解功能,用户拍摄博物馆展品或建筑即可获得专业语音讲解。该功能依托文博旅游领域垂类数据,能精准识别文物细节并提供深入讲解,模拟专业导游风格。目前已向部分用户开放,预计近期全面上线,国庆中秋假期将为游客提供免费智能导览体验。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 六项第一!百度文库再获国家工信安全中心认证,持续领跑智能PPT行业

    国家工信安全中心发布《大模型赋能智慧办公评测报告》,对8款主流AI生成PPT产品进行综合评估。百度文库在生成质量、排版美化等六项指标中全部位列第一,持续领跑智能PPT行业。报告显示当前产品已基本满足日常需求,但专业度和时效性仍有提升空间。百度文库依托海量专业文档资源,在产业研究、教育培训等场景表现突出,月活用户超9700万,智能PPT功能月访问量全球第一。

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • 腾讯云智算三大核心升级 推动AI Infra从“支撑”向“引擎”跨越

    腾讯云在9月17日全球数字生态大会上宣布AI基础设施升级,聚焦智能体驱动云基础设施演进。发布多项成果,包括Agent+Infra解决方案、Cloud Mate云专家服务智能体,提升推理效率、安全性和自动化能力。预计未来两年企业部署智能体将翻倍,GenAI相关IaaS支出增速达192%。腾讯云通过“同源同构”技术优势,支持多环境部署,为交通、制造等行业提供全链路AI支撑,加速产业智能化转型。

今日大家都在搜的词: