首页 > 热点 > 关键词  > 正文

阿里云通义听悟上线三大新功能:包括视频自动提取PPT等

2023-08-02 15:10 · 稿源:站长之家

站长之家(ChinaZ.com)8月2日 消息:阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。

其中,视频自动提取PPT的功能通过引入视觉AI算法,将PPT讲解视频自动分割为演示文稿,并总结每页PPT的重点内容,形成一份图文并茂的大纲,从而解决了培训、网课学习等场景中难以获取PPT的问题。

阿里云通义听悟大升级 三大实用功能上线:视频能自动提取PPT了

此外,通义听悟还增加了浏览器插件和移动端的支持。用户在开会、上网课、看直播、看视频时,可以使用Chrome和Edge浏览器插件全程录制,并实时生成双语字幕,帮助用户更轻松地浏览视频内容。在移动端,通义听悟的钉钉和微信小程序支持PC端的基础功能,还可以一键转写手机和聊天记录的音视频文件,只需一部手机即可记录、回顾和整理音视频内容。

阿里云通义听悟的这些新功能上线期间,阿里云联合各大平台和社区推出定制口令码,用户可以根据口令码抽取免费转写时长,从而让更多用户体验到这些功能。通义听悟集成了阿里云先进的语音、语言和视觉AI技术,未来还将上线适用于更多场景的新功能。

举报

  • 相关推荐
  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 阿里通义App重大品牌升级!正式更名为“千问”

    11月14日,阿里巴巴旗下“通义”App正式更名为“千问”,版本号从3.60.0跃升至5.0.0,已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造,具备对话问答、智能写作、多模态相机等核心功能,被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”,已抽调上百名工程师加速推进,并同步研发国际版,计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

  • 小米17 Pro系列妙享背屏新功能上线:包括对话翻译、新游戏等

    小米17系列妙享背屏功能将于10月29日正式上线,包含四大亮点:动态大头贴支持拍摄生动瞬间并新增明亮风格模板;对话翻译实现正屏输入、背屏即时显示译文;新增动态壁纸提升界面趣味性;配合游戏手机壳可畅玩《愤怒的小鸟》等经典游戏。该背屏还支持倒计时、音乐控制等实用功能,尺寸设计合理,投入超10亿元研发,体现小米对用户体验的重视。

  • 千问APP悄悄上线,阿里的AI超级入口也终于来了。

    阿里“千问”APP昨日在应用商店悄然上线,界面从通义APP的双色渐变变为简洁单色设计,功能大幅增强,支持Qwen全系列最新模型。此次品牌整合将阿里分散的AI触点统一为“千问”品牌,实现模型与产品名称对齐,让普通用户首次能在官方APP使用最强Qwen3-Max模型。APP默认开启联网搜索,集成图像编辑、视频通话等场景功能,通过智能意图识别实现一站式服务。这标志着阿里开始认真打技术+品牌两张牌,推动AI技术以更清晰方式触达用户。

  • 微信支付推出三大AI功能:涵盖自动收款、宣传润色、开发指导

    微信支付11月4日推出三项AI新能力:自动收款功能通过元宝AI智能识别菜单照片并自动生成收款项,提升效率与准确性;宣传文案润色功能可根据商户需求自动优化文案风格,支持学生、上班族等不同群体的个性化选择;AI开发助手能解答技术难题、提供示例代码,帮助商户顺畅接入支付接口。这些功能旨在为商户和用户提供更智能便捷的支付体验。

  • 无万卡,不VLA:元戎启行与阿里云的“想法”和“解法”

    1980年代汉斯·莫拉维克提出人工智能悖论:计算机在逻辑推理等高级智能活动中易超越人类,但实现儿童般的感知与常识认知却极困难。智能驾驶的核心挑战在于让AI理解物理世界并进行因果推理。视觉-语言-行动模型通过融合多模态数据,使系统具备推理驾驶能力,推动行业迈向L5完全自动驾驶。面对VLA模型的数据处理、训练效率和成本挑战,阿里云等超级AI云提供全栈解决方案,从算力基础设施到开源生态,加速技术迭代与商业化落地。

  • 工程师变身AI“指挥者”,吉利与阿里云的软件开发变革实验

    1975年,IBM工程师Fred Brooks在《人月神话》中指出软件工程的核心难题:系统与团队规模增长会导致复杂度指数级上升,且“没有银弹”能单一提升生产力。如今汽车行业正经历软件史上最大挑战,吉利汽车软件人员占比从不足10%跃升至40%,智能汽车代码量超亿行。面对异构系统协同、安全标准严苛等难题,吉利与阿里云通义灵码深度合作,通过AI生成代码(占比超30%)、代码审查测试等,提升开发效率20%,并探索用AI破解遗留系统维护、知识传递等痛点。工程师角色正从“执行者”转向“AI指挥官”,未来或实现从需求到交付的全流程自动化协同。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 小红书内测笔记“发文件”新功能 100MB内文档一键预览下载

    小红书平台近期正于内部测试一项新功能,允许用户在笔记中直接附加文档文件,并支持一键预览与下载。目前该功能处于限量内测阶段,仅对部分中国大陆用户开放。 根据测试用户反馈,每篇笔记仅支持上传一个文档,文件大小上限为100MB。平台目前兼容常见的办公文档格式,包括 doc、docx、pdf、ppt 及 pptx,便于用户快速分享各类资料。 小红书官方客服已确认该功能上线,

  • 50人团队、1亿美元ARR,AI PPT还在续写“神话”?

    AI 生成 PPT 可以说是去年的热门赛道,尤记得关于这类产品是否具有真正竞争力的热烈讨论,而2025年9月份的数据显示,赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且,今天官宣了由 a16z 领投的6800万美元 B 轮融资,融资后估值达到21亿美元。 而不仅 Gamma,根据 AI 产品榜数据,9月份,AIPPT 赛道的 Top3产品流量平均涨幅30%+,更有一款

今日大家都在搜的词: