首页 > 业界 > 关键词  > 通义听悟最新资讯  > 正文

阿里AI新品“通义听悟”正式上线 智能总结、实时语音转文字等

2023-06-01 15:17 · 稿源:站长之家

站长之家(ChinaZ.com)6月1日 消息:在阿里云峰会·粤港澳大湾区分会场,阿里云公布了通义大模型的进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。

image.png

据了解,通义听悟是一款工作学习AI助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。

通义听悟接入了通义千问大模型的理解与摘要能力,可高效完成对音视频内容的转写、检索、摘要和整理,比如,用大模型自动做笔记、整理访谈、提取PPT等。

根据官方介绍,通义听悟支持实时语音转文字,多语言同步翻译 ,1小时音视频5分钟转写,智能区分发言人。另外,智能总结方面,关键信息一清二楚,章节脉络一目了然问答观点一览无余,待办事项了如指掌。

image.png

公测期间,阿里云官方微博、微信及各大平台社区还会发放大量20小时转写口令码,用户获得的福利权益可累加,一年内有效,免费时长达100小时以上。

通义听悟网址:tingwu.aliyun.com

举报

  • 相关推荐
  • 鸿蒙版QQ迎重大更新:语音转文字等十大功能上线

    华为终端云宣布鸿蒙版QQ迎来重大更新,新增语音转文字、消息合并转发等10项实用功能。鸿蒙生态近期取得突破性进展:原生应用超2万个,开发者超720万,生态设备超10亿台。余承东表示2025年将实现10万应用目标,标志着生态成熟。此次QQ9.1.50版本更新包含空间相册一键浏览、群作业公告查看、表情收藏发送等优化,持续完善社交体验。目前鸿蒙版QQ已支持单聊、群聊、视频通话等基础功能,其他功能正在迭代中。

  • 阿里通义成了AI的“黄埔军校”?

    从去年开始,各大科技巨头就纷纷调整战略,加大了人才招揽的力度:腾讯的“青云计划”以“业界Top0级别薪资”和“不设职级上限”吸引顶尖人才,并计划新增2.8万实习岗位以充实后备力量;字节跳动则启动“Top Seed计划”,专门为大模型、多模态等前沿领域的顶尖博士

  • AI:重新定义语音处理效率的全能助手

    听脑AI是一款专注于语音/视频转文本的智能助手,具备三大核心功能:1)实时语音转写,支持会议、课堂等多场景录音转文字,自动区分发言人;2)音视频解析,可提取本地文件或平台链接内容生成可编辑文档;3)AI问答辅助,能基于语音内容生成摘要、PPT大纲等二次创作。其优势在于毫秒级响应、125种语言互译、智能降噪,适用于商务会议、教育学习、内容创作等场景,显著提升工作效率。支持多端同步与加密存储,提供20分钟免费试用体验。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 暗区突围端游今日正式上线 | 与世界冠军一起刺激枪战!

    《暗区突围:无限》正式上线!这款FPS射击大作由魔方工作室打造,提供5张特色地图、5种游戏模式和1000+枪械配件自由搭配。

  • 阿里千问3登顶全球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。

  • AI日报:苹果AI国行版或随iOS 18.6月底上线;Suno v4.5正式上线;Runway发布图像一致性参考功能

    本文汇总了AI领域最新动态:1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2,提升转写效率;2)Suno音乐平台v4.5版本支持8分钟歌曲生成;3)Runway推出图像一致性参考功能Gen-4 References;4)Midjourney V7新增"Omni-Reference"图像控制功能;5)Claude将引入MCP协议提升集成能力;6)iOS18.6或为中国用户启用AI功能;7)OpenAI宣布回归非营利模式;8)Freepik发布版权安全的F-Lite图像模型;9)OpenAI以30亿美

  • AIbase全球MCP服务器集合平台正式上线:开启 AI 应用的“超级接口”时代

    2024年AI技术全面爆发,AIBase平台推出全球首个MCP(模型上下文协议)服务,致力于连接AI智能体与现实世界。MCP协议如同AI世界的USB-C接口,让模型能够直接操作Excel、数据库、API等工具,实现从"生成建议"到"完成任务"的跨越。该平台汇聚12万+MCP服务接口,支持主流AI框架,大幅降低开发门槛,使企业能快速构建具备实际执行能力的智能应用。AIBase还提供实验场和开发者社区,推动AI从理论走向产业落地,成为智能时代的关键基础设施。

  • AI日报:Vidu Q1正式上线;MCP SDK 正式支持流式 HTTP;抖音一季度封禁AI黑产账号260万个

    本文介绍了AI领域多项重要进展:1)MCP SDK支持流式HTTP协议,提升开发效率;2)Vidu Q1视频生成模型上线,提供专业级视觉体验;3)马斯克计划筹资250亿美元开发Colossus 2超级计算机;4)Sand AI开源MAGI-1视频生成模型;5)电商AI助手Add To Cart AI优化购物体验;6)Anthropic发布Claude Code编程指南;7)真我推出支持32种语言的AI翻译耳机;8)2025年AI视频企业TOP20榜单发布;9)清华GLM大模型免费开放;10)AI面试作弊工具引争议;11)抖音AI治理封禁260万违规账号;12)全球首款具备嗅觉的机器人问世。这些创新展示了AI技术在视频生成、编程辅助、电商、翻译等领域的快速发展与应用潜力。

  • 上线仅7天!阿里通义千问3强势登顶全球开源模型宝座

    据了解,千问3是国内首个混合推理模型”,快思考”与慢思考”集成进同一个模型,对简单需求可低算力秒回”答案,对复杂问题可多步骤深度思考”,大大节省算力消耗。