首页 > 业界 > 关键词  > 通义科技最新资讯  > 正文

阿里通义听悟升级推出六大 AI 助手:多语言音视频问答和思维管理

2024-03-19 14:55 · 稿源:站长之家

站长之家(ChinaZ.com)3月19日 消息:今日,阿里巴巴集团旗下通义科技发布了产品“通义听悟”的最新升级版本,新增了6项重要功能。

其中最重要的更新是推出了音视频问答助手“小悟”,它可以进行单条音视频内的自由问答,也支持跨多个音视频记录进行问题回答。此外,通义听悟还上线了一键AI改写思维导图自动生成等新能力,以助力用户高效管理音视频内容和思维。

QQ截图20240319150103.jpg

小悟助手通过查询处理、长文本理解和多语言支持,实现对超长音视频的单记录和跨记录问答,支持内容提问时长和文件数量均突破业内上限。它不仅可以回答单个音视频中的问题,还可以查询用户整个账号下的多个音视频进行问答。更重要的是,小悟助手支持中文直接问英文视频,直接用中文给出答案,省去翻译步骤。

QQ截图20240319150117.jpg

同时,通义听悟也推出了一键AI改写和思维导图自动生成功能。一键AI改写可以将口语内容自动转化为书面语表达,思维导图生成可以自动提取音视频要点,生成最多五级的思维导图。此外,通义听悟还优化了笔记功能,支持一键插入时间戳和音视频截图。对高校用户,通义听悟也推出了公益计划,提供更多免费服务。

通义听悟是国内首个开放公测的大模型产品。今日的升级再次提升了其在音视频内容管理和多语言问答助手等方面的能力,为用户提供更智能化的服务。

举报

  • 相关推荐
  • 阿里通义成了AI的“黄埔军校”?

    从去年开始,各大科技巨头就纷纷调整战略,加大了人才招揽的力度:腾讯的“青云计划”以“业界Top0级别薪资”和“不设职级上限”吸引顶尖人才,并计划新增2.8万实习岗位以充实后备力量;字节跳动则启动“Top Seed计划”,专门为大模型、多模态等前沿领域的顶尖博士

  • 豆包上线视频通话功能:支持实时视频问答

    豆包官方微信公众号今日发文,宣布豆包App上线实时视频通话功能,用户在电话界面开启视频画面后,豆包能基于真实场景与用户进行实时问答互动,模型能够融合视觉与语言输入,进行综合的深度思考和创作。 据介绍,豆包本次升级基于视觉推理模型,支持联网搜索工作、生活和学习遇到的问题,随时可以和豆包视频对话。 官方表示,用户将豆包App更新到最新版后,打开�

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 马斯克推出全新XChat:具备加密、音视频通话、消息自毁功能

    近年来,X一直在努力增加更多隐私保护和加密功能。 有报道曾称,马斯克计划将X这个平台变成一个万能应用”,提供包括收发消息、社交、点对点支付等一系列服务。 报道还称,这一愿景让人想起腾讯的微信,它是中国居民日常生活中无处不在的一部分。” 据悉,马斯克曾对微信等中国手机应用程序大加赞赏,还希望X成为一个功能完备”的约会网站和数字银行。

  • 破解六大难题 智慧记升级五金行业数字化方案

    五金建材行业小微企业面临库存管理低效、开单差错频发、成本核算不清等六大经营痛点。金蝶智慧记推出数字化解决方案,通过AI技术实现:1)扫码秒查库存;2)自动开单打印;3)智能配件组合;4)精准报价系统;5)微信自动对账;6)24小时小程序商城。该方案已服务超300万商户,助力企业从"粗放管理"向"数智经营"转型,推动产业链现代化升级。

  • 自主操作系统技术演进:银河麒麟KYSDK六大核心能力升级观察

    银河麒麟桌面操作系统V10+SP12503发布,配套KylinSDK开发者套件迎来重大升级。新版SDK从系统能力、基础开发、应用支撑、系统安全、AI能力和开发工具等6大模块进行全面优化,显著提升开发效率。新增开明格式支持、多屏幕适配方案、Windows风格接口等功能,并强化了配置管理、安全审计等企业级特性。AI模块支持文本生成、图像处理、语音识别等智能功能,开发工具新增网页应用打包等便捷功能。此次升级降低了国产操作系统应用开发门槛,特别满足金融、政务等行业对系统可控性的严苛要求,为国产操作系统商业化开辟更广阔路径。

  • C++创始人:需要改变的不是语言,而是开发者的思维方式!

    “即使利用AI编写代码,但解决问题仍然是人类的工作”, C++创始人强调了开发者在AI时代的存在意义……

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 飞猪AI“问一问”更新:升级机酒查询、手绘地图等功能 新增会员助手

    飞猪AI助手"问一问"5月26日更新多项功能:1)提升智慧交通、酒店顾问等场景的查询精准度,新增C919国产飞机票务推荐;2)推出AI角色会员助手,可查询会员权益并推荐高性价比方案;3)优化基础功能,包括搜索提示、一键生成旅行长图等;4)手绘行程地图接入真实数据,可生成带距离标注的个性化路线图。目前途牛等平台也相继布局AI旅游助手,飞猪产品负责人表示将持续迭代升级,探索AI在旅游领域的无限可能。

  • 职场人的终极外挂!麒麟AI助手:您的工作搭子已上线

    银河麒麟桌面操作系统V10+SP12503内置AI助手系统,提供云/本地/自选三种AI模型配置方案,满足不同办公场景需求。系统内置Qwen 3B本地大模型,支持离线处理敏感数据;云端可自由配置语言、视觉等专业模型。特色功能包括:1)会议助手实时语音转文字并智能总结;2)悬浮工具条快捷实现文本润色、扩写、翻译;3)Super+Alt+C快捷键快速调用AI功能。该系统通过智能切换云/本地模型,确保断网时工作连续性,特别适合金融等涉密场景,实现安全与效率双提升。