首页 > AI头条  > 正文

智谱GLM-PC开放体验 自主操作电脑的多模态Agent升级

2025-01-23 14:45 · 来源: AIbase基地

北京智谱华章科技有限公司近日宣布其旗下的智谱 GLM-PC 智能体已进行升级,并正式向公众开放体验。作为全球首个可以自主操作计算机的多模态智能体,GLM-PC 的技术基础是智谱的多模态大模型 CogAgent。用户只需简单的回车操作,即可体验这一革新性的电脑智能助手。

自2024年11月29日 GLM-PC v1.0发布以来,它就一直处于内测阶段。这一版本带来了 “深度思考” 模式,新增了逻辑推理和代码生成功能,同时也对 Windows 系统进行了支持。GLM-PC 的能力涵盖了代码生成、逻辑执行、图形用户界面(GUI)理解等多个方面,展现了其在智能化操作上的强大潜力。

image.png

在代码生成和逻辑执行方面,GLM-PC 具备综合分析目标与资源的能力,能够生成执行路线图,将大型任务分解为小型可管理的子任务,实现高效的任务规划。任务规划完成后,智能体可启动代码生成模块进行循环执行,确保任务的精准完成。同时,GLM-PC 还拥有长思考能力,能够实时调整和反思修正,并与用户互动,优化解决方案。

在图像和 GUI 认知方面,GLM-PC 能够准确识别和理解图形界面中的元素,如按钮和图标,并结合用户的历史操作信息提供智能推荐。其图像语义解析功能则可以深入分析复杂图像,提取关键信息,如趋势和指标。此外,GLM-PC 还可以融合图像与文字信息,为用户提供全面的感知结果,帮助用户制定精准的操作计划。

随着人工智能技术的不断发展,智谱 GLM-PC 的推出无疑为用户带来了更高效、智能的电脑使用体验,标志着人机交互的一个重要进步。

  • 相关推荐
  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”

    在GOT C 2025全球开源技术峰会上,零一万物CEO李开复博士发表演讲,强调开源模型是构建AI Agent的最佳选择。零一万物与开源中国联合发布一站式AI Agent开源开发平台OAK,支持对接多种开源大模型,旨在打破生态绑定限制,助力开发者实现“Agent开发自由”。该平台具备可视化编排、评估优化、数据管理等功能,未来将逐步推出四大核心模块,推动开放协作的AI Agent生态发展。

  • 数巅完成数亿元pre-A轮融资,领跑企业级AI Agent赛道

    北京数巅科技完成数亿元Pre-A轮融资,由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展,强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案,通过模块化架构整合海量行业知识与企业数据,精准识别用户需求,实现秒级响应与深度推理,满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地,查数准确率超99%,成为国内企业级智能体应用的重要里程碑。

  • 墨刀AI Agent:更懂产品经理的超级智能体上线

    2025年AI将进入"智能体时代",从被动工具升级为能理解意图、辅助决策的伙伴。墨刀AI+Agent专为产品经理打造,具备三层核心能力:懂逻辑(理解需求生成原型)、懂场景(熟悉全流程工作)、懂协作(跨角色沟通优化)。它能贯穿调研、原型、文档、评审等环节,解放重复劳动,让产品经理专注高价值决策,实现从效率提升到决策升级的人机协作新模式。

  • MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent

    最近一个月,基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作,大体还是走出了两条路。 一种是在诸多难点里选择一个死磕,成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象,但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进,在一个最全面的基础模型蓝图里不停交出一个个关键拼图。 已经有了全

  • 蝉妈妈AI新品震撼发布:电商营销Agent时代来临,6万+从业者共寻增长新引擎

    2025年电商竞争核心转向AI效率。蝉妈妈于10月23日发布电商专属AI工具,旨在解决传统运营痛点。该工具覆盖全链路场景:从行业分析、竞对数据到图文创作、视频脚本生成,帮助从业者实现策略制定到落地执行的一站式智能运营。发布会集结多位实战专家,分享全域增长、内容提效等可复用的方法论,吸引超6万观众。蝉妈妈凭借行业数据沉淀与AI技术结合,为电商从业者提供突破增长瓶颈的系统路径,推动行业迈向技术驱动的高效新纪元。

  • 荣耀年度旗舰上新,火山引擎助力“YOYO助理”多模态智慧再升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,支持图文、语音、视频输入及多样化内容输出,结合火山引擎的豆包大模型技术,提供联网问答、智能识图、创意修图、出行规划等场景服务,实现“有问必答、答则精准”的智慧体验,成为用户贴身的“万能管家”。

  • 绘王发布Kamvas Pro 24(Gen3)数位屏,色彩表现力大升级

    10月22日,绘王发布旗舰级数位屏新品Kamvas Pro 24(Gen3)。该产品配备23.8英寸4K屏幕,采用第三代防眩光玻璃,支持五种专业色彩模式,色准Delta E<1且提供出厂校色报告。标配双支压感笔,支持1.6万级压感与十点触控,兼容Windows/macOS系统,满足专业创作需求。

  • 享受专属赛道体验服务!雷军:小米Ultra Club对所有Ultra车主开放

    小米汽车今日宣布,小米Ultra Club面向所有Ultra车主开放入会。 车主入会后可享:赛道服务、赛道专场体验、官方专属活动及专属顾问1对1服务。目前赛道服务已覆盖12个城市,车主们可结合自身需求选择加入。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

今日大家都在搜的词: