AI日报：GPT-5-Auto现身Mac客户端；阿里开源WebAgent项目WebShaper；腾讯推X-Omni多模态模型

2025-07-31 15:58 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、阿里开源WebAgent项目WebShaper，GAIA评测超过Claude4-Sonnet

阿里云通义实验室开源了其自主搜索AI智能体项目WebAgent，其中WebSailor和WebShaper在多个评测中表现优异，展示了其在复杂任务中的强大能力。该项目不仅降低了使用门槛，还为全球AI社区提供了工业级训练框架和评估标准。

【AiBase提要:】
🌐 WebAgent通过模拟人类搜索行为，实现高效处理复杂网络任务。
🔍 WebSailor-72B模型在权威评测中超越多数闭源模型，展现卓越性能。
📊 WebShaper采用形式化驱动的数据合成方法，提升多步推理准确性。
详情链接:https://github.com/Alibaba-NLP/WebAgent

2、Moonvalley发布Sketch-to-Video功能：手绘草图秒变电影级视频

Moonvalley推出的Sketch-to-Video功能通过手绘草图和文本描述生成高质量视频，为影视制作、广告创意及个人创作提供了便捷的工具。该功能依托Marey模型，具备精准控制和伦理保障，显著降低了视频制作成本与门槛。

【AiBase提要:】
✨ Sketch-to-Video允许用户通过手绘草图和文本生成电影级视频片段。
🎥 Marey模型使用授权素材训练，确保版权安全并提升视频质量。
💡 该功能大幅降低视频制作成本，赋能全球创作者并推动AI与影视行业的深度融合。

3、腾讯AI新突破：X-Omni模型让智能生成告别写字困难症，图文理解生成一步到位

腾讯研究团队推出的X-Omni多模态AI模型在图像生成和理解领域实现了重大突破，特别是在长文本渲染方面表现出色，解决了传统AI模型在文字生成中的准确性问题。该模型通过强化学习框架和统一建模技术，显著提升了输出质量的稳定性和准确性。

【AiBase提要:】
✨ X-Omni采用强化学习框架优化模型性能，引入多维度奖励机制提升文字渲染准确率。
🧠 实现图像生成与理解功能的统一建模，无需不同模型架构和训练策略。
🚀 在多个基准测试中表现优异，尤其在长文本渲染和图像理解任务中超越主流模型。
详情链接:https://arxiv.org/pdf/2507.22058

4、百度搜索首页将变身AI应用中心?智能体入口灰度测试中

百度搜索正在测试在电脑端首页开放智能体应用入口，用户未来可能直接在搜索框下方访问各类AI应用。该功能目前处于灰度测试阶段，预计不久将全面开放。

【AiBase提要:】
📌 百度搜索计划在首页开放智能体应用入口，提升用户搜索体验。
💡 智能体主要来源于文心智能体平台、外部优质AI应用及百度自研应用。
🌐 目前该功能处于灰度测试阶段，尚未得到百度官方正式回应。

5、Midjourney 推出“为您推荐”功能:一键解锁个性化图片与视频体验

Midjourney 在探索页面新增了‘为您推荐’按钮，基于用户历史交互数据和偏好学习算法，提供个性化AI生成的图片和视频推荐。这一功能极大提升了用户的创作效率和个性化体验。

【AiBase提要:】
✨ 用户点击‘为您推荐’按钮即可获取符合自身风格的创意内容。
🔍 系统通过分析用户的历史操作（如点赞、moodboard上传）捕捉风格偏好。
🎨 推荐结果支持参数调整，优化输出效果。

6、GPT-5发布越来越近！GPT-5-Auto 与 GPT-5-Reasoning 现身 Mac 客户端

文章揭示了OpenAI可能正在测试GPT-5的两个新模型，GPT-5-Auto和GPT-5-Reasoning，这些发现暗示其下一代AI模型已进入内部测试阶段，预计2025年夏季正式发布。

【AiBase提要:】
🤖 GPT-5-Reasoning专注于复杂任务的逻辑拆解与多步推理，表现出色。
🔄 GPT-5-Auto具备高度自动化能力，可执行多步骤任务，减少用户干预。
📅 OpenAI计划在2025年夏季正式发布GPT-5，加速开发进程。

7、Ollama发布桌面客户端！拖拽文档、多模态识别，本地AI从此告别命令行

Ollama推出了桌面客户端，为用户提供了更直观的交互体验。该客户端支持多模态识别和文档拖拽功能，同时保持了本地运行的优势，提升了隐私保护和效率。

【AiBase提要:】
📱 图形化界面简化操作，降低使用门槛。
🖼️ 多模态识别支持图像与文本交互，提升应用多样性。
🔒 本地运行保障数据隐私，满足合规要求。
详情链接:https://ollama.com/download

8、OWL团队开源全新多智能体工具Eigent:革新复杂任务处理效率

OWL团队推出了全新的多智能体协作工具Eigent，旨在通过多智能体协作提升复杂任务的处理效率。该工具继承了CAMEL和OWL的成功经验，并引入了高效的并行处理机制、灵活的定制能力以及Human-in-the-Loop机制，为AI开源生态带来了重大突破。

【AiBase提要:】
🧠 **高效任务拆解与并行处理**：Eigent通过多层次并行机制显著提升任务处理效率。
🛠️ **灵活定制与工具整合**：支持动态创建Workforce，整合多种数据源和工具，提高适用性。
🤝 **Human-in-the-Loop机制**：允许用户在关键节点进行人工干预，确保任务精度和主观判断。
详情链接:https://github.com/eigent-ai/eigent

9、OpenAI 今年收入激增至 120 亿美元周活跃用户破 7 亿大关

OpenAI 在2023年取得了显著的商业成就，前七个月收入达到120亿美元，预计月收入将达到10亿美元。周活跃用户数突破7亿，显示出其产品的广泛市场认可。公司目标到2029年实现年收入1250亿美元。

【AiBase提要:】
🌟 OpenAI 今年前七个月收入达120亿美元，月收入预计10亿美元。
📈 周活跃用户突破7亿，ChatGPT 受到全球用户欢迎。
🚀 OpenAI 目标到2029年年收入增至1250亿美元，展现雄心壮志。

10、英伟达H20算力芯片被约谈:国信办要求说明“追踪定位”及“远程关闭”风险

国家互联网信息办公室就英伟达H20算力芯片的安全风险，特别是‘追踪定位’和‘远程关闭’技术，对英伟达公司进行了约谈。网信办要求英伟达详细说明其对华销售的H20芯片的漏洞后门安全风险问题，并提交相关证明材料。

【AiBase提要:】
📌 国家互联网信息办公室约谈英伟达，关注其H20芯片的‘追踪定位’和‘远程关闭’技术风险。
💡 英伟达的算力芯片存在严重安全漏洞，且相关技术已成熟。
🔍 网信办依据《网络安全法》等法规，要求英伟达提供详细说明和证明材料。

11、万兴科技惊艳登榜！天幕2.0模型成国内第四，携手华为云共建AI视频实验室

万兴科技凭借天幕2.0模型的出色表现，在AI视频生成领域取得显著进展，并与华为云展开深度合作，共同探索AI技术的应用潜力。

【AiBase提要:】
🎥 万兴天幕2.0模型在SuperCLUE榜单中位列国内第四，展现了其强大的技术实力。
🤝 与华为云共建AI视频大模型实验室，推动行业技术革新。
🚀 未来合作有望拓展至更多领域，提升用户数字创意体验。

（举报）

相关推荐

关键词：

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
AI共智开源共享｜2025开放原子开发者大会开源鸿蒙技术分论坛即将启幕

2025开放原子开发者大会开源鸿蒙技术分论坛将于11月21日在北京举行，聚焦AI与操作系统融合创新。论坛将发布开源鸿蒙跨平台框架进展，展示端边云协同实践案例及年度商用成果，覆盖金融、工业、医疗等多元场景。目前社区已汇聚超9500名贡献者、70余家共建单位，迭代至6.0版本，推动智能终端生态发展。活动同步推出开发者激励计划，通过高校对话、人才授牌等机制构建&quo

开源鸿蒙 AI技术操作系统
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济

今日大家都在搜的词：

热文

3 天
7天

AI日报：GPT-5-Auto现身Mac客户端；阿里开源WebAgent项目WebShaper；腾讯推X-Omni多模态模型

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

跨境支付的未来：人工智能、嵌入式金融和即时结算

AI共智开源共享｜2025开放原子开发者大会开源鸿蒙技术分论坛即将启幕

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

小米超级小爱AI大模型推出随心修图功能

荣耀500系列官宣将于11月24日发布

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

站长商机