首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

2025-07-31 15:58 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、阿里开源WebAgent项目WebShaper,GAIA评测超过Claude4-Sonnet

阿里云通义实验室开源了其自主搜索AI智能体项目WebAgent,其中WebSailor和WebShaper在多个评测中表现优异,展示了其在复杂任务中的强大能力。该项目不仅降低了使用门槛,还为全球AI社区提供了工业级训练框架和评估标准。

image.png

【AiBase提要:】

🌐 WebAgent通过模拟人类搜索行为,实现高效处理复杂网络任务。

🔍 WebSailor-72B模型在权威评测中超越多数闭源模型,展现卓越性能。

📊 WebShaper采用形式化驱动的数据合成方法,提升多步推理准确性。

详情链接:https://github.com/Alibaba-NLP/WebAgent

2、Moonvalley发布Sketch-to-Video功能:手绘草图秒变电影级视频

Moonvalley推出的Sketch-to-Video功能通过手绘草图和文本描述生成高质量视频,为影视制作、广告创意及个人创作提供了便捷的工具。该功能依托Marey模型,具备精准控制和伦理保障,显著降低了视频制作成本与门槛。

【AiBase提要:】

✨ Sketch-to-Video允许用户通过手绘草图和文本生成电影级视频片段。

🎥 Marey模型使用授权素材训练,确保版权安全并提升视频质量。

💡 该功能大幅降低视频制作成本,赋能全球创作者并推动AI与影视行业的深度融合。

3、腾讯AI新突破:X-Omni模型让智能生成告别写字困难症,图文理解生成一步到位

腾讯研究团队推出的X-Omni多模态AI模型在图像生成和理解领域实现了重大突破,特别是在长文本渲染方面表现出色,解决了传统AI模型在文字生成中的准确性问题。该模型通过强化学习框架和统一建模技术,显著提升了输出质量的稳定性和准确性。

image.png

【AiBase提要:】

✨ X-Omni采用强化学习框架优化模型性能,引入多维度奖励机制提升文字渲染准确率。

🧠 实现图像生成与理解功能的统一建模,无需不同模型架构和训练策略。

🚀 在多个基准测试中表现优异,尤其在长文本渲染和图像理解任务中超越主流模型。

详情链接:https://arxiv.org/pdf/2507.22058

4、百度搜索首页将变身AI应用中心?智能体入口灰度测试中

百度搜索正在测试在电脑端首页开放智能体应用入口,用户未来可能直接在搜索框下方访问各类AI应用。该功能目前处于灰度测试阶段,预计不久将全面开放。

image.png

【AiBase提要:】

📌 百度搜索计划在首页开放智能体应用入口,提升用户搜索体验。

💡 智能体主要来源于文心智能体平台、外部优质AI应用及百度自研应用。

🌐 目前该功能处于灰度测试阶段,尚未得到百度官方正式回应。

5、Midjourney 推出“为您推荐”功能:一键解锁个性化图片与视频体验

Midjourney 在探索页面新增了‘为您推荐’按钮,基于用户历史交互数据和偏好学习算法,提供个性化AI生成的图片和视频推荐。这一功能极大提升了用户的创作效率和个性化体验。

image.png

【AiBase提要:】

✨ 用户点击‘为您推荐’按钮即可获取符合自身风格的创意内容。

🔍 系统通过分析用户的历史操作(如点赞、moodboard上传)捕捉风格偏好。

🎨 推荐结果支持参数调整,优化输出效果。

6、GPT-5发布越来越近!GPT-5-Auto 与 GPT-5-Reasoning 现身 Mac 客户端

文章揭示了OpenAI可能正在测试GPT-5的两个新模型,GPT-5-Auto和GPT-5-Reasoning,这些发现暗示其下一代AI模型已进入内部测试阶段,预计2025年夏季正式发布。

image.png

【AiBase提要:】

🤖 GPT-5-Reasoning专注于复杂任务的逻辑拆解与多步推理,表现出色。

🔄 GPT-5-Auto具备高度自动化能力,可执行多步骤任务,减少用户干预。

📅 OpenAI计划在2025年夏季正式发布GPT-5,加速开发进程。

7、Ollama发布桌面客户端!拖拽文档、多模态识别,本地AI从此告别命令行

Ollama推出了桌面客户端,为用户提供了更直观的交互体验。该客户端支持多模态识别和文档拖拽功能,同时保持了本地运行的优势,提升了隐私保护和效率。

image.png

【AiBase提要:】

📱 图形化界面简化操作,降低使用门槛。

🖼️ 多模态识别支持图像与文本交互,提升应用多样性。

🔒 本地运行保障数据隐私,满足合规要求。

详情链接:https://ollama.com/download

8、OWL团队开源全新多智能体工具Eigent:革新复杂任务处理效率

OWL团队推出了全新的多智能体协作工具Eigent,旨在通过多智能体协作提升复杂任务的处理效率。该工具继承了CAMEL和OWL的成功经验,并引入了高效的并行处理机制、灵活的定制能力以及Human-in-the-Loop机制,为AI开源生态带来了重大突破。

image.png

【AiBase提要:】

🧠 **高效任务拆解与并行处理**:Eigent通过多层次并行机制显著提升任务处理效率。

🛠️ **灵活定制与工具整合**:支持动态创建Workforce,整合多种数据源和工具,提高适用性。

🤝 **Human-in-the-Loop机制**:允许用户在关键节点进行人工干预,确保任务精度和主观判断。

详情链接:https://github.com/eigent-ai/eigent

9、OpenAI 今年收入激增至 120 亿美元 周活跃用户破 7 亿大关

OpenAI 在2023年取得了显著的商业成就,前七个月收入达到120亿美元,预计月收入将达到10亿美元。周活跃用户数突破7亿,显示出其产品的广泛市场认可。公司目标到2029年实现年收入1250亿美元。

【AiBase提要:】

🌟 OpenAI 今年前七个月收入达120亿美元,月收入预计10亿美元。

📈 周活跃用户突破7亿,ChatGPT 受到全球用户欢迎。

🚀 OpenAI 目标到2029年年收入增至1250亿美元,展现雄心壮志。

10、英伟达H20算力芯片被约谈:国信办要求说明“追踪定位”及“远程关闭”风险

国家互联网信息办公室就英伟达H20算力芯片的安全风险,特别是‘追踪定位’和‘远程关闭’技术,对英伟达公司进行了约谈。网信办要求英伟达详细说明其对华销售的H20芯片的漏洞后门安全风险问题,并提交相关证明材料。

【AiBase提要:】

📌 国家互联网信息办公室约谈英伟达,关注其H20芯片的‘追踪定位’和‘远程关闭’技术风险。

💡 英伟达的算力芯片存在严重安全漏洞,且相关技术已成熟。

🔍 网信办依据《网络安全法》等法规,要求英伟达提供详细说明和证明材料。

11、万兴科技惊艳登榜!天幕2.0模型成国内第四,携手华为云共建AI视频实验室

万兴科技凭借天幕2.0模型的出色表现,在AI视频生成领域取得显著进展,并与华为云展开深度合作,共同探索AI技术的应用潜力。

image.png

【AiBase提要:】

🎥 万兴天幕2.0模型在SuperCLUE榜单中位列国内第四,展现了其强大的技术实力。

🤝 与华为云共建AI视频大模型实验室,推动行业技术革新。

🚀 未来合作有望拓展至更多领域,提升用户数字创意体验。

举报

  • 相关推荐
  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • Checkout.com项尧受邀参与 WAIC2025 共话人工智能时代跨境支付新机遇

    2025世界人工智能大会(WAIC)于7月26-28日在上海举办,全球领先支付解决方案提供商Checkout.com受邀参与"无界人工智能:深化中英合作"主题论坛。其大中华区总经理项尧与行业专家探讨AI赋能跨境商业生态的创新实践,重点分享公司在代理电商平台(Agentic Commerce)领域的支付技术创新,包括与Mastercard、Visa合作构建支持AI代理交易的技术框架。作为支付行业领军者,Checkout.com通过智能支付网络帮助电商平台优化交易管理,支持多币种支付,每年为客户解锁数亿美元收入潜力。本届WAIC展览面积首次突破7万平方米,吸引800余家企业参展,涵盖40余款大模型及60余款智能机器人。

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • 如何精准锁定高性价比的AI大模型?AIbase AI模型费用计算器助力开发者省心省钱选模型

    文章探讨了在预算有限的情况下如何选择合适的大模型API。面对GPT-4、Claude2、Llama2等数十种模型,开发者常陷入选择困境:既要考虑性能,又要兼顾成本。不同厂商的计费机制复杂多样(按Token、请求次数或时间),手动计算耗时且容易出错。文章推荐使用AIbase的AI模型费用计算器,该工具聚合主流模型定价数据,支持可视化交互计算,能快速比较不同场景下的使用成本,帮助�

  • 世界人工智能大会SAIL奖TOP30出炉!天鹜科技荣登榜单!

    世界人工智能大会SAIL奖TOP30榜单发布,天鹄科技凭借蛋白质大模型项目入选。该项目通过90亿条极端环境蛋白质序列数据和5亿条酶功能数据,训练出能跨越结构直接预测功能的AI模型AIACCLBIO™。该模型已服务30余家生物医药企业,成功优化30余款蛋白质,其中8款实现产业化应用。典型案例包括:将抗体稳定性提升4倍,每年为企业节省上千万元成本;优化后的急性胰腺炎检测酶成本仅为国际同类产品的10%,并实现千公斤级量产。SAIL奖是世界人工智能大会最高奖项,旨在激励技术创新和产业融合。

  • 金融壹账通智能客服赋能普惠金融,人工智能+助力新质生产力

    金融壹账通"小壹智能客服机器人"在第七届数字普惠金融大会上入选创新成果。该系统采用"大模型+小模型"组合策略,实现60%以上人工替代率,月均处理客户咨询数千万次。其创新点在于:1)通过自动问答与坐席辅助双模块设计,解决传统金融服务效率瓶颈;2)具备智能化运营能力,可自动生成优化方案、构建训练数据;3)已覆盖银行、保险等20余家金融机构,显著降低运营成本。该成果为中小金融机构提供了可复制的数字化解决方案。