AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

2025-05-27 15:56 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、中国信通院发布软件开发智能体标准

中国信通院联合多家企业发布开发智能体标准，标志着AI智能体商业化进入新阶段。AIAgent市场快速增长，企业积极布局，推动数字化转型。

【AiBase提要:】
🌟 中国信通院发布开发智能体标准，AI智能体商业化迈入新阶段。
🚀 全球AIAgent市场预计2024年达51亿美元，2030年增至471亿美元，年复合增长率44.8%。
💡 税友股份和赛意信息等企业积极布局AI智能体，提升服务能力，推动数字化转型。

2、阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型，性能媲美Claude-3.7

本文介绍了阿里巴巴发布的QwenLong-L1-32B，一款专为长上下文推理设计的大型语言模型，其性能表现超越多个竞争对手，并通过强化学习显著提升长文本推理能力。

【AiBase提要:】
🌟 全球首个通过强化学习训练的长文本情境推理模型，采用GRPO和DAPO算法，大幅提升推理准确性与效率。
📚 在七个长文本情境文档问答基准测试中表现出色，处理复杂长文本任务能力领先。
🌐 发布完整解决方案体系，包括高性能模型、优化数据集、强化学习方法及评估体系，推动长文本AI应用产业化。
详情链接:https://github.com/Tongyi-Zhiwen/QwenLong-L1

3、GPT-4o 语音模式全新升级:唱歌功能上线，AI交互进入新境界

GPT-4o 的高级语音模式迎来重大更新，新增唱歌功能，同时提升了自然语音交互能力。尽管唱歌表现仍有待优化，但其多模态交互能力和情感表达已经展现了巨大潜力。

【AiBase提要:】
🌟唱歌功能上线，AI能根据指令生成旋律、歌词，甚至模仿特定风格的演唱。
⚡高级语音模式实现端到端处理，响应延迟仅320毫秒，支持更自然的情感交流。
🎶新增笑声、哭声等情感表达功能，拓展了AI在娱乐和教育领域的应用场景。

4、秘塔AI搜索推出全新“极速”模型:最高400tokens/秒响应速度

秘塔AI搜索推出了全新‘极速’模型，通过GPU上的kernel fusion技术和CPU上的动态编译优化策略，大幅提升了搜索效率，大部分问题可在2秒内得到解答。

【AiBase提要:】
🚀 在单张H800GPU上实现最高400tokens/秒的响应速度。
🔍 新模型在速度、准确率和逻辑性方面表现出色。
🌐 提供测速站点（kuai.metaso.cn）让用户亲身体验快速响应。

5、谷歌推出 LMEval:统一评估大语言与多模态模型的新工具

LMEval 是谷歌发布的开源框架，用于简化和标准化大型语言及多模态模型的评估，支持跨平台模型对比，提供增量评估和可视化分析功能。

【AiBase提要:】
🌟 LMEval 开源框架实现跨公司 AI 模型评估流程统一，提升效率。
🖼️ 支持文本、图像和代码评估，兼容新增输入格式，灵活扩展。
📊 提供 LMEvalboard 工具，直观展示模型性能，便于深度分析。
详情链接:https://github.com/google/lmeval

6、谷歌Chrome浏览器新增Gemini AI助手，实时屏幕感知能力引关注

我对于谷歌在Chrome浏览器中引入Gemini AI助手感到非常兴奋。这项技术不仅提升了用户体验，还展示了谷歌在AI领域的创新能力。Gemini AI助手通过实时感知屏幕内容并提供个性化帮助，让浏览更加高效和便捷。

【AiBase提要:】
✨Gemini AI助手能实时感知屏幕内容，提供智能化帮助。
🌟仅向AI Pro和AI Ultra订阅用户开放，目前处于测试版。
🚀未来计划扩展至更多场景与设备，提升整体用户体验。

7、全球首例!阿联酋全民免费使用ChatGPT Plus，AI国际化战略重大里程碑

阿联酋将成为全球首个向全体居民免费提供ChatGPT Plus高级版服务的国家，这标志着人工智能普及化的关键一步。

【AiBase提要:】
🌟 阿联酋将免费提供ChatGPT Plus服务，覆盖所有居民，推动AI技术的广泛使用。
🚀 建设星际之门阿联酋AI数据中心，计划构建1千兆瓦的人工智能计算集群，提升地区AI地位。
🌐 OpenAI与阿联酋合作，开发符合本土需求的AI解决方案，促进全球AI技术的普及与应用。

8、苏州成立60亿元人工智能母基金，助力产业转型升级

江苏苏州成立了一支60亿元的人工智能产业专项母基金，聚焦算力基础设施、数据、人才等领域，推动‘人工智能+制造业’等行业融合应用，加速产业转型升级。

【AiBase提要:】
苏州成立60亿基金，专注AI算力、数据、人才等关键环节，推动多行业融合应用。
基金由20家机构共同出资，执行事务合伙人占比1%，园区已形成完整AI产业生态。
预计2024年园区将聚集超1800家AI企业，助力苏州成为国家级AI发展试验区。

9、Kyutai Unmute 发布!10秒定制语音，AI对话进入超低延迟时代!

法国AI实验室Kyutai推出的Unmute系统为文本大语言模型赋予了强大的语音交互能力，包括智能对话、超低延迟和个性化定制功能。

【AiBase提要:】
🌟 Unmute通过模块化设计让文本模型快速获得语音输入和输出功能，无需重新训练模型。
🗣️ 具备智能判断与接话、随时打断及文本流式合成等功能，对话体验更接近人类。
个性化定制功能只需10秒语音样本即可生成专属AI声音，满足多样化需求。
详情链接:https://unmute.sh/

10、UAV-Flow项目突破无人机控制，语言指令实现精准飞行

UAV-Flow项目通过自然语言处理技术，让用户仅凭语音指令即可实现对无人机的精确控制，大幅降低操作门槛，推动其在消费、工业和救援等场景的应用。

【AiBase提要:】
🚀 无人机可通过语音指令如‘向前飞50米’或‘围绕目标盘旋’实现精准控制。
🌐 UAV-Flow集成了语音识别、语义理解及动态路径规划，适应多种复杂环境。
🌟 应用场景广泛，包括消费娱乐、工业巡检及紧急救援，提升操作安全性与效率。
详情链接:https://prince687028.github.io/UAV-Flow/

11、Claude即将大升级!百万字符上下文+记忆功能，AI交互要逆天了!

Anthropic计划对Claude进行多项重要功能升级，包括上下文窗口扩展、记忆功能增强、输出能力升级、多文件格式支持扩展以及视觉功能改进，这些改进将使Claude在长文本处理、跨模态任务和企业级应用中更具竞争力。

【AiBase提要:】
🚀 上下文窗口扩展至百万字符，大幅提升超长文本处理能力。
🧠 新增记忆功能，实现多轮对话更连贯、个性化的响应。
📈 扩展输出Token限制及多文件格式支持，增强企业级应用场景。

12、百度心响 iOS 版正式上线，智能体应用实现全面覆盖

作为一款多智能体协作应用，百度心响iOS版的上线标志着智能体应用普及的新阶段。它降低了使用门槛，提供了多种实用功能，如旅游攻略生成、深度研究支持以及健康咨询服务，致力于满足普通用户的多样化需求。

【AiBase提要:】
🌟 用户可在APP Store免费下载心响iOS版，享受便捷的智能体服务。
🗺️ 心响能自动生成旅游攻略、深度研究报告，助力高效规划与获取信息。
🏥 提供与线下医生相似的健康咨询服务，帮助用户更好地理解健康问题。

13、夸克发布行业首个“高考深度搜索”，一句话生成志愿填报方案

针对高考志愿填报信息繁杂的问题，夸克推出了‘高考深度搜索’功能，帮助考生和家长更高效地获取权威、准确的信息。

【AiBase提要:】
✨ 提供高考深度搜索功能，支持个性化志愿填报方案生成。
📚 数据来源于自建高考知识库，包括历年志愿数据及就业考研信息。
🌟 使用检索增强生成技术，降低大模型幻觉率，确保内容准确性。

14、Chrome v137开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器!

Chrome v137引入Gemini AI智能助手，通过智能标注、CSS修改、性能洞察和截图功能大幅提升开发效率。

【AiBase提要:】
✨ Gemini智能标注功能简化性能分析流程，快速理解复杂性能数据。
🎨 AI驱动CSS调试，一键修改与保存，显著提升前端开发效率。
🔍 新增性能洞察功能，发现隐藏问题，优化网站加载速度与运行时性能。

15、美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平

美团在AI领域取得显著进展，包括接近GPT-4o水平的大模型研发、业务决策助手的推出、以及NoCode编程工具的开发等，展示了其在智能化服务生态系统的雄心。

【AiBase提要:】
🌟 美团 AI 大模型能力接近 GPT-4o 水平，将推出业务决策助手。
💻 内部工程师的52% 代码由 AI 生成，提升工作效率。
🌐 推出 NoCode 编程工具，面向非技术用户，简化编程过程。

16、Direct3D-S2横空出世!千兆级3D生成提速近10倍，AI建模进入新纪元!

Direct3D-S2通过创新的空间稀疏注意力机制，显著提升了高分辨率3D图像生成的质量与效率，为千兆级3D生成提供了更具可扩展性的解决方案。

【AiBase提要:】
🌟 空间稀疏注意力（SSA）机制大幅提升生成效率，前向传播速度提升3.9倍，反向传播速度提升9.6倍。
🔍 统一稀疏体视格式提高训练稳定性，在1024³分辨率下仅需8块GPU即可完成训练。
🌐 开源计划预计5月底前公布，推动3D生成技术在全球范围内的普及与应用。
详情链接:https://github.com/DreamTechAI/Direct3D-S2

17、OpenAI 计划2026年推出首款 AI 硬件，让 ChatGPT 融入生活每个角落

OpenAI 正在研发一款由 ChatGPT 驱动的全新 AI 硬件，预计2026年发布。这款产品将整合到日常生活的方方面面，提供无缝的智能体验。

【AiBase提要:】
🌟 OpenAI 计划2026年推出由 ChatGPT 驱动的全新 AI 硬件。
📱 ChatGPT 将通过更多形式融入用户生活，成为不可或缺的助手。
🛠️ OpenAI 目标是打造随时陪伴的 AI，让用户享受无缝智能体验。

（举报）

相关推荐

关键词：

遇到平板电池问题，试试联想想帮帮AI服务智能体的AI智修功能

联想推出“想帮帮AI服务智能体”，通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题，AI即可自动检测电池耗电快、断触、游戏卡顿等异常，结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力，严重故障时可协助预约售后。该服务覆盖设备全生命周期，提供快速定位、即时处理的一站式解决方案，让用户告别手动排查烦恼。

手机电池耗电快打游戏断触平板断触
跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
填补行业空白！《终端智能体可信互联技术要求》标准正式发布

近日，IIFAA联合中国信息通信研究院发布《终端智能体可信互联技术要求》，旨在解决跨设备、跨平台智能体协同的底层信任问题。该标准基于ASL核心能力构建，聚焦可信连接、身份、意图与授权四大维度，为智能体产业提供统一安全协作框架。当前智能体互联缺乏统一标准，存在恶意攻击、隐私泄露等风险。IIFAA通过制定技术规范，填补行业空白，推动构建安全可信的智能终�

IIFAA 信通院终端智能体
数据分析迎来“智能体”时代，火山引擎披露多智能体架构性能优化关键

在2025智能大会暨第18届中国R会议上，火山引擎专家分享了Data Agent在业务数据分析中的性能调优实践。报告指出，数据分析正从传统商业智能向数据智能体跃迁，其核心能力扩展到复杂任务的自主执行与决策。Data Agent通过工具生态、运行时管理与安全环境设计，实现全场景覆盖，具备多步骤任务规划与动态调整能力，显著降低企业数据分析门槛并提升洞察效率。未来该技术将融合多模态理解与实时计算能力，在金融、制造、医疗等领域形成规模化落地，成为企业数据价值释放的核心引擎。

智能大会 Data Agent
启信宝斩获“行业洞见奖”，助力法律服务数字化转型

2025深圳法博会以"法律创新护航科技与产业创新"为主题圆满落幕。作为国内首个聚焦法律服务领域的专业展会，吸引权威机构、法律科技企业及行业专家参与。合合信息旗下启信宝凭借法律科技创新实践，荣获"行业洞见奖"，其功能将接入深圳律协"深律通"APP向全市律师开放。该平台通过大数据构建覆盖工商、司法、知识产权等多维度信息分析体系，突破传统工具局限，提供"数据+解读"双重支持，助力律师精准定位核心风险。此次获奖体现法律科技与行业需求的深度结合，未来将持续以创新技术赋能法律服务体系建设。

法律创新科技与产业法律服务博览会
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
工程师变身AI“指挥者”，吉利与阿里云的软件开发变革实验

1975年，IBM工程师Fred Brooks在《人月神话》中指出软件工程的核心难题：系统与团队规模增长会导致复杂度指数级上升，且“没有银弹”能单一提升生产力。如今汽车行业正经历软件史上最大挑战，吉利汽车软件人员占比从不足10%跃升至40%，智能汽车代码量超亿行。面对异构系统协同、安全标准严苛等难题，吉利与阿里云通义灵码深度合作，通过AI生成代码（占比超30%）、代码审查测试等，提升开发效率20%，并探索用AI破解遗留系统维护、知识传递等痛点。工程师角色正从“执行者”转向“AI指挥官”，未来或实现从需求到交付的全流程自动化协同。

软件工程复杂度智能汽车
百度发布全球最大通用智能体活跃用户超2000万

在百度世界2025大会上，百度正式宣布其智能体产品GenFlow3.0已在百度文库与百度网盘全端上线，目前活跃用户突破2000万，已成为全球规模最大的通用智能体，致力于帮助用户在工作、学习和生活中成为超级个体”。 GenFlow3.0被定位为全球首个全端通用智能体，具备更强大的多模态通用能力，可实现全模态内容的输入、处理与输出。该产品采用中心化原生Multi-Agent架构，结合行�

百度世界2025 GenFlow3.0 智能体产品
从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

AI时代重塑陪伴形式，联想“想帮帮AI服务智能体”以公益之心推出，通过五大功能（智玩、智验、智检、智修、智换）构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统，一键解决电脑卡顿等问题，让用户省时省心。该服务强调责任与长期守护，结合北京领养日公益理念，传递科技向善、服务有爱的智能温度，重新定义AI陪伴的全部意义。

AI陪伴领养代替购买智能服务

今日大家都在搜的词：

热文

3 天
7天

AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

遇到平板电池问题，试试联想想帮帮AI服务智能体的AI智修功能

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

填补行业空白！《终端智能体可信互联技术要求》标准正式发布

数据分析迎来“智能体”时代，火山引擎披露多智能体架构性能优化关键

启信宝斩获“行业洞见奖”，助力法律服务数字化转型

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

工程师变身AI“指挥者”，吉利与阿里云的软件开发变革实验

百度发布全球最大通用智能体活跃用户超2000万

从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

参与开发iPhoneAir设计师离职转投AI初创公司

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为Mate X7外观公布搭载全新折叠玄武架构

站长商机