AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

2025-05-29 15:23 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、DeepSeek R1-0528震撼发布:免费128K上下文，性能直逼OpenAI o3!

DeepSeek R1-0528版本发布，支持128K超大上下文，推理能力和代码生成能力大幅提升，且保持免费使用。

【AiBase提要:】
🌟 支持128K超大上下文，文本召回测试准确度显著提升，适合复杂任务。
💻 代码生成与写作能力优化，生成速度快且准确，媲美顶级模型。
💰 免费开放策略降低使用门槛，挑战传统AI商业模式。
详情链接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

2、字节发布图像Agent“小云雀AI” 打造一键爆款创作神器

字节跳动推出了全新的图像Agent‘小云雀AI’，这款智能创作工具能够通过简单的指令快速生成高质量的视频和图片，降低了内容创作的技术门槛。

【AiBase提要:】
🌟 用户只需一句指令，‘小云雀AI’就能主动思考并生成爆款视频与图片，实现‘灵感即所得’。
📚 基于字节自研‘云雀’大模型，融合深度学习与多模态技术，提供强大的图像生成与视频编辑能力。
📱 当前已上线安卓客户端，iOS版本预计6月发布，有望推动AI创作向更广泛应用场景发展。

3、可灵2.1重磅上线:价格降65%，性能显著提升

可灵2.1正式上线，价格大幅降低65%，性价比显著提升。新增三个质量模型，满足不同用户需求。生成效果优于前版本，速度更快，适合短视频和广告制作。

【AiBase提要:】
🌟 可灵2.1价格大幅降低65%，性价比显著提升。
⚡ 新增标准版、高品质版与大师版三种模型，满足不同用户需求。
📈 生成效果优于前版本，速度更快，适合短视频和广告制作。

4、全球首款AI代理浏览器Opera Neon发布，智能聊天与自动化任务引领Web4.0时代

Opera Neon作为全球首款代理型浏览器，通过AI驱动的智能聊天、任务自动化及内容创作功能，重新定义了网络体验。

【AiBase提要:】
🌐 Opera Neon是全球首款“完全代理型”浏览器，能主动执行搜索、表单填写、购物等任务，提升用户效率。
💬 内置AI助手Neon Chat支持多语言交互，能从网页提取信息并提供上下文相关答案，让交互更自然。
💻 Neon Make通过简单指令生成游戏、网站等内容，一站式体验从创意到成品的全过程，释放创造力。
详情链接:https://www.operaneon.com/

5、Meta 发布 Multi-SpatialMLLM:引领多模态 AI 的空间理解革命

Meta 与香港中文大学合作推出 Multi-SpatialMLLM 模型，通过整合深度感知、视觉对应和动态感知三大组件，显著提升了多模态大语言模型的空间理解能力，在多项基准测试中表现出色。

【AiBase提要:】
🌟 Multi-SpatialMLLM 模型通过三大组件突破单帧图像分析限制，增强空间理解能力。
📊 新模型利用 MultiSPA 数据集及五项任务训练，大幅提升了多帧空间推理能力。
🏆 在多项基准测试中，Multi-SpatialMLLM 准确率显著提高，超越传统模型。

6、通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活，成本降低88%

ZeroSearch 是一项创新框架，通过模拟搜索引擎激活大语言模型的检索能力，大幅降低训练成本达88%，同时提升模型的推理清晰度与答案提取效率。

【AiBase提要:】
✨ ZeroSearch 利用大语言模型生成检索文档，无需真实搜索，显著降低训练成本与噪声干扰。
🔍 框架采用结构化训练模板和“模拟微调”策略，提升生成文档质量及模型泛化能力。
🚀 实验表明，ZeroSearch 性能优于传统方法，尤其在大规模模型中表现更佳，推动智能检索技术发展。
详情链接:https://arxiv.org/pdf/2505.04588

7、字节推出全新 AI 剪辑应用 “剪小映”，轻松记录生活瞬间

字节跳动推出新应用“剪小映”，主打AI视频剪辑，降低创作门槛，让用户轻松制作高质量视频。

【AiBase提要:】
🎥 字节推出 “剪小映” 应用，助力用户轻松制作高质量视频。
🤖 应用集成 AI 技术，降低视频创作门槛，鼓励用户分享生活。
💡 火山引擎豆包大模型为应用提供强大支持，提升视频处理效率。

8、MotionPro炸场!AI视频生成革命来袭，40ms一帧精准控制，影视游戏行业要变天

MotionPro是一款专为图像到视频生成设计的精密运动控制器，通过区域轨迹和运动掩码技术实现精细化控制，为视频生成带来灵活性和精确性。

【AiBase提要:】
✨ MotionPro通过区域轨迹和运动掩码技术，解决了传统I2V生成中运动控制粗糙的问题，实现更自然、细腻的效果。
🎥 同时控制物体与镜头运动，无需特定数据集，支持复杂镜头和物体轨迹的精准生成。
🌐 开源生态支持，提供优化的训练框架和数据构建工具，助力开发者快速上手并推动行业进步。
详情链接:https://huggingface.co/papers/2505.20287

9、马斯克的xAI与 Telegram 达成3亿美元合作协议，推出Grok AI聊天机器人

Telegram与xAI合作，xAI支付3亿美元部署Grok AI聊天机器人，提升Telegram用户体验并增加收入。

【AiBase提要:】
Telegram与xAI合作，xAI支付3亿美元用于部署Grok AI聊天机器人。
Grok AI将提升Telegram用户交流体验，提供智能化聊天服务。
合作将使Telegram盈利模式多样化，推动社交媒体智能化进程。

10、OpenAI CFO 透露:重组新架构为未来可能的IPO打开大门

OpenAI正在进行组织重组为IPO做准备，但上市时机取决于市场氛围。微软投资超130亿美元，OpenAI转型公共利益公司平衡股东回报与社会责任。

【AiBase提要:】
🌟 OpenAI正在重组架构，为未来的IPO铺路，但上市需视市场状况。
💰 微软投资超130亿美元，OpenAI转型公共利益公司兼顾股东与社会责任。
📈 稳定性是关键，上市需公司准备充分且市场窗口合适。

11、像素蛋糕 “方糖大模型” 成功获批，成为国内影像行业首个备案图像大模型

像素蛋糕自主研发的‘方糖大模型’通过国家网信办备案，成为影像行业首个获官方资质的应用级图像大模型，标志着技术突破与合规性，将在广告、影视等领域推动行业发展。

【AiBase提要:】
🌟 方糖大模型成功通过国家网信办备案，成为国内影像行业首个获官方资质的图像大模型。
🚀 自主研发彰显像素蛋糕在AI技术领域的实力与创新能力，推动图像生成技术发展。
🔒 符合国家政策要求，确保用户使用环境的安全与可靠性，树立行业新标杆。

12、开源+低成本!Paper2Poster让学术论文秒变学术海报

Paper2Poster是一款通过自动化技术将学术论文转化为多模态海报的工具，显著提升了学术传播效率，降低了成本。

【AiBase提要:】
🌟 核心功能:将PDF论文自动转化为结构清晰、视觉友好的学术海报，效率远超传统手动方式。
💰 开源与低成本:生成一张海报仅需0.005美元，开源特性降低学术工具使用门槛。
📊 创新评估机制:发布100个论文-海报对的数据集，推动多模态内容生成领域规范化发展。
详情链接:https://arxiv.org/abs/2505.21497

13、Resemble AI开源TTS Chatterbox ，性能直逼超越ElevenLabs

Chatterbox是一款基于开源的TTS模型，具有卓越的性能和创新功能，包括实时合成、零样本语音克隆和情感夸张控制等，成为行业焦点。

【AiBase提要:】
🌟 Chatterbox基于0.5B规模的LLaMA架构，训练数据超50万小时，盲测中63.75%的听众更偏好其真实感和流畅度。
⚡ 支持实时合成，延迟低于200ms，且具备零样本语音克隆与情感夸张控制功能，为开发者提供高度灵活性。
🔒 开源特性降低门槛，同时嵌入水印技术确保内容可追溯，展现开源与商业化的双轨战略。
详情链接:https://github.com/resemble-ai/chatterbox

14.蚂蚁集团开源 Ming-lite-omni: 首个媲美 GPT-4o 的开源多模态模型

蚂蚁集团宣布全面开源多模态模型 Ming-lite-omni，具备 220 亿参数，标志其 AI 技术的新高度，能够与 GPT-4o 相媲美。

【AiBase 提要:】
🌟 220 亿参数的 Ming-lite-omni 模型展现了强大能力。
🚀 模型权重和推理代码已向公众开放，促进开发者使用。
📈 性能对标 GPT-4o，成为开源多模态领域的重要选择。

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
1024数百场活动致敬鸿蒙开发者，鸿蒙如何与开发者“双向奔赴”

在1024程序员节之际，华为鸿蒙生态发起"星光不负码向未来"致敬活动，通过全国超百场开发者交流，展现鸿蒙生态的蓬勃活力。目前HarmonyOS 5终端设备数已突破2300万，上架应用超3万款，鸿蒙游戏超1.2万款，近400款政务应用完成鸿蒙适配。华为每年投入超60亿元激励创新，并启动"鸿蒙天工计划"投入10亿元支持AI生态建设。从HarmonyOS 5到HarmonyOS 6，鸿蒙生态正从"破冰"走向深度融合创新，这离不开千万开发者的智慧与汗水。

文章搜索核心标签鸿蒙生态

今日大家都在搜的词：

热文

3 天
7天

AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

1024数百场活动致敬鸿蒙开发者，鸿蒙如何与开发者“双向奔赴”

今日大家都在搜的词：

热文

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iQOO Neo11开售2小时销量超前代全天

iQOO 15旷野配色今日开售：售价4999元首发2K三星珠峰屏

vivo WATCH GT 2已支持开通移动/联通eSIM服务

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

鸿蒙智行：全新问界M7上市36天交付破20000台

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

站长商机