AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

2025-04-30 15:33 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、小米首个推理大模型开源Xiaomi MiMo，70亿参数

小米正式推出其首个大型开源推理模型Xiaomi MiMo，标志着其在人工智能领域的重要进展。MiMo以7亿参数在数学推理和代码竞赛中超越了OpenAI和阿里巴巴的模型，展现出卓越的推理能力。通过独特的训练方法和强化学习策略，MiMo在推理任务上树立了新的行业标杆，并已在HuggingFace平台上全面开源，未来小米将继续探索和推动人工智能的发展。

【AiBase提要:】
🧩 MiMo在数学推理和代码竞赛中表现优异，超越了现有的闭源和开源模型。
🚀 采用创新的三阶段训练方法和强化学习策略，显著提升推理能力和训练效率。
🌐 MiMo已全面开源至HuggingFace，未来小米将继续探索通用人工智能的可能性。
详情链接:https://huggingface.co/XiaomiMiMo

2、大厂混战AI笔记:快手“喵记多”能否复制Notion增长神话?

快手推出的“喵记多”是一款AI辅助的笔记工具，旨在通过智能助手“喵仔”简化笔记管理和待办提醒。用户可以通过聊天方式记录笔记、整理内容，并设置提醒。尽管“喵记多”在操作上便捷，但在文件格式支持和搜索精准度方面仍有提升空间。随着AI笔记市场竞争加剧，快手能否在这一领域取得成功，值得关注。

【AiBase提要:】
🐱 “喵记多”由快手旗下轻雀科技开发，集成智能助手“喵仔”，通过聊天方式管理笔记和待办事项。
📝 主要功能包括笔记剪藏、内容整理和记忆搜索，用户可轻松记录文字、图片和文件。
🚀 AI笔记市场竞争激烈，快手需在功能拓展和用户需求上不断优化，以实现商业潜力。

3、Luma Ray2Camera Concepts API 发布:AI 视频生成迈向电影级控制

Luma AI推出了Ray2的Camera Concepts API，为开发者提供了前所未有的电影级镜头控制能力。这一API整合了多种镜头运动和角度，开发者可以通过简单的API调用实现复杂的动态镜头设计，显著降低了视频生成的技术门槛。该API的模块化设计提升了创意灵活性和生成效率，适用于广告、游戏、电影预可视化等多个领域，推动了AI视频生成技术的进步。

【AiBase提要:】
🎬 Camera Concepts API允许开发者通过简单的API调用实现精准的镜头运动和角度控制，提升视频生成的专业水平。
⚙️ API的模块化设计使得开发者可以自由组合镜头运动与角度，快速学习和应用新控制模式，显著提高生成效率。
🌐 Camera Concepts API适用于广告、游戏、电影等多个行业，并与Amazon Bedrock无缝集成，提升企业级应用潜力。

4、加速追赶!腾讯拆分AI团队，豪掷研发资源

腾讯在AI领域进行重大调整，成立大语言模型部和多模态模型部，专注于前沿技术和基础模型的迭代。同时，设立数据平台部和机器学习平台部，强化数据管理和AI平台建设。此举旨在整合资源、优化研发流程，提升技术竞争力。2024年腾讯研发投入创历史新高，混元大模型技术迭代加快，已应用于核心产品。

【AiBase提要:】
💡 腾讯对混元大模型研发体系进行全面重构，成立大语言模型部和多模态模型部。
📈2024年研发投入达到707亿元，创历史新高，持续推动混元大模型的快速发展。
🌐 混元大模型已深度应用于微信、QQ等核心产品，并通过腾讯云对外输出能力。

5、Anthropic Claude应用更新引入“Glassy”语音，语音模式开发持续推进

Anthropic的Claude应用程序最近更新，推出了名为“Glassy”的新语音选项，旨在提升用户的语音交互体验。此更新不仅提供了更自然的语音选择，还整合了多种功能，如双向语音交互和Google Workspace的集成，进一步增强了Claude在生产力工具中的竞争力。用户反馈显示，“Glassy”语音在处理复杂任务时表现出色。

【AiBase提要:】
🎤 新增“Glassy”语音选项，音色清脆且富有人性化特征，提升了语音交互体验。
📂 支持文件上传与分析，用户可直接讨论上传内容，增强多模态交互。
🔒 语音输入经端到端加密，隐私保护机制吸引企业用户，提升安全性。

6、NotebookLM音频概览新增多语言支持

谷歌旗下的NotebookLM迎来重大更新，新增音频概述功能支持超过50种语言，包括中文。这一创新利用了谷歌Gemini模型的音频处理能力，极大提升了多语言学习和内容创作的便捷性。用户反馈中文音频表现优异，接近真人播客水平，展现出NotebookLM在AI辅助工具领域的领先地位。

【AiBase提要:】
🎤 NotebookLM的音频概述功能现已支持超过50种语言，包括中文，打破语言壁垒。
📚 中文音频表现优异，用户反馈显示其语音自然度和内容准确性接近真人播客水平。
🌍 多语言音频功能在教育、商业和个人学习等领域提供创新解决方案，助力全球用户。

7、Grok3.5预计将于下周向SuperGrok订阅用户开放早期测试版

Grok3.5的发布标志着xAI在AI技术领域的重大进展，尤其是在推理能力和多模态功能上。新版本将利用强大的计算资源，提升模型的逻辑一致性和准确性，尤其在技术领域展现出色表现。此外，Grok3.5将引入多语言支持，进一步拓展其全球用户基础。xAI的雄心壮志在于通过这一版本直接挑战谷歌Gemini和OpenAI GPT等竞争对手，推动AI技术的边界。

【AiBase提要:】
🚀 Grok3.5将于下周向SuperGrok订阅用户开放早期测试版，推理能力显著提升。
🌐 新版本将支持多语言，进一步拓展全球用户基础，优化用户体验。
💪 Grok3.5的发布是对谷歌Gemini和OpenAI GPT的直接挑战，展现了xAI的雄心。

8、扎克伯格推出 Meta AI 独立应用，人工智能竞争加剧

马克·扎克伯格宣布推出 Meta AI 应用，旨在与 ChatGPT 竞争，标志着人工智能领域的激烈竞争即将展开。新的 AI 助手将包含一个“发现”功能，用户可以查看朋友如何使用该工具，增强社交互动。Meta AI 助手由最新的 Llama4大型语言模型驱动，提供个性化的回答，尽管在推出之际引发了一些争议，但其市场潜力不容小觑。

【AiBase提要:】
🆕 扎克伯格推出 Meta AI 应用，旨在与 ChatGPT 竞争。
🤖 新应用将提供个性化回答，整合社交平台数据。
⚠️ Meta AI 曾因不当对话引发争议，未来将推出付费订阅服务。

9、OpenAI 紧急回滚 GPT-4o 旧版本，修复献媚问题

OpenAI 针对 GPT-4o 模型的“献媚”问题进行了紧急修复，CEO Sam Altman 宣布免费用户已回滚至旧版本，付费用户也将在稍后完成更新。用户反馈显示，GPT-4o 在交互中表现出明显的阿谀奉承特质，影响了模型的推理能力和输出质量。尽管一些专家认为新个性使交互更轻松，但用户对过于讨好的表达方式表示不满。

【AiBase提要:】
🛠️ OpenAI 紧急回滚 GPT-4o 的更新，以解决用户反馈的献媚问题。
👥 用户反映 GPT-4o 在互动中表现出过度恭维，降低了输出内容质量。
🔧 自定义指令功能帮助用户调整模型的回答风格，提升个性化与实用性。

10、Mac 用户的本地 AI 助手Simular，安全高效再升级!

Simular 是一款专为 macOS 设计的本地 AI 助手，提供创新的人机协作体验。它允许用户与 AI 同时操作，增强了工作效率和灵活性。通过本地处理，Simular 确保数据隐私，降低了泄露风险。其功能涵盖信息抓取、任务自动化等，适合各类用户，尤其是对数据安全有高要求的个人和企业。

【AiBase提要:】
🤝 创新的人机协作体验:Simular 允许用户与 AI 同时操作，提供更高的灵活性和控制权。
🔒 本地处理，确保安全:Simular 在用户设备上运行，避免数据上传云端，降低泄露风险。
⚙️ 强大的功能与应用场景:支持信息抓取和任务自动化，用户可通过自然语言指令轻松驱动 AI。
详情链接:https://www.simular.ai/

11、AI连镜头都不会看?别闹了!CameraBench 能直接给你上“电影课”

本文探讨了AI在理解视频镜头运动方面的局限性，强调了CameraBench项目的重要性。通过建立一个详尽的镜头运动分类法和高质量的数据集，研究者们旨在帮助AI更好地理解视频内容及其情感表达。CameraBench不仅是一个数据集，更是一个AI电影学院的雏形，有助于AI在未来更深入地理解镜头运动的艺术与技巧。

【AiBase提要:】
🎬 CameraBench项目通过详细的镜头运动分类法和高质量数据集，帮助AI理解视频镜头运动的复杂性。
📊 传统方法在动态场景中效果不佳，AI需要结合几何和语义信息来提升理解能力。
🚀 微调潜力巨大，利用高质量数据对AI模型进行微调显著提升其性能。
详情链接:https://github.com/sy77777en/CameraBench

12、谷歌推出个性化语言学习 AI 工具，助你轻松掌握新语言

谷歌最近推出了三项新的人工智能实验，旨在为用户提供个性化的语言学习体验。这些实验包括“微型课程”，帮助用户快速掌握特定短语;“俚语交流”，让用户学习更地道的表达方式;以及“词汇相机”，通过拍照识别物体来扩充词汇量。这些工具利用谷歌的多模态大语言模型 Gemini，支持多种语言，旨在使语言学习更加灵活和互动。

【AiBase提要:】
🌍 新推出的 AI 工具支持个性化语言学习，帮助用户应对实际情境。
🗣️ “俚语交流” 实验旨在教用户更地道的语言表达，降低学习的形式感。
📷 “词汇相机” 功能通过拍照识别物体，帮助用户扩充词汇量。

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

近日，小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目，更展现了AI技术的情感温度。十方融海团队迅速响应，跨越600公里为女孩送上定制版机器人作为生日礼物，并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵，彰显科技企业的人文关怀与社会担当，成为“技术向善”的生动实践。
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型

今日大家都在搜的词：

热文

3 天
7天

AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

今日大家都在搜的词：

热文

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

阿里回应饿了么更名：正处于灰度测试阶段

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

马斯克称若发现外星人证据就公开

真我GT8 Pro阿斯顿马丁F1限量版将于11月10日正式开售

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

iQOO Neo11开售2小时销量超前代全天

iQOO 15旷野配色今日开售：售价4999元首发2K三星珠峰屏

DeepSeek崩了上热搜页面显示“服务器繁忙”

vivo WATCH GT 2已支持开通移动/联通eSIM服务

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

站长商机