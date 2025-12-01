首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报：北京发布人工智能产业白皮书；字节发布视频编辑模型Vidi2；快手将发布Kling Omni

1、北京发布《人工智能产业白皮书（2025）》，预计核心产值超 4500 亿元

文章详细介绍了2025年中国人工智能大会在北京的召开情况，以及北京市科学技术委员会发布的《北京人工智能产业白皮书（2025）》。白皮书分析了全球和中国人工智能的发展现状，并指出北京的人工智能产业规模迅速增长，预计2025年底将超过4500亿元

【AiBase提要:】

🌍 全球人工智能发展趋势分析，预计2025年核心产值将超过4500亿元。

🚀 北京市已成为全国人工智能企业的集聚地，企业数量超过2500家。

💡 通过政策引导和科研创新，北京市持续推动人工智能产业的高质量发展。

2、字节跳动发布“震动级”AI模型 Vidi2:120亿参数，让视频编辑彻底自动化

字节跳动推出了多模态大语言模型Vidi2，拥有120亿参数，专注于视频理解。该模型能够处理长视频并根据简单提示生成短视频或电影片段，具有精细的时空定位功能，提升了视频编辑的效率和准确性。

【AiBase提要:】

🎥 Vidi2具备精细的时空定位（STG）功能，能识别视频中的时间戳和目标对象边界框。

⚙️ 模型采用Gemma-3作为主干网络，并结合自适应标记压缩技术，确保处理长视频时的效率与细节保留。

📱 基于Vidi2开发的工具已应用于TikTok，如Smart Split功能，实现自动剪辑、重构图和添加字幕。

详情链接:https://www.alphaxiv.org/abs/2511.19529

3、西藏首个千亿参数藏语大模型“阳光清言”问世，人工智能在高原迈入新阶段

西藏首个千亿参数藏语大模型“阳光清言”问世，标志着人工智能在高原迈入新阶段，为藏语AI发展提供了重要支撑。

【AiBase提要:】

🧠 西藏大学与创业团队联合发布“阳光清言”V1.0，参数量突破千亿，覆盖多领域语料。

🌍 藏语AI基础设施实现突破，为低资源语言智能化提供高原样本。

🏥 政务办事、远程医疗等场景将实现母语交互，提升藏语传承效率。

4、快手 Kling Omni 本周即将发布：实现“导演级”精准控制，可生成2分钟带原生音频的长视频

快手科技旗下Kling AI正式开启‘Kling Omni Launch Week’，推出多模态视频基础模型Kling O1（Omni One），支持文本、图像和视频的多输入参考，提供导演级控制能力。该模型可生成长达2分钟的连续视频，并实现帧级精确的音频同步，标志着AI视频创作从随机生成向程序化导演模式的转变。

【AiBase提要:】

🎥 Kling O1支持文本、图像和视频的多输入参考，实现导演级精准控制。

⏱️ 可生成长达2分钟的连续视频，增强运动稳定性和风格连贯性。

🔊 集成原生音频同步技术，确保声音与画面达到帧级精确匹配。

5、Meta AI 推出 Matrix 框架，革新多智能体合成数据生成

Meta AI 推出了 Matrix 框架，通过去中心化的设计解决了合成数据新鲜性和多样性的问题，同时提升了令牌吞吐量。

【AiBase提要:】

🧠 Matrix 框架采用去中心化设计，避免了传统中心调度器的瓶颈。

🚀 在多项案例研究中，Matrix 展现出2到15倍的令牌吞吐量提升。

🔧 该框架充分利用 Ray 集群的分布式特性，实现高效的合成数据生成与处理。

详情链接:https://arxiv.org/pdf/2511.21686

6、国产家庭机器人F1来了：连人带床把你“推”去上班，明年初售价不到两万

文章介绍了国产家庭机器人F1的创新功能和市场计划。F1具备22个关节、轮式底盘和8小时续航能力，能够完成多种家务任务，如扫地、哄娃等，并且能执行长序列起床任务。其采用RVLA模型架构，任务成功率超过94%。此外，F1的设计解决了小户型空间限制问题，未来将推出教育模块并计划明年Q1上市。

【AiBase提要:】

🤖 F1具备22个关节和轮式底盘，可完成多种家务任务，如扫地、哄娃等。

💡 F1采用RVLA模型架构，任务成功率超过94%，能自动重试遇到的障碍。

🚀 F1计划明年Q1上市，定价不到两万，首批1000台将通过微信小程序抢购。

7、豆包升级语音功能！能说四种方言，助力老年人沟通无障碍

豆包App新增支持四种地道方言的语音对话功能，提升了用户与AI之间的交流体验，尤其对不熟悉普通话的老年人群体提供了便利。此外，豆包还展示了其在技术领域的持续创新，如通过ASR技术提升识别准确率，并举办奖学金活动以支持科技人才培养。

【AiBase提要:】

🍊 豆包App新增支持粤语、四川话、东北话和陕西话四种方言的语音对话功能。

🧠 豆包语音模型具备方言迁移技术，能够根据用户意图灵活切换方言。

💰 字节跳动举办奖学金颁奖典礼，提升奖学金总额至20万元，支持科技人才发展。

8、豆包手机助手发布技术预览版

豆包团队正式推出豆包手机助手的技术预览版，旨在为用户提供更高效的交互体验和更加丰富的功能。该助手依托于豆包大模型的强大能力，并结合了手机厂商的系统授权，力求打造全新的使用体验。

【AiBase提要:】

🌟 豆包手机助手技术预览版今日正式发布，致力于提升用户交互体验。

📱 搭载豆包手机助手的 nubia M153工程样机已少量发售，面向开发者和感兴趣的用户。

🚀 豆包团队将持续优化助手功能，与多家手机厂商合作，推动手机助手的成熟落地。

详情链接:https://o.doubao.com/

