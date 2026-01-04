首页 > 原创 > 关键词  > AI视频生成最新资讯  > 正文

AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

2026-01-04

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

1、字节跳动推出 StoryMem 系统，解决 AI 视频生成中的角色一致性问题

字节跳动与南洋理工大学的研究团队联合开发了 StoryMem 系统，旨在解决 AI 生成视频时角色在不同场景中外观不一致的问题。该系统通过存储关键帧并在后续场景生成时参考，从而保持角色和环境的一致性。研究结果显示，StoryMem 在跨场景一致性上提升了 28.7%，但其在复杂场景中仍存在挑战，需要更明确的角色描述以提高生成效果。

image.png

【AiBase提要:】

🌟 StoryMem 系统能够有效解决 AI 视频生成中角色和环境不一致的问题。

📊 通过存储关键帧，StoryMem 在跨场景一致性方面比现有模型提升了28.7%。

🛠️ 该系统在处理复杂场景时仍面临挑战，需对角色进行明确描述以提升生成效果。

详情链接:https://kevin-thu.github.io/StoryMem/

2、月之暗面再推多模态新模型，Kimi K2 升级版拟于第一季度亮相

月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5，该模型将基于其万亿参数开源模型Kimi K2进行升级，进一步提升多模态处理与智能体能力。公司目前拥有超过100亿元人民币的现金储备，为持续研发提供了充足底气。

【AiBase提要:】

🚀 月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5，提升多模态处理与智能体能力。

🧠 新模型基于万亿参数开源模型Kimi K2升级，支持“边思考、边工具协作”的Thinking模型。

💰 月之暗面拥有超过100亿元人民币的现金储备，为持续研发提供充足底气。

3、AI眼镜新王者诞生！“灵魂电脑”Pickle 1，能记住你一生所有事

Pickle1是一款融合AR显示与高级AI的智能眼镜，被定位为“灵魂电脑”，通过持续捕捉用户视觉与音频上下文，实现无限记忆、情感理解与主动交互。

image.png

【AiBase提要:】

🧠 Pickle1通过主动学习用户生活习惯，将日常经历转化为可搜索的“记忆泡”（memory bubbles）

👓 Pickle1采用轻量化设计，支持全天佩戴，并提供双目全彩AR显示和高通Snapdragon AI引擎

🔒 Pickle1强调数据本地处理，使用硬件隔离加密，确保用户隐私安全

详情链接:https://www.pickle.com/

4、清华与 OpenBMB 联合推出 UltraEval-Audio：音频模型评测新框架开源发布

UltraEval-Audio 是由清华大学 NLP 实验室、OpenBMB 和面壁智能联合开发的音频模型测评框架，其最新版本 v1.1.0 增加了对热门音频模型的一键复现功能，并扩展了对 TTS、ASR 和 Codec 等专业模型的支持。该框架的开源将显著提升研究者在音频模型开发中的效率，推动相关领域的研究进展。

【AiBase提要:】

🌟 UltraEval-Audio 是专为音频模型设计的测评框架，由多家机构联合开发。

🚀 最新版本 v1.1.0 新增一键复现功能，支持更多专业模型的评测。

📈 开源发布将提升研究者开发效率，推动音频模型领域的发展。

详情链接:https://github.com/OpenBMB/UltraEval-Audio

5、OpenAI押注“语音优先”未来！整合多团队重造音频模型，首款AI音频硬件或明年问世

文章分析了OpenAI在语音交互领域的战略布局，强调其通过重构音频系统，推动人机交互进入后屏幕时代，并探索音频优先的硬件产品，以争夺用户注意力资源。

【AiBase提要:】

🎙️ OpenAI重构音频战略，预计2026年推出音频优先个人设备。

🔊 新音频模型将实现更自然的语音合成和真实对话式打断。

📱 OpenAI计划推出无屏智能音箱、AI眼镜或可穿戴设备，目标是成为用户的“智能伴侣”。

6、无限薅 Gemini 额度神器Antigravity！一键切换多账号，告别 AI 限流烦恼

Antigravity Tools是一款开源桌面应用，通过智能账号管理和无缝切换功能，帮助用户无限扩展Gemini、Claude等顶级模型的使用时长，成为AI社区热门话题。

image.png

【AiBase提要:】

🧠 实时额度监控：应用可全局监控多个AI账号的剩余额度与健康状态。

🔄 自动推荐最佳账号：系统基于实时算法，智能筛选配额充足的账号，并支持一键无缝切换。

🌐 多协议兼容：支持将Web端Session转化为标准化API接口，解决不同厂商协议差异问题。

详情链接:https://github.com/lbjlaq/Antigravity-Manager

7、元象开源XVERSE-Ent大模型！聚焦泛娱乐场景，中英双语支持，填补行业专属模型空白

元象科技开源了面向泛娱乐行业的专属大模型XVERSE-Ent，该模型在社交互动、游戏叙事和文化创作方面表现出色，并提供了多参数版本以适应不同需求。

【AiBase提要:】

🎮 专为泛娱乐场景优化，支持社交互动、游戏叙事和文化创作。

🧩 提供多参数版本，部署友好且开源协议商用友好。

🌐 中英双语支持，融入大量中文网络文学与多语言影视文本。

8、苹果回应“AI 功能疑似阉割”:切勿通过第三方绕开限制，警惕账号风险

苹果官方正式回应了关于国行版 Apple 智能开启灰度测试的传闻，明确表示目前尚未上线，并提醒用户不要通过第三方软件强行激活 AI 功能，以免造成安全风险。

【AiBase提要:】

苹果官方确认 Apple 智能尚未在国行版本上线，一切以官网公告为准。

Apple 智能对硬件性能要求极高，仅 iPhone15Pro 及更新机型兼容。

苹果警告用户避免通过第三方软件强行激活 AI 功能，以防账号和资金安全风险。

