首页 > 原创 > 关键词  > AI视频生成最新资讯  > 正文

AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

2026-01-04 16:07 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、字节跳动推出 StoryMem 系统,解决 AI 视频生成中的角色一致性问题

字节跳动与南洋理工大学的研究团队联合开发了 StoryMem 系统,旨在解决 AI 生成视频时角色在不同场景中外观不一致的问题。该系统通过存储关键帧并在后续场景生成时参考,从而保持角色和环境的一致性。研究结果显示,StoryMem 在跨场景一致性上提升了 28.7%,但其在复杂场景中仍存在挑战,需要更明确的角色描述以提高生成效果。

image.png

【AiBase提要:】

🌟 StoryMem 系统能够有效解决 AI 视频生成中角色和环境不一致的问题。

📊 通过存储关键帧,StoryMem 在跨场景一致性方面比现有模型提升了28.7%。

🛠️ 该系统在处理复杂场景时仍面临挑战,需对角色进行明确描述以提升生成效果。

详情链接:https://kevin-thu.github.io/StoryMem/

2、月之暗面再推多模态新模型,Kimi K2 升级版拟于第一季度亮相

月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5,该模型将基于其万亿参数开源模型Kimi K2进行升级,进一步提升多模态处理与智能体能力。公司目前拥有超过100亿元人民币的现金储备,为持续研发提供了充足底气。

【AiBase提要:】

🚀 月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5,提升多模态处理与智能体能力。

🧠 新模型基于万亿参数开源模型Kimi K2升级,支持“边思考、边工具协作”的Thinking模型。

💰 月之暗面拥有超过100亿元人民币的现金储备,为持续研发提供充足底气。

3、AI眼镜新王者诞生!“灵魂电脑”Pickle 1,能记住你一生所有事

Pickle1是一款融合AR显示与高级AI的智能眼镜,被定位为“灵魂电脑”,通过持续捕捉用户视觉与音频上下文,实现无限记忆、情感理解与主动交互。

image.png

【AiBase提要:】

🧠 Pickle1通过主动学习用户生活习惯,将日常经历转化为可搜索的“记忆泡”(memory bubbles)

👓 Pickle1采用轻量化设计,支持全天佩戴,并提供双目全彩AR显示和高通Snapdragon AI引擎

🔒 Pickle1强调数据本地处理,使用硬件隔离加密,确保用户隐私安全

详情链接:https://www.pickle.com/

4、清华与 OpenBMB 联合推出 UltraEval-Audio:音频模型评测新框架开源发布

UltraEval-Audio 是由清华大学 NLP 实验室、OpenBMB 和面壁智能联合开发的音频模型测评框架,其最新版本 v1.1.0 增加了对热门音频模型的一键复现功能,并扩展了对 TTS、ASR 和 Codec 等专业模型的支持。该框架的开源将显著提升研究者在音频模型开发中的效率,推动相关领域的研究进展。

【AiBase提要:】

🌟 UltraEval-Audio 是专为音频模型设计的测评框架,由多家机构联合开发。

🚀 最新版本 v1.1.0 新增一键复现功能,支持更多专业模型的评测。

📈 开源发布将提升研究者开发效率,推动音频模型领域的发展。

详情链接:https://github.com/OpenBMB/UltraEval-Audio

5、OpenAI押注“语音优先”未来!整合多团队重造音频模型,首款AI音频硬件或明年问世

文章分析了OpenAI在语音交互领域的战略布局,强调其通过重构音频系统,推动人机交互进入后屏幕时代,并探索音频优先的硬件产品,以争夺用户注意力资源。

【AiBase提要:】

🎙️ OpenAI重构音频战略,预计2026年推出音频优先个人设备。

🔊 新音频模型将实现更自然的语音合成和真实对话式打断。

📱 OpenAI计划推出无屏智能音箱、AI眼镜或可穿戴设备,目标是成为用户的“智能伴侣”。

6、无限薅 Gemini 额度神器Antigravity!一键切换多账号,告别 AI 限流烦恼

Antigravity Tools是一款开源桌面应用,通过智能账号管理和无缝切换功能,帮助用户无限扩展Gemini、Claude等顶级模型的使用时长,成为AI社区热门话题。

image.png

【AiBase提要:】

🧠 实时额度监控:应用可全局监控多个AI账号的剩余额度与健康状态。

🔄 自动推荐最佳账号:系统基于实时算法,智能筛选配额充足的账号,并支持一键无缝切换。

🌐 多协议兼容:支持将Web端Session转化为标准化API接口,解决不同厂商协议差异问题。

详情链接:https://github.com/lbjlaq/Antigravity-Manager

7、元象开源XVERSE-Ent大模型!聚焦泛娱乐场景,中英双语支持,填补行业专属模型空白

元象科技开源了面向泛娱乐行业的专属大模型XVERSE-Ent,该模型在社交互动、游戏叙事和文化创作方面表现出色,并提供了多参数版本以适应不同需求。

【AiBase提要:】

🎮 专为泛娱乐场景优化,支持社交互动、游戏叙事和文化创作。

🧩 提供多参数版本,部署友好且开源协议商用友好。

🌐 中英双语支持,融入大量中文网络文学与多语言影视文本。

8、苹果回应“AI 功能疑似阉割”:切勿通过第三方绕开限制,警惕账号风险

苹果官方正式回应了关于国行版 Apple 智能开启灰度测试的传闻,明确表示目前尚未上线,并提醒用户不要通过第三方软件强行激活 AI 功能,以免造成安全风险。

【AiBase提要:】

苹果官方确认 Apple 智能尚未在国行版本上线,一切以官网公告为准。

Apple 智能对硬件性能要求极高,仅 iPhone15Pro 及更新机型兼容。

苹果警告用户避免通过第三方软件强行激活 AI 功能,以防账号和资金安全风险。

举报

  • 相关推荐
  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • 马斯克称xAI将加码AI蓝图:明年大规模生成高质量游戏、影视

    马斯克昨日在X平台发文称,xAI明年将大规模推出影视内容和电子游戏。 而这些内容不仅能实时生成,还具备高质量,且能按照个人意愿定制。 据悉,马斯克曾在2025年预测,xAI旗下的游戏工作室将于今年年底前推出一款出色的AI生成游戏”。

  • 2026智能客服系统:全链路 AI 化盘点与选型实战手册

    随着企业服务体验竞争的白热化,智能客服系统已从单纯的“成本中心”演变为驱动增长的核心“服务引擎”。在 2026 年,企业对客服系统的需求不再局限于基础的问答机器人,而是转向全渠道整合、AI深度赋能与业务价值闭环。本次盘点的目的,正是为了帮助企业主与决策者在纷繁的产品中,梳理出真正具备实战价值、能够解决核心痛点的解决方案,为您的数智化转型提供一

  • 墨刀D2C实现设计稿生成多端代码,直出ArkUI助力鸿蒙开发

    本文介绍了墨刀D2C设计稿转代码功能如何解决开发者手动编写UI的痛点。传统UI开发耗时易错,设计改动需反复调整代码。墨刀D2C能直接将设计稿转换为结构清晰、符合各框架(如鸿蒙ArkUI、React、Vue等)官方规范的可维护代码,实现“一键生成”。它打通设计与开发壁垒,减少像素级还原的沟通成本,将团队讨论重心转向交互逻辑与用户体验优化,显著提升开发效率与协作信任度。

  • 如何在 NVIDIA RTX PC 上开始使用视觉生成式 AI

    本文介绍了AI驱动的内容生成技术如何深度融入Adobe、Canva等工具,以及创作者如何利用NVIDIA RTX PC本地运行AI工作流。重点包括:通过ComfyUI简化高级创意流程搭建,支持FLUX.2和LTX-2等强大模型;详细说明了在RTX PC上使用ComfyUI进行图像和视频生成的方法与技巧;强调了本地运行在控制素材、节省成本及优化结果方面的优势。文章还指出,随着模型规模增大,需根据GPU显存选择合适模型,并介绍了NVIDIA的优化技术。

  • 全天候AI智能体Moltbot在国产操作系统上部署

    Moltbot是一款创新的开源AI助手平台,凭借7×24小时主动工作、无限记忆等核心能力,在AI智能体领域脱颖而出。它支持全天候自动股票交易、智能物品采购等自动化任务,实现了从“问答”到“做事”的跨越。国产银河麒麟桌面操作系统已支持Moltbot本地部署,为用户带来更灵活、更自主的AI体验。其突出特点主要体现在以下三个方面:第一,具备主动工作的能力,彻底打破了传统AI的被动式响应,能够主动为用户提供所需服务,如日程提醒、新闻推送等;第二,可以直接操作设备,使主动服务形成完整闭环,能够通过各类应用程序直接为用户解决问题;第三,拥有长期记忆能力,可以记录用户的偏好与习惯,在长期互动中逐渐成为真正懂用户的个人助手,提供高度个性化的服务。

  • 全国首例生成式AI幻觉引发侵权案宣判:平台不存在过错

    近日,杭州互联网法院对全国首例因生成式AI幻觉”引发的侵权纠纷案作出一审判决,认定涉事AI平台已尽合理注意义务,不存在过错,驳回原告全部诉讼请求。 该案明确了AI生成内容的法律性质与平台责任边界,为行业发展提供重要裁判指引。 案件源于2025年6月,梁某使用某科技公司开发的生成式AI查询高校报考信息时,AI生成了该高校主校区的不准确信息。 即便梁某指出�

  • 10个年度剧综赞助案例背后,2026长视频商业化该怎么玩?

    如果以长视频商业化的发展轴线来看,2025年算得上某种意义的回落期。 剧集方面,尽管不少流量主演剧集屡屡被各方号称刷新平台招商纪录,40+、50+合作品牌数整齐罗列,化作开播前和播后总结的耀眼成绩单,但是,一方面开播剧集的单集赞助数量明显在减少、满档登场的情况近乎消失,另一方面,曾经被市场认为进入商业化成熟期标志性事件的剧集冠名、综艺式赞助体系�

  • 百惠金控:香港加速建构黄金中央结算系统 黄金ETF迎配置新机遇

    香港特区政府与上海黄金交易所签署合作备忘录,将公布黄金中央结算系统建设路线图,为实现与内地黄金市场“互联互通”铺路。黄金ETF作为核心投资工具,有望迎来配置热潮。双方合作将聚焦共同研发贵金属投资产品及探索跨市场互联互通机制。香港正积极为金融市场注入新内涵,黄金ETF作为成熟投资工具,将迎来全新增长空间。香港市场已布局多款黄金ETF产品,为投资者提供灵活配置渠道。随着未来黄金中央结算系统的建成,现有黄金ETF及相关衍生品市场将迎来质的飞跃,包括提升仓储与交割效率、推动产品创新与“互联互通”、优化资产配置等。

  • 10亿红包背后的AI暗战:腾讯、字节、阿里展开“三国杀”

    ​AI江湖,再起风云。 1月26日,马化腾在内部分享中透露:“元宝”将于2月1日上线春节活动,用户可瓜分10亿元现金红包,单个最高达万元。他直言希望复刻当年微信红包的奇迹,重温抢红包的快乐,并首次公开“元宝派”这个曾属“绝密项目”的社交产品。 曾经的“BAT大战”渐行渐远,如今字节、阿里、腾讯却在AI赛道短兵相接,一场“三国杀”正式拉开序幕。 腾讯此时�

今日大家都在搜的词: