首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:豆包2.0将于情人节发布;MiniMax M2.5 正式发布;小米开源首代机器人 VLA 大模型

2026-02-12 16:53 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、情人节重磅!火山引擎豆包2.0将发:视频生成直达“工业级”交付

字节跳动旗下火山引擎拟于2月14日发布多项技术升级,重点涵盖“豆包”系列产品2.0版本,包括音视频创作工具 Seedance2.0 与图像创作工具 Seedream5.0Preview。此次升级旨在降低专业内容生产门槛,标志着字节跳动在数字化创作与企业效能工具领域迈出重要一步。

【AiBase提要:】

工业级视频交付:Seedance2.0在人机交互与动态画面稳定性上达到行业领先,支持全模态输入,输出质量适配影视与广告等专业场景。

实时检索增强:Seedream首次引入实时信息检索功能,确保创作内容与社会时效同步,精准满足即时创作需求。

深度意图理解:新系统内置百科知识库,显著增强多语种处理能力,即使是模糊输入,也能实现高精度的图文契合度与主体一致性。

2、MiniMax M2.5 正式发布:编程力对标 Claude Opus 4.6,市值狂飙突破 1800 亿

MiniMax M2.5 的发布标志着国产 AI 领域在编程与智能体场景中的重大突破,其性能直接对标国际顶尖模型 Claude Opus 4.6,并在资本市场引发强烈反响。

image.png

【AiBase提要:】

🧠 全栈编程:支持 PC、App 及跨端应用的全链路开发,展现了极其深厚的编程底蕴。

⚡ 效率神话:激活参数量仅为 10B,极大降低了显存占用,支持 100 TPS 的超高吞吐量。

💰 资本狂欢:市值突破 1800 亿港元,当日盘中涨幅一度超过 20%。

3、小米开源首代机器人 VLA 大模型,突破“物理智能”延迟瓶颈

小米开源了首代机器人VLA大模型Xiaomi-Robotics-0,该模型拥有47亿参数,解决了现有VLA模型因推理延迟导致的机器人动作迟缓问题,实现了消费级显卡上的实时推理与高效泛化。

image.png

【AiBase提要:】

🧠 视觉语言大脑(VLM)负责解析人类指令并捕捉空间关系。

⚙️ 动作执行小脑(Action Expert)通过流匹配技术生成精准动作块。

🚀 通过两阶段训练提升模型在真实环境中的响应敏捷性。

详情链接:https://xiaomi-robotics-0.github.io

4、集成主流大模型!百度千帆发布 AI 编码订阅服务 Coding Plan

百度千帆推出全新的 AI 编码订阅服务 Coding Plan,深度集成 GLM-4.7 和 DeepSeek-V3.2 等主流代码模型,支持一键切换,兼容 OpenAI 及 Anthropic 协议的工具,提供多样化的订阅方案,满足个人开发者和高频需求用户的需求。

image.png

【AiBase提要:】

🧠 深度集成多款主流代码模型,提升开发效率。

🔄 支持一键切换模型,简化开发流程。

💰 提供多种订阅方案,满足不同需求。

5、智谱发布 GLM-5:从“代码生成”迈向“工程构建”的 Agentic Ready 时代

智谱发布GLM-5,标志着大模型从代码生成迈向工程构建的Agentic Ready时代,其性能对标行业顶尖,核心突破包括参数扩展、异步强化学习和稀疏注意力机制,同时支持多智能体开发并适配国产芯片平台。

image.png

【AiBase提要:】

🧠 GLM-5模型参数扩展至744B,预训练数据量提升至28.5T。

🚀 采用“Slime”框架与异步智能体强化学习算法,提升长程交互能力。

💻 支持多智能体并发完成开发全流程,并适配国产芯片平台。

6、DeepSeek 迎来版本更新:上下文长度跃升至1M,万亿参数旗舰模型在路上

DeepSeek 网页端与移动应用同步迎来版本更新,其上下文长度提升至1M Token,标志着其在大规模文档处理领域迈入全球顶尖梯队。此次升级将处理能力提升了近8倍,并能一次性处理整本长篇小说,应用场景广泛。同时,下一代旗舰模型 DeepSeek V4 正处于研发后期,预计规模将达到万亿参数级。

【AiBase提要:】

🚀 上下文长度提升至1M Token,处理能力显著增强。

📚 能够处理整本长篇小说,适用于多种场景。

🧠 下一代旗舰模型 DeepSeek V4 正在研发中,规模达到万亿参数级。

7、拒绝“智障”眼镜!Rokid Glasses 支持接入 DeepSeek/Kimi 等私有模型,你的眼镜你定义

乐奇(Rokid)推出的AI眼镜Rokid Glasses新增的“自定义智能体”功能,该功能允许开发者将私有模型接入眼镜系统,提升硬件可玩性并推动AI穿戴设备向“用户定义”转变。

【AiBase提要:】

🧠 模型适配广:开发者可通过标准化接口接入DeepSeek R1、Qwen3、Kimi K2.5等热门模型。

💻 原生支持开源框架:支持直接接入OpenClaw开源框架,增强逻辑处理能力。

🔒 安全责任:用户需对自定义智能体的数据安全及合规性负责,并遵守网络安全法规。

8.支付宝“AI付”支付超1. 2 亿笔,开启 AI 支付时代

支付宝的‘AI付’服务在一周内累计支付笔数超过1. 2 亿,成为全球首个支付笔数破亿的AI原生支付产品。这标志着AI支付时代的全面开启,也展示了支付宝在AI技术应用方面的领先地位。

image.png

【AiBase提要:】

支付宝‘AI付’一周支付笔数超1. 2 亿,成为全球首个支付笔数破亿的AI原生支付产品。

‘AI付’已在多个AI场景上线,如千问、Rokid、瑞幸等,加速普及进程。

蚂蚁集团两大创新支付服务均突破‘亿级’门槛,助力AI产业与新消费爆发。

详情入口:

🔗 https://www.chinaz.com/ainews/25490.shtml

举报

  • 相关推荐
  • 爱诗科技完成 3 亿美元 C 轮融资,鼎晖领投,开启“实时交互”视频生成新纪元

    AI视频生成领军企业爱诗科技近日完成3亿美元C轮融资,由鼎晖香港基金、鼎晖VGC、鼎晖百孚领投,产业投资人中国儒意、三七互娱,以及亦庄国投、众为资本、国泰君安创新投资、苏创投集团、苏州卓睿、华控基金、复星锐正、苏州宜和等多家全球知名家族办公室和海外投资机构参与。本轮融资刷新了亚洲AI视频生成领域的最大单次融资纪录。爱诗科技将深耕通用视频模型和世界模型,加速PixVerse全球创作者生态建设,并推动全行业API商业化深度落地。其PixVerse V5.6模型在全球权威AI评估机构榜单中位列视频生成模型第一梯队,技术实力获国际认可。公司全球用户规模已突破1亿,月活跃用户超1600万。未来,爱诗科技将继续助力全球创作者跨越技术鸿沟,共同开启AIGC驱动的数字内容新纪元。

  • 传音TECNO CAMON 50新机登场,火山引擎助力AI影像与创作体验升级

    在2026年MWC大会上,传音旗下品牌TECNO发布了CAMON 50系列新机,其AI助手Ella整合了火山引擎的AIGC技术,为全球不同肤色、语种用户提供原生、稳定且更具创造力的影像与创作体验。Ella接入豆包图像创作模型,针对多肤色、多语言和文化审美进行优化,推出图像风格化、文字涂鸦及动态壁纸等功能,满足个性化需求。传音与火山引擎合作,在人像处理、多语言理解等方面专项优化,确保影像真实自然。通过火山引擎的海外云基础设施,为全球用户提供稳定可靠的AI服务。

  • 开箱即用!字节火山引擎正式上线ArkClaw:打开网页即可养虾

    字节跳动旗下火山引擎今日上线AI助手ArkClaw,作为开箱即用的云SaaS版OpenClaw。该产品无需复杂配置,打开网页即可使用,提供724小时在线服务,旨在解决本地部署环境复杂、配置繁琐、Token消耗高、进程易中断等痛点。ArkClaw深度协同豆包Seed-2.0系列模型,兼容Kimi、MiniMax、GLM等主流大模型,支持多种即时通讯APP,并适配飞书官方插件,可轻松处理日程安排、文档表格等任务。

  • 别让AI毁了四大名著 微信8000余条AI魔改视频下架

    谁能想到,在AI魔改下,关羽竟然能端起狙击枪,林黛玉也能倒拔垂杨柳。这些看起来有些抽象”甚至滑稽的画面,如今终于被清理了。 微信对此重拳出击,2026年以来已累计处置超8000条AI魔改违规视频,其中1月处置4376条,2月再处置3956条,坚决遏制经典内容被恶意篡改的乱象。 这些违规AI魔改内容乱象百出,不少创作者对《三国演义

  • 1.4万个账号栽了!抖音严查AI生成低俗擦边内容

    抖音近期严打AI生成色情低俗内容,已处置4.2万条违规内容,对1.4万个账号采取限制推荐、禁言、封禁等处罚。部分用户利用AI技术生成低俗擦边内容,甚至通过塑造特定人设、发布性感视频并搭配性暗示文案,诱导用户跳转至第三方平台下载色情应用。其中一黑产团伙4人已被刑事拘留。平台还发现部分账号将AI生成的美女图片设为直播间封面,引导观众查看主页收藏进而为色情网站导流,已对339个账号无限期回收直播权限。抖音表示此类行为已涉嫌违法,平台会主动将线索上报公安机关,并将持续升级治理技术,提升对AI生成不良内容的识别处置能力。

  • 从视频孪生到空间语义——关于“看见”与“懂得”的技术哲学

    文章探讨了从视频孪生到空间语义的技术演进。传统视频监控依赖人工观察,而空间语义技术通过视空映射将2D视频像素与3D GIS坐标融合,使AI能理解场景中物体的精确位置、速度和轨迹。结合3D高斯泼溅(3DGS)技术,系统可自动为物体注入语义信息,实现跨维度理解。这不仅是功能升级,更是哲学跃迁——数字世界正从被动的“镜像空间”进化为主动的“认知主体”,最终目标是构建能真正理解物理世界的空间语义大模型。

  • 即梦客服回应Seedance 2.0生成视频排队:节后使用人数多

    字节跳动旗下APP“即梦”因支持AI视频生成模型Seedance2.0迅速走红,但用户量激增导致视频生成延迟、卡顿、排队时间长及AI人脸素材审核失败等问题。用户反馈网页版生成10秒内视频也需长时间等待,普通会员称连续两天排队超6小时,系统显示等待人数达上万人。客服解释模型因春节后用户暴增处于“火爆状态”,视频生成消耗大量算力资源,导致排队时间长、生成速度慢,后续将持续优化模型性能。针对素材审核问题,客服提醒用户上传图片或文字关键词若涉及版权风险可能被驳回,需调整描述或更换图片后重新提交。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • 和别人用一样的“提示词”生成相同的AI作品 算不算侵权?法院判了

    上海黄浦区法院近日审理一起AI生成图片著作权纠纷案。原告公司使用AI生成艺术图片后,发现他人用相同提示词生成相似画作并收录于艺术图鉴,遂以侵犯著作权为由起诉。法院审理认为,提示词虽反映创作意图,但仅为词汇拼接,未体现作者个性化智力投入,不构成著作权法意义上的“作品”,因此原告对提示词不享有著作权,无权主张侵权。判决驳回原告诉讼请求。

  • 爆:海尔空调将发布AI之眼2.0,吹风能因人而异?

    文章探讨了家庭空调使用中的个性化舒适难题:同一屋檐下,老人、孩子和年轻人对温度需求各异,传统空调难以满足所有人。目前智能空调虽能感知人体,却无法在多人场景下提供差异化送风。行业正寻求突破,海尔智家将在2026年AWE发布AI之眼2.0技术,构建全维感知能力,实现精准人体定位和差异化送风。未来空调或能通过识别与学习,记忆家庭成员偏好,提供开机即匹配的专属方案,让定制化舒适成为可能,推动从产品制造向以用户为中心的服务型生态转型。

今日大家都在搜的词: