首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型

2025-12-04 16:22 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、快手可灵2.6全量上线!“音画同出”,画面、自然语音、匹配音效、环境氛围

快手旗下的可灵AI推出了其首个“音画同出”模型——可灵2.6,该模型能够在一次生成过程中同时产生画面、自然语音、音效和环境氛围,提升了用户的创作体验。它提供了“文生音画”和“图生音画”两种创作路径,适用于多种内容形式,包括单人独白、旁白解说、多人对白和音乐表演等。

image.png

【AiBase提要:】

🎨 可灵2.6模型实现音画同步生成,提升用户创作体验。

🖋️ 提供 “文生音画” 和 “图生音画” 两条创作路径,方便多种内容形式。

🎤 广泛适用于独白、旁白、对话和音乐表演等多种场景。

2、字节炸场!Seedream4.5发布,图像生成进入“多图一致性”时代

字节跳动旗下Seed团队上线Seedream4.5,主打多图场景一致性和美学指令遵循,解决了图像生成中的痛点问题,提升了图像生成的质量和实用性。

image.png

【AiBase提要:】

🧠 多图场景一致性提升,角色、服饰、光影、构图高度统一。

🎨 美学指令遵循大幅提升,精准命中风格关键词。

⚙️ 硬刚Flux、Midjourney v6.1,细节控的福音。

3、豆包手机助手紧急下线微信操作功能:回应账号封禁与“高危权限”争议

豆包手机助手针对用户反映的微信使用异常及高危权限争议发布声明,承认问题并澄清权限获取情况,同时下线微信操作功能并承诺保护用户隐私。

【AiBase提要:】

📱 豆包手机助手承认特定问题并回应用户反馈

🔒 强调用户授权和隐私保护的承诺

🚫 下线微信操作功能并逐步解封被禁账号

4、智源研究院推出全球最强多模态世界模型Emu3.5一键预测真实世界“下一秒”!

北京智源人工智能研究院推出的Emu3.5多模态大模型,通过统一编码图像、文本和视频为Token序列,实现了对真实世界的深刻理解。其核心突破在于预测“世界下一秒”的状态,从“像素搬运工”进化到“世界模拟器”,标志着多模态大模型从“生成时代”迈向“世界模型时代”。

image.png

【AiBase提要:】

🧠 Emu3.5通过统一编码图像、文本和视频为Token序列,实现跨模态的因果关系和物理常识学习。

🔄 模型专注于预测“世界下一秒”的状态,从“像素搬运工”进化到“世界模拟器”。

🚀 该模型标志着多模态大模型从“生成时代”迈向“世界模型时代”,具备广泛的应用潜力。

详情链接:https://zh.emu.world/pages/web/landingPage

5、AI模型发现智能合约漏洞,模拟攻击损失高达460万美元

一项由 MATS 和 Anthropic 进行的新研究揭示了先进人工智能模型在智能合约安全领域的双重角色。这些模型不仅能够发现并利用漏洞,还能为开发更强大的防御工具提供帮助。

image.png

【AiBase提要:】

🔍 研究显示,先进 AI 模型如 Claude Opus4.5和 GPT-5能够识别并利用智能合约漏洞。

💸 模拟攻击损失高达460万美元,AI 模型也在实验中发现了新的安全漏洞。

🔒 AI 不仅是潜在风险源,也可用于加强网络安全防护措施。

6、小米 AI 路线图首次曝光:卢伟冰确认押注“AI + 物理世界”,千万年薪罗福莉领衔 MiMo 大模型

小米集团总裁卢伟冰在直播中首次透露了集团的AI战略方向,强调将大模型与物理场景深度融合,目标是将AI能力嵌入到硬件和服 务中。罗福莉已正式加入MiMo大模型团队,成为小米AI人才布局的关键一环。小米计划在2025年发布参数规模超千亿的多模态模型,并同步落地于手机、汽车及智能家居三大场景。

【AiBase提要:】

🧠 小米集团总裁卢伟冰在直播中首次透露AI战略方向,强调大模型与物理场景深度融合。

💼 罗福莉加入MiMo大模型团队,成为小米AI人才布局的关键一环。

🚀 小米计划在2025年发布参数规模超千亿的多模态模型,并同步落地于手机、汽车及智能家居三大场景。

7、谷歌发布Workspace Studio:AI代理构建工具全面上线

谷歌发布Workspace Studio,一款零代码AI代理构建工具,让企业员工能快速创建自动化流程,提高工作效率。

image.png

【AiBase提要:】

🤖 无需编程即可创建AI代理,实现自动化任务处理。

🌐 支持多应用协作和第三方集成,打通信息孤岛。

🧠 基于Gemini3的智能决策能力,提升企业效率。

8、DeepSeek连发两款重磅新模型,正式版V3.2与Speciale同步上线

DeepSeek连发两款重磅新模型,正式版V3.2与Speciale同步上线,展示了其在开源大模型领域的强大实力和创新能力。

【AiBase提要:】

🧠 DeepSeek-V3.2首次将“思考过程”与“工具调用”深度融合,支持两种模式并行。

🧠 Speciale版本是“把思考开到最大”的加强版,推理能力推向物理极限。

🚀 全平台秒级更新,用户零感知无缝切换,体验全新能力。

举报

  • 相关推荐
  • AI日报:阅文、中文在线推AI全栈工具;陌陌甜甜圈上线;OpenAI收购医疗初创公司Torch

    本期AI日报聚焦行业热点:OpenAI以约1亿美元收购医疗初创公司Torch,深化智能健康布局;Google Nano Banana Pro模型两月生成百亿图片,展现强大创意控制力;陌陌上线“甜甜圈”AI恋爱应用,瞄准Z世代情感陪伴需求;AI短剧工具井喷,阅文、中文在线等平台推动行业变革;Anthropic推出医疗合规AI助手Claude,赋能医患双方;谷歌Android XR眼镜应用曝光,支持3K视频与Gemini端侧对话;Adobe Firefly集成GPT-Image 1.5,开启不限量生成模式;Anthropic推出Cowork工具,降低AI代理使用门槛,让非技术用户也能高效处理复杂任务。

  • AI日报:DeepSeek V4或于2月发布;Midjourney Niji 7发布;AI聊天App涉黄案二审在即

    本期AI日报聚焦多领域进展:DeepSeek V4或春节发布,主打AI编程能力;Midjourney推出Niji 7模型,显著提升动漫风格生成质量;Mugen3D实现单图生成高保真3D模型;Lightricks开源视频模型LTX-2,支持20秒音视频一体化合成。同时,抖音科技内容年观看量达1.4万亿次,成为科普新渠道;国内首例AI聊天App涉黄案二审在即,凸显合规重要性;谷歌AI健康搜索因误导性内容遭质疑并下线部分功能;此外,谷歌联合零售巨头推出UCP协议,旨在通过AI代理实现全链路无缝购物体验。

  • AI日报:微软宣布Win11原生支持MCP协议;联想亮出AI眼镜概念机

    本期AI日报涵盖多项重要动态:微软Win11原生支持MCP协议,推动AI深度融合;抖音第二总部落户深圳南山,同步建设AI研究项目;联想在CES 2026展示轻量化AI眼镜,瞄准生产力场景;Liquid AI发布面向边缘设备的小型模型LFM2.5;Anthropic推出支持多会话并行的Claude Code桌面预览版,提升编程效率;高德上线自研“飞行街景”模型,实现高保真实景导航;惠普推出全球首款键盘式AI PC,重新定义办公设备;Google Gemini新增“引导式学习”功能,革新个性化教育;直播电商迎来新规,明确AI主播违规责任;开源视频生成模型LTX-2发布,可一次生成20秒4K音画同步视频。

  • AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

    本期AI日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架UltraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能阉割”传闻,提醒用户勿通过第三方强行激活。

  • AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

    本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。

  • AI日报:腾讯开源3D动作神器混元Motion1.0;罗永浩发布AI讲书App“且听”;夸克AI眼镜首次OTA

    本期AI日报聚焦多领域动态:腾讯开源10亿参数文生3D动作模型,赋能游戏影视;罗永浩发布AI讲书App“且听”,年费不足40元;京东上线自营租赁业务,推动机器人技术普及;夸克AI眼镜首次OTA升级,新增图文备忘等功能;MiniMax启动港股IPO,拟募资约41.9亿港元;阿里通义实验室推出多模态智能代理MAI-UI,性能超越同行;百度文心AI发布年度提示词“工作”,反映社会关注;2026年“两新”政策新增智能眼镜等产品补贴,加速AI终端落地。

  • AI日报:百度推百科AI知识图谱新功能;字节否认豆包AI眼镜即将上市;MiniMax 港股 IPO 收官

    本文汇总了AI领域的最新动态:百度百科推出“动态百科”和“AI知识图谱”提升用户体验;字节跳动否认豆包AI眼镜上市传闻;亚马逊上线Alexa.com网页端入口,拓展智能助手使用场景;MiniMax港股IPO获超额认购,表现亮眼;波士顿动力与谷歌DeepMind合作,将Gemini模型集成于新一代Atlas机器人;微软收购AI数据平台Osmos,强化数据处理能力;Falcon H1R 7B开源大模型以卓越推理性能引领新潮;英伟达开源自动驾驶模型,推动物理AI新时代。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • AI说错了你的产品信息?GEO品牌监控可实时预警错误描述

    文章指出,AI工具(如ChatGPT)在回答用户关于产品推荐等问题时,常基于过时或错误的数据,导致产品信息不准确,如价格错误、功能描述过时等,且企业往往对此不知情。这直接影响潜在客户的决策。为此,GEO品牌监控工具应运而生,它能实时监测品牌在多个国产AI平台回答中的表现,核心功能包括:曝光分析、错误信息预警和竞品对比。随着用户越来越依赖AI直接获取答案而非传统搜索,确保AI准确推荐和描述自身产品已成为品牌在AI时代的必修课。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

今日大家都在搜的词: