11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多领域AI新动态:腾讯混元图像3.0开源,成为全球最强开源图生图模型;月之暗面发布Kimi Code,推动国产AI编程工具进入新阶段;开源项目Clawdbot因商标风险更名Moltbot,并遭诈骗者利用旧账号发布虚假代币;谷歌AI Plus计划正式扩展至美国等35个市场,月费不足8美元;OpenAI发布基于GPT-5.2的科研协作平台Prism;谷歌Aluminum OS界面首曝,深度融合Android与ChromeOS;Mistral AI发布终端编程助手Vibe 2.0,步入“子代理”时代;小米AI眼镜深度集成支付宝,实现停车缴费与健康管理“无感交互”。
腾讯混元图像3.0图生图模型正式发布,支持图片编辑与多图融合功能,已在元宝同步上线。该模型基于混元图像3.0原生多模态架构,采用混合专家(MoE)架构,总参数量达800亿。通过指令微调和后训练,模型能深度理解并处理用户输入的图像和编辑指令,生成图片一致性强、真实感佳、情绪表现力好,且速度显著提升。功能上支持增删改、风格变换、老照片修复、人物与文字修改等多种编辑能力,并能实现多图融合,适用于表情包制作、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制及创意图片制作等多样化操作。
腾讯混元宣布开源其翻译模型1.5版本,包含1.8B和7B两个模型。该版本支持33种语言互译,涵盖5种方言,包括多种小语种,应用范围广泛。1.8B模型针对移动设备优化,仅需1GB内存即可流畅运行,端侧部署实现离线实时翻译,性能超越多数商用API。7B模型为WMT25比赛冠军模型的升级版,翻译准确率显著提升,实用性增强。两模型可协同部署,提升效果一致性与稳定性。目前模型已在官网及GitHub、Huggingface等平台上线,为开发者提供便利。
本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。
今日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5,这是一款基于Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。 该模型已经抢先在元宝”上线,普通用户可以直接体验,可通过两种方式:一是输入文字描述(Prompt),直接实现文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。 据介绍,Hunyuan
腾讯混元图像3.0模型发布仅一周,即在全球26个顶尖大模型中脱颖而出,登顶LMArena权威榜单首位,成为AI生图领域新王者。其成功得益于三大核心优势:能运用知识推理生成有逻辑内涵的图像;精准实现中英文长文本及细节标注的渲染;兼具真实质感与审美把控。作为开源模型,混元系列已构建覆盖多模态的技术生态,社区衍生模型超3000个,其中混元3D模型下载量超260万次,是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。
AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。
腾讯混元翻译模型Hunyuan-MT-7B登顶Hugging Face趋势榜首位,并在ACL WMT2025比赛中以30项第一的成绩领先。该模型支持33种语言,包括5种汉语言方言互译,在Flores200评测中表现卓越,超越同尺寸模型,与超大模型效果相当。腾讯提出完整训练范式,覆盖预训练到强化学习全链条,实现业界最优翻译效果。
今日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。 该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位,超越现有开源方法,在视频生成和3D重建任务中均表现出色。 在视频生成和视频3D重建两个任务上,Voyager也均取得更好的结果。
本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和