11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦行业动态:腾讯推出首个产业级2Bit端侧模型,实现小体积高性能,适用于手机等隐私敏感场景;蚂蚁阿福成为央视健康生活合作伙伴,单日健康咨询达千万次;ChatGPT免费版将引入广告,OpenAI明确隐私保护规则;字节Seedance2.0因肖像争议暂停真人参考功能;华为发布全球首个虚实融合视频模型,实现毫秒级实时交互;Cursor发布Composer1.5,性能提升显著;阿里云推出Qwen-Image-2.0,图像生成与编辑能力合一;亚马逊入局内容授权市场,微软争夺高质量数据资源。
本期AI日报聚焦多领域AI新动态:腾讯发布混元图像3.0,实现语义驱动的精准修图;开源AI助手Clawdbot单日获9000星,具备物理级执行力;京东购物智能体JoyGlance登陆Rokid眼镜,简化购物流程;苹果Siri将整合谷歌Gemini核心,预计2月发布;腾讯“元宝派”开启内测,探索AI深度融入社交场景;百度文心助手推出5亿现金红包活动,结合春节习俗;中国团队SeaArt用户破5000万,实现创意到变现闭环;上海交大发布光学垂直大模型Optics GPT,重塑光学研发模式。
腾讯混元图像3.0图生图模型正式发布,支持图片编辑与多图融合功能,已在元宝同步上线。该模型基于混元图像3.0原生多模态架构,采用混合专家(MoE)架构,总参数量达800亿。通过指令微调和后训练,模型能深度理解并处理用户输入的图像和编辑指令,生成图片一致性强、真实感佳、情绪表现力好,且速度显著提升。功能上支持增删改、风格变换、老照片修复、人物与文字修改等多种编辑能力,并能实现多图融合,适用于表情包制作、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制及创意图片制作等多样化操作。
阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。
本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。
腾讯混元宣布开源其翻译模型1.5版本,包含1.8B和7B两个模型。该版本支持33种语言互译,涵盖5种方言,包括多种小语种,应用范围广泛。1.8B模型针对移动设备优化,仅需1GB内存即可流畅运行,端侧部署实现离线实时翻译,性能超越多数商用API。7B模型为WMT25比赛冠军模型的升级版,翻译准确率显著提升,实用性增强。两模型可协同部署,提升效果一致性与稳定性。目前模型已在官网及GitHub、Huggingface等平台上线,为开发者提供便利。
昇思MindSpore开源社区将于2025年12月25日在杭州举办昇思人工智能框架峰会。届时,MindSpore Lite团队将分享基于MindSpore Lite的端侧AI推理优化技术实践,重点介绍CPU混合精度推理方案在鸿蒙翻译模型部署中的应用。该方案通过混合精度子图调度、IO免拷贝等关键技术,将鸿蒙内置翻译模型的推理内存优化至66MB,相比原始100MB以上显著降低,支持模型在鸿蒙6.0上线部署。文章还详细阐述了MindSpore Lite的模型转换流程、推理API及性能验证方法,展示了其在降低内存、提升性能方面的优势,为开源模型的商用部署提供技术保障。
本期AI日报聚焦多领域AI新进展:OpenAI推出图像生成模型GPT Image 1.5,性能显著提升;腾讯发布混元世界模型1.5,开启实时交互虚拟世界;小米开源3090亿参数大模型MiMo-V2-Flash,推理速度领先;字节跳动发布Seedance 1.5 Pro,实现视听同步创作;Apple Music将与ChatGPT集成,简化歌单创建;Gemini预测市场全美上线,支持事件预测交易;Adobe Firefly视频功能升级,支持精准提示编辑;谷歌实验室推出AI助手CC,集成Gemini技术管理日程。
今日,腾讯混元宣布,腾讯混元世界模型1.5正式发布,只需输入文字描述或者图片即可创建专属的互动世界。 通过键盘、鼠标或手柄,即可实时控制虚拟相机的移动和转向,让用户可以像玩游戏一样自由探索AI生成的世界。
本期AI日报聚焦多项技术突破:FLUX.1开源图像模型支持多图参考与4MP编辑;腾讯混元3D引擎国际站上线,简化海外用户创作流程;字节跳动TRAE SOLO模式实现端到端自动化开发;百度新设两大模型研发部门强化AI布局;ChatGPT升级语音交互功能;亚马逊推广自研编程工具Kiro;Character.AI推出互动小说功能并加强未成年人保护;华纳音乐与Suno达成授权协议,推动AI音乐进入付费可控新时代。