首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:FLUX.2开源发布;腾讯混元3D创作引擎上线国际站;百度新设立两个大模型研发部门

2025-11-26 15:55 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、开发者版Stable Diffusion!FLUX. 2 开源发布: 10 图参考+4MP编辑

Black Forest Labs正式发布了FLUX.2系列模型,包括pro、flex、dev和klein版本,其中dev版本开源了32B参数的权重与代码。该模型支持多图参考、4MP编辑、文本渲染和现实逻辑等核心升级,为开发者提供了强大的工具。

image.png

【AiBase提要:】

🔥 FLUX.2系列模型支持最多10张风格/构图样例,生成一致性超过95%。

🖼️ 提供4MP分辨率编辑功能,支持局部重绘、去水印及换背景。

🚀 开发者友好,提供PyTorch、Diffusers和ComfyUI插件,以及在线Demo体验。

2、腾讯混元3D创作引擎上线国际站

腾讯正式上线了混元3D创作引擎国际站,为海外用户提供便捷的3D创作体验。用户无需下载复杂工具或配置环境,只需注册登录即可通过文字、图片或草图生成3D作品,同时支持开发者集成3D模型生成能力。

image.png

【AiBase提要:】

🚀 腾讯推出混元3D创作引擎国际站,简化3D创作流程。

🎨 用户可通过文字、图片或草图轻松生成3D作品。

🛠️ 开发者可使用API集成3D模型生成能力,推动创意产业发展。

3、字节跳动 TRAE SOLO 模式中国版正式上线,免费开放助力全流程高效开发

字节跳动 TRAE 的 SOLO 模式在中国版正式上线,标志着其从传统代码生成工具向软件交付深度转型,为开发者提供高度自动化的端到端开发体验。

image.png

【AiBase提要:】

🧠 SOLO 模式基于“上下文工程”理念,实现从需求输入到部署上线的端到端闭环交付。

💻 SOLO Coder 智能体支持复杂任务优化,如功能迭代、代码重构和 Bug 修复。

🌐 自然语言驱动部署,AI 可自主完成需求分析、项目初始化、编码实现、测试验证和一键部署。

4、百度新设立两个大模型研发部门,全力推进大模型技术

百度近日宣布设立两个新的大模型研发部门,旨在加强其在人工智能领域的技术实力。基础模型研发部将专注于开发高智能、可扩展的通用人工智能大模型,由吴甜负责;而应用模型研发部则将着眼于业务应用场景所需的专精模型调优与探索,由贾磊领导。这两个部门均直接向百度的首席执行官李彦宏汇报,表明了公司对大模型研发的高度重视。

【AiBase提要:】

🌟 百度新设两个大模型研发部门,直接向 CEO 汇报。

🧑‍💻 吴甜和贾磊分别负责基础模型和应用模型的研发。

🚀 百度文心大模型 5.0 已于 11 月正式发布,展示全模态理解与生成能力。

5、OpenAI ChatGPT 升级:语音与文本无缝结合,实现多模态互动

OpenAI 的 ChatGPT 升级后,将语音模式整合进主聊天界面,实现了语音与文本的无缝互动。用户在进行语音对话时,可以实时查看相关的视觉信息,并且系统会自动生成文字转录稿。此外,更新还提供了切换功能,让用户可以根据自己的需求选择传统的独立语音模式。

【AiBase提要:】

🎙️ 用户可在主界面实现语音与文本的无缝互动。

🖼️ 语音提问时,系统可实时展示相关的视觉信息,如地图和图片。

🔄 更新提供切换功能,用户可根据需求选择传统的独立语音模式。

6、Amazon 优先推广自研 AI 编程工具 Kiro,限制第三方应用使用

Amazon 在内部备忘录中建议工程师优先使用自研 AI 工具 Kiro,而非第三方服务。此举表明 Amazon 正在加强自身技术的建设,并计划减少对外部 AI 开发服务的支持。

image.png

【AiBase提要:】

💻 Amazon 强调工程师应优先使用自研 AI 编程工具 Kiro。

🚫 将限制对第三方 AI 开发服务的支持,包括知名的 OpenAI 和 Anthropic 工具。

📢 员工被鼓励在使用 Kiro 时反馈,以便持续优化该工具。

7、Character.AI上线“Stories”互动小说:未成年用户全面禁聊,AI角色转向“剧本杀”模式

Character.AI推出新功能Stories,允许用户创作多分支互动小说,同时禁止18岁以下用户进行开放式对话。该功能旨在提升安全性,并通过审核机制避免敏感内容传播。

image.png

【AiBase提要:】

🎮 Character.AI推出Stories功能,用户可创作互动小说,替代开放式聊天。

🔒 平台全面禁止18岁以下用户与AI角色进行开放式对话,确保安全优先。

📚 未来计划引入语音和视频片段,探索教育IP合作,吸引年轻用户。

8、一周内和解两家!WMG与Suno达成授权协议,AI音乐进入“付费下载+可控声纹”时代

Warner Music Group(WMG)与AI音乐平台Suno达成版权和解,并推出新的授权协议和商业模式,标志着AI音乐行业进入“付费下载+可控声纹”的新时代。

【AiBase提要:】

🎧 授权协议:Suno将推出“进阶授权模型”,艺术家可自主控制姓名、肖像、声音和作品。

💰 商业模式变化:音频下载需付费账户,免费用户仅能播放与分享链接;系统内置“声纹指纹+水印”以拦截AI翻唱。

📈 行业连锁反应:WMG一周内与两家公司达成和解,Suno估值达24.5亿美元,资本信心增强。

举报

  • 相关推荐
  • 第五届AIGC开发者大会圆满落幕:Vibe Coding创作者经济正式来临

    1月17日,第五届AIGC开发者大会(ACDC2026)在北京圆满落幕。大会正式提出2026年将成为“Vibe Coding创作者经济”元年,标志着以自然语言、低代码为核心的内容生产新范式已到来,预计将开启万亿级市场。大会还发布了AIGCLINK开发者基金、芯片适配联盟等一系列覆盖资金、算力的实质性举措,系统性破解产业规模化落地瓶颈。大会的成功举办,表明我国AIGC产业的发展重点已全面转向生态构建与价值实现,正式开启以Vibe Coding为代表的全新阶段。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 让开发者无惧创新!观测云 x 华为云开发者年度会议收官

    2025年华为开发者大赛暨开发者年度会议在上海举行,华为云CEO周跃峰提出联合开发者打造行业AI“梦工厂”。观云云作为可观测性基础设施,致力于为开发者提供稳定、高性能的系统支持,构建全链路数据观测体系。大赛中,观云云赛道成为检验开发者实战能力的试金石,线上线下选手展示了技术实力与极客精神。华为云与观云云生态紧密融合,共同为开发者创新梦想提供支持。观云云推出开箱即用免费版,让每位开发者的智慧都能扎根生长,用可观测性点亮代码迷雾。

  • AI日报:腾讯开源3D动作神器混元Motion1.0;罗永浩发布AI讲书App“且听”;夸克AI眼镜首次OTA

    本期AI日报聚焦多领域动态:腾讯开源10亿参数文生3D动作模型,赋能游戏影视;罗永浩发布AI讲书App“且听”,年费不足40元;京东上线自营租赁业务,推动机器人技术普及;夸克AI眼镜首次OTA升级,新增图文备忘等功能;MiniMax启动港股IPO,拟募资约41.9亿港元;阿里通义实验室推出多模态智能代理MAI-UI,性能超越同行;百度文心AI发布年度提示词“工作”,反映社会关注;2026年“两新”政策新增智能眼镜等产品补贴,加速AI终端落地。

  • AI日报:蚂蚁百灵发布 Ling Studio;飞书联手安克创新推AI录音豆;ChatGPT 官宣引入广告

    本文汇总了AI领域的最新动态:蚂蚁百灵推出Ling Studio平台,提供每日50万免费Token及多模型切换;飞书与安克创新合作发布AI录音豆,实现实时字幕与会议纪要生成;ChatGPT将引入广告,免费版用户优先体验;谷歌扩大AI视频工具Flow访问权限,支持竖屏与8秒4K生成;英伟达发布PersonaPlex-7B-v1模型,重塑实时语音交互;国内首款AI原生游戏《超自然行动组》上线,玩家可与AI共演剧情;OpenAI正测试网页版重大升级,代号Salute;同时推出平价订阅计划ChatGPT Go,每月8美元即可畅享高级AI功能。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

    本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。

  • AI日报:清华开源TurboDiffusion视频增速100倍;腾讯推ETC首款AI智能体;X平台推出AI图片编辑器

    本期AI日报聚焦多项技术突破与应用创新。清华开源TurboDiffusion框架,将AI视频生成速度提升200倍,消费级显卡也能秒出大片。腾讯混元推出ETC领域首款AI智能体,通过多模态交互提升出行体验。阿里通义千问发布新一代图像编辑模型Qwen-Image-Edit-2511,大幅提升人物一致性编辑能力。京东物流在英国启用首个“智羚仓”,近200台自研机器人提升分拣效率。1min.AI推出终身全能计划,

  • AI日报:Meta宣布收购Manus;腾讯混元发布1.5版开源翻译模型;OpenAI更新手机版ChatGPT

    本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。

  • 声网在CES 2026期间宣布开源 AOSL,构建AI硬件开放新生态

    在2026年CES期间,声网宣布将其核心硬件抽象层项目AOSL在GitHub全面开源。AOSL通过定义操作系统、芯片与传输层之间的通用接口,有效屏蔽底层差异,降低AI在硬件端落地的创新门槛,加速硬件创新生态。芯片厂商和开发者可便捷集成Voice AI等能力,推动产品化进程,从一次性定制走向可复用、可扩展的生态协作。项目同步开源了经过验证的参考实现及自动化测试用例,为生态协作提供坚实技术基准。声网期待与开发者、芯片厂商及生态伙伴共同推动AOSL标准的建设与演进,使其逐步成长为AI时代连接硬件与智能应用的基础设施。

今日大家都在搜的词: