AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

2025-09-10 15:50 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、腾讯升级混元生图模型混元Image 2.1，支持写字、2k分辨率

腾讯混元发布了最新生图模型‘混元图像2.1（HunyuanImage2.1）’，支持原生2K分辨率图像生成，具备强大的复杂语义理解和跨领域泛化能力，同时支持中英文输入和高质量文本生成。该模型已在Hugging Face和GitHub上开源，为视觉创作者提供了更高效的创作工具，并为未来多模态图像生成模型的研发奠定了基础。

【AiBase提要:】
🌟 支持原生2K分辨率，提升图像生成质量与效率。
🖌️ 具备强大的复杂语义理解能力，支持高质量的文本生成。
🔧 开源模型已上线，开发者可基于其进行研究与开发。
详情链接:https://hunyuan.tencent.com/image

2、爱诗科技获 6000 万美元 B 轮融资，阿里巴巴领投

爱诗科技在AI视频生成领域取得了显著进展，不仅完成了大规模融资，还推出了领先的技术产品，并计划通过开放平台推动技术普及。

【AiBase提要:】
🌟 爱诗科技完成6000万美元 B 轮融资，阿里巴巴领投，创下国内视频生成领域最大融资记录。
🎥 自研视频生成大模型 PixVerse V5 在图生视频领域排名第一，用户规模突破1亿。
🌐 公司计划推出开放平台 API，推动视频生成技术的规模化应用，助力更多用户参与创作。

3、Freepik 上线豆包 Seedream 4.0 图像模型，premium+会员可无限使用图片

Freepik正式上线了全新的豆包Seedream4.0图像模型，引起了设计师和创作者的广泛关注。该模型在技术上进行了显著提升，支持生成2K和4K高分辨率图像，并提供多种纵横比选择，满足不同设计需求。同时，Premium+和Pro会员可享受无限图像生成特权，进一步提升了用户体验。此外，火山引擎也推出了Seedream4.0的API，为大规模图像处理提供了便利。

【AiBase提要:】
🌟 Seedream4.0支持生成2K和4K高分辨率图像，提升创作质量。
💼 Premium+和Pro会员享受无限图像生成特权，增强使用体验。
📈 火山引擎上线Seedream4.0 API，便于大规模图像处理。

4、800亿参数只用30亿！阿里千问3新模型推理速度暴增10倍

阿里巴巴通义千问团队推出的Qwen3-Next-80B-A3B-Instruct模型，通过创新的MoE专家混合架构实现了高效率与高性能的结合。该模型在保持强大功能的同时，显著降低了计算成本和资源消耗，为AI开发者提供了前所未有的便利。

【AiBase提要:】
🧠 采用MoE专家混合架构，实现高效推理与低资源消耗。
⚡ 推理速度提升至Qwen3-32B的10倍以上，处理长上下文更高效。
💰 训练成本大幅下降，推动更多机构参与大模型开发。

5、微软启动AI供应商多元化策略，将在Office 365中集成Anthropic技术

微软开始在Office 365中引入Anthropic的AI技术，标志着其与OpenAI合作关系的调整。这一举措反映了微软对AI供应链多样化的重视，并可能影响整个AI行业的合作模式。

【AiBase提要:】
🧠 微软将Anthropic的AI技术整合到Office 365中，以增强功能表现。
🤝 微软与Anthropic的合作是基于技术性能考量，而非谈判策略。
🚀 微软正推进AI技术的自主研发，减少对外部供应商的依赖。

6、首款 AI Agent浏览器 Fellou CE发布，打造“无缝衔接”的体验

Fellou CE 是一款能够执行复杂任务的自主 AI 浏览器，旨在提升用户工作效率。它通过自然对话和无缝体验，帮助用户简化工作流程，增强创造力。同时，Fellou 正致力于构建一个开放的智能生态系统，以持续改进用户体验和保障隐私。

【AiBase提要:】
🧠 Fellou CE 是一款 AI 浏览器，能够执行复杂任务，提高用户的工作效率。
🌐 它通过自然语言交互和无缝体验，简化了用户的工作流程。
🔒 Fellou 致力于构建开放的智能生态系统，保障用户的隐私与数据安全。
详情链接:https://fellou.ai/

7、清华团队开源 GUAVA：0.1秒一张照片秒变 3D 数字人

清华团队开源 GUAVA：0.1秒一张照片秒变 3D 数字人，该技术通过创新的EHM模型和3D高斯泼溅技术，实现了快速且高质量的3D数字人生成，具有广泛的应用前景。

【AiBase提要:】
🚀 GUAVA 技术能在0.1秒内通过一张照片生成3D 数字人，速度惊人。
🎨 其核心技术 EHM 模型和3D 高斯泼溅确保了高质量的表情还原和快速渲染。
💡 GUAVA 广泛应用于自媒体、直播、电商和教育等多个领域，提升效率与用户体验。
详情链接:https://github.com/Pixel-Talk/GUAVA https://eastbeanzhang.github.io/GUAVA/

8、Claude升级:一键生成Excel、PPT、PDF，办公文件秒变“现成品”

Claude助手新增了直接生成和编辑多种办公文件的功能，提升了用户的工作效率。该功能已向部分用户开放预览，并将在未来扩展至更多用户。

【AiBase提要:】
📊 Claude支持生成和编辑Excel、Word、PPT和PDF文件，实现快速成果转化。
⚡ 功能面向Max、Team和Enterprise版本用户提供预览，Pro用户将陆续获得权限。
🤝 Claude作为数字合作者，能执行代码并处理文件，提升项目协作能力。

（举报）

相关推荐

关键词：

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

本期AI日报聚焦多项技术突破：阿里千问APP公测，基于Qwen3模型对标ChatGPT；谷歌Veo 3.1支持三图融合生成8秒视频；小米推出"随心修图"功能与7B多模态模型Miloco；谷歌Flow集成Nano Banana模型实现智能抠图；多模态AI工具DeepEyesV2可执行代码与网络搜索；NotebookLM升级支持图像导入检索；JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温，产品迭代加速。

AI 阿里巴巴千问APP
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
小米超级小爱AI大模型推出随心修图功能

小米宣布超级小爱AI大模型推出随心修图功能，用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式：在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求：超级小爱需v7.8.50及以上，相册编辑功能需v2.1及以上，相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级，支持全局多模态交互和自然语音搜索，提升使用体验。

小米超级小爱 AI大模型
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

本期AI日报涵盖八大热点：Lovart AI推出"元素拆分"功能，实现海报智能分层编辑；苹果Xcode 26.1.1优化AI编码性能；阿里云通义模型双11单日翻译调用量突破14亿次；Gemini 3在历史手稿破译中展现专家级能力；德国法院裁定OpenAI使用歌词训练构成侵权；开源语音模型Maya1实现富有表现力的实时文本转语音；Meta首席AI科学家LeCun计划离职创办世界模型公司；AI专家罗福莉加入小米，将致力于构建物理世界智能。

AI设计元素拆分海报编辑
12岁小孩做一张AI图吓坏整个小区：称出于好奇和恶作剧心理

近日，广州番禺一大型小区内发生了一场由12岁孩童引发的“虚惊”。一名12岁的孩子利用AI技术制作了一张流浪汉试图闯入家门的图片，并在小区业主群中发布，瞬间引发了住户们的恐慌与热议。据发布图片的业主称，当时自己12岁的孩子独自在家，声称遭遇了流浪汉的闯入，并附上了这张由AI生成的“现场”图片。图片中，流浪汉的形象栩栩如生，场景逼真，令不少住户�

AI技术虚假图片小区安全

今日大家都在搜的词：

热文

3 天
7天

AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

小米超级小爱AI大模型推出随心修图功能

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

进博会“全勤生”三星的AI全景图：AI Home中国首秀

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

12岁小孩做一张AI图吓坏整个小区：称出于好奇和恶作剧心理

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

快手发布2025年第三季度财报：可灵AI营业收入超3亿元

参与开发iPhoneAir设计师离职转投AI初创公司

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机

AI日报：腾讯开源图像模型HunyuanImage2.1；​爱诗科技获6000万美元融资；​Freepik上线豆包Seedream4.0图像模型

今日大家都在搜的词：

热文

站长商机

AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型