首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:腾讯开源图像模型HunyuanImage2.1;​爱诗科技获6000万美元融资;​Freepik上线豆包Seedream4.0图像模型

2025-09-10 15:50 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、腾讯升级混元生图模型混元Image 2.1,支持写字、2k分辨率

腾讯混元发布了最新生图模型‘混元图像2.1(HunyuanImage2.1)’,支持原生2K分辨率图像生成,具备强大的复杂语义理解和跨领域泛化能力,同时支持中英文输入和高质量文本生成。该模型已在Hugging Face和GitHub上开源,为视觉创作者提供了更高效的创作工具,并为未来多模态图像生成模型的研发奠定了基础。

image.png

【AiBase提要:】

🌟 支持原生2K分辨率,提升图像生成质量与效率。

🖌️ 具备强大的复杂语义理解能力,支持高质量的文本生成。

🔧 开源模型已上线,开发者可基于其进行研究与开发。

详情链接:https://hunyuan.tencent.com/image

2、爱诗科技获 6000 万美元 B 轮融资,阿里巴巴领投

爱诗科技在AI视频生成领域取得了显著进展,不仅完成了大规模融资,还推出了领先的技术产品,并计划通过开放平台推动技术普及。

【AiBase提要:】

🌟 爱诗科技完成6000万美元 B 轮融资,阿里巴巴领投,创下国内视频生成领域最大融资记录。

🎥 自研视频生成大模型 PixVerse V5 在图生视频领域排名第一,用户规模突破1亿。

🌐 公司计划推出开放平台 API,推动视频生成技术的规模化应用,助力更多用户参与创作。

3、Freepik 上线豆包 Seedream 4.0 图像模型,premium+会员可无限使用图片

Freepik正式上线了全新的豆包Seedream4.0图像模型,引起了设计师和创作者的广泛关注。该模型在技术上进行了显著提升,支持生成2K和4K高分辨率图像,并提供多种纵横比选择,满足不同设计需求。同时,Premium+和Pro会员可享受无限图像生成特权,进一步提升了用户体验。此外,火山引擎也推出了Seedream4.0的API,为大规模图像处理提供了便利。

image.png

【AiBase提要:】

🌟 Seedream4.0支持生成2K和4K高分辨率图像,提升创作质量。

💼 Premium+和Pro会员享受无限图像生成特权,增强使用体验。

📈 火山引擎上线Seedream4.0 API,便于大规模图像处理。

4、800亿参数只用30亿!阿里千问3新模型推理速度暴增10倍

阿里巴巴通义千问团队推出的Qwen3-Next-80B-A3B-Instruct模型,通过创新的MoE专家混合架构实现了高效率与高性能的结合。该模型在保持强大功能的同时,显著降低了计算成本和资源消耗,为AI开发者提供了前所未有的便利。

222.jpg

【AiBase提要:】

🧠 采用MoE专家混合架构,实现高效推理与低资源消耗。

⚡ 推理速度提升至Qwen3-32B的10倍以上,处理长上下文更高效。

💰 训练成本大幅下降,推动更多机构参与大模型开发。

5、微软启动AI供应商多元化策略,将在Office 365中集成Anthropic技术

微软开始在Office 365中引入Anthropic的AI技术,标志着其与OpenAI合作关系的调整。这一举措反映了微软对AI供应链多样化的重视,并可能影响整个AI行业的合作模式。

【AiBase提要:】

🧠 微软将Anthropic的AI技术整合到Office 365中,以增强功能表现。

🤝 微软与Anthropic的合作是基于技术性能考量,而非谈判策略。

🚀 微软正推进AI技术的自主研发,减少对外部供应商的依赖。

6、首款 AI Agent浏览器 Fellou CE发布,打造“无缝衔接”的体验

Fellou CE 是一款能够执行复杂任务的自主 AI 浏览器,旨在提升用户工作效率。它通过自然对话和无缝体验,帮助用户简化工作流程,增强创造力。同时,Fellou 正致力于构建一个开放的智能生态系统,以持续改进用户体验和保障隐私。

image.png

【AiBase提要:】

🧠 Fellou CE 是一款 AI 浏览器,能够执行复杂任务,提高用户的工作效率。

🌐 它通过自然语言交互和无缝体验,简化了用户的工作流程。

🔒 Fellou 致力于构建开放的智能生态系统,保障用户的隐私与数据安全。

详情链接:https://fellou.ai/

7、清华团队开源 GUAVA:0.1秒一张照片秒变 3D 数字人

清华团队开源 GUAVA:0.1秒一张照片秒变 3D 数字人,该技术通过创新的EHM模型和3D高斯泼溅技术,实现了快速且高质量的3D数字人生成,具有广泛的应用前景。

image.png

【AiBase提要:】

🚀 GUAVA 技术能在0.1秒内通过一张照片生成3D 数字人,速度惊人。

🎨 其核心技术 EHM 模型和3D 高斯泼溅确保了高质量的表情还原和快速渲染。

💡 GUAVA 广泛应用于自媒体、直播、电商和教育等多个领域,提升效率与用户体验。

详情链接:https://github.com/Pixel-Talk/GUAVA https://eastbeanzhang.github.io/GUAVA/

8、Claude升级:一键生成Excel、PPT、PDF,办公文件秒变“现成品”

Claude助手新增了直接生成和编辑多种办公文件的功能,提升了用户的工作效率。该功能已向部分用户开放预览,并将在未来扩展至更多用户。

image.png

【AiBase提要:】

📊 Claude支持生成和编辑Excel、Word、PPT和PDF文件,实现快速成果转化。

⚡ 功能面向Max、Team和Enterprise版本用户提供预览,Pro用户将陆续获得权限。

🤝 Claude作为数字合作者,能执行代码并处理文件,提升项目协作能力。

举报

  • 相关推荐
  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • AI日报:谷歌Gemini 3 Pro Preview模型上线;Cloudflare文件异常致全球宕机;百度Q3 AI收入96亿元

    谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 12岁小孩做一张AI图吓坏整个小区:称出于好奇和恶作剧心理

    ​近日,广州番禺一大型小区内发生了一场由12岁孩童引发的“虚惊”。一名12岁的孩子利用AI技术制作了一张流浪汉试图闯入家门的图片,并在小区业主群中发布,瞬间引发了住户们的恐慌与热议。 据发布图片的业主称,当时自己12岁的孩子独自在家,声称遭遇了流浪汉的闯入,并附上了这张由AI生成的“现场”图片。图片中,流浪汉的形象栩栩如生,场景逼真,令不少住户�

今日大家都在搜的词: