AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

2025-05-15 15:58 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里通义万相Wan2.1-VACE开源号称首个开源的视频编辑统一模型

通义万相宣布VACE开源，支持多种分辨率和任务，提供一站式视频创作体验，通过多模态输入机制实现高效灵活的视频编辑。

【AiBase提要:】
✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务，提高创作效率。
🌟 强大的可控重绘能力，基于人体姿态、运动光流等控制生成，支持主体和背景参考。
🔧 提出视频条件单元VCU，统一多模态输入，实现多任务自由组合与灵活编辑。
详情链接:https://github.com/Wan-Video/Wan2.1

2、OpenAI 升级 ChatGPT:正式引入GPT-4.1代码能力超强

OpenAI发布了GPT-4.1及其轻量级版本GPT-4.1mini，显著增强了编码能力和指令执行体验，同时优化了用户体验和多模态支持，巩固了其在AI领域的领先地位。

【AiBase提要:】
🚀 GPT-4.1具备强大的编码能力，处理复杂编程需求更高效，运行速度更快，是开发者和指令处理场景的理想选择。
🌐 GPT-4.1mini轻量级且高效，在资源受限设备上仍能流畅运行，为免费和付费用户提供广泛访问渠道。
🌟 ChatGPT新增多项功能如长按复制、表格复制和流式传输，界面优化显著提升用户体验。

3、Stability AI开源341M超轻量文字转语音模型，手机本地可跑，音频生成仅需8秒!

Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型，参数仅为341M，却能在H100GPU上75毫秒生成12秒音频，在手机CPU上7秒完成同样任务，性能炸裂且多样性强。

【AiBase提要:】
⚡️ARC后训练方法不基于蒸馏，提升模型生成速度与质量。
📱模型轻量化设计，支持手机本地运行，大幅提升移动端创意应用体验。
💫音频转音频功能实现风格迁移，激发更多创作灵感。
详情链接:https://arxiv.org/pdf/2505.08175

4、Poe 报告:可灵大模型视频生成量约占30%份额领先Runway

近日发布的2025年春季AI模型使用趋势报告显示，中国快手的可灵多款视频生成模型在文生视频领域表现突出，市场份额达30%，其中可灵2.0模型仅三周就占21%使用比例。自去年6月发布以来，全球用户突破2200万，月活跃用户增长25倍，生成视频和图片数量显著。

【AiBase提要:】
🌟 可灵大模型在文生视频领域市场份额达30%，领先Runway等竞争者。
📈 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。
👥 可灵AI全球用户超2200万，月活跃用户增长25倍，生成视频与图片数量显著增加。

5、微软 WizardLM 团队“集体跳槽”腾讯，或已并入混元大模型研发体系

微软的人工智能研究团队 WizardLM 整体加入腾讯 AI 实验室的“混元”团队，标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破，还通过开源模型展示了其研发实力。

【AiBase提要:】
✨ 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队，强化了腾讯在大模型领域的竞争力。
🚀 Hunyuan-TurboS0416模型首次使用“混元”命名，象征着团队与腾讯的深度融合。
💼 腾讯计划大幅增加 AI 投资，目标是在全球 AI 竞争中占据更为主导的地位。

6、腾讯宣布混元图像2.0将于5月16日全新发布

腾讯混元大模型团队宣布，混元图像2.0将在5月16日发布，这是腾讯在AI视觉领域的重要突破，以‘更智能、更开放、更中国’为核心理念。

【AiBase提要:】
🌟 混元图像2.0将于5月16日发布，标志着腾讯在AI视觉领域的又一重要进展。
🌐 新工具强调‘更智能、更开放、更中国’，助力创作者和企业迈向AI驱动的视觉生产新时代。
🚀 继去年混元大模型升级后，腾讯再次展示其在人工智能领域的持续创新力。

7、上海启动人工智能标识生态联盟，小红书和 MiniMax 等首批入盟

本文介绍了上海市成立的人工智能标识生态联盟，该联盟旨在推动人工智能领域的标识技术发展，提高生成内容的透明度和安全性，并通过政策解读和企业合作，为构建可信的人工智能环境奠定基础。

【AiBase提要:】
🌟 联盟由上海市委网信办指导，汇聚多家知名企业，目标是提升AI生成内容的透明度和安全性。
🔍 国家互联网应急中心和中国电子技术标准化研究院解读相关政策，强调国际规则与中国特色的结合。
🤝 小红书、MiniMax等企业参与标识工作实践，探索多种内容的标识方案并积累治理经验。

8、Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频，速度与质量双飞跃!

以色列科技公司Lightricks发布的开源AI视频生成模型LTX-Video-13B精炼模型，以130亿参数为基础，结合多尺度渲染技术和高效量化优化，将视频生成速度提升至10秒以内，同时保持高质量输出。

【AiBase提要:】
🚀 采用多尺度渲染技术，10秒内生成高清视频，速度提升5倍以上。
🌍 开源模型，支持低显存设备运行，降低AI视频制作成本。
🌟 生成速度提升30倍，媲美专业影视作品，重塑内容创作生态。
详情链接:https://github.com/Lightricks/LTX-Video

9、谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题，优化芯片与数据中心，训练速度飙升32.5%

谷歌DeepMind发布的AlphaEvolve是一款结合Gemini大语言模型与进化算法的AI编码代理，它在多个领域展现了强大的自优化能力，包括数据中心调度、芯片设计、AI训练以及数学研究。

【AiBase提要:】
🌟 Gemini与进化算法结合，解决复杂问题如芯片优化和数学难题。
🚀 AlphaEvolve优化数据中心调度，回收0.7%全球算力，节省运营成本。
🔍 提升AI训练效率，Gemini模型训练速度提升32.5%，展现强大自我优化能力。

10、腾讯元宝浏览器插件尝鲜版上线Chrome

腾讯元宝浏览器插件尝鲜版上线Chrome平台，提供悬浮球、常驻侧边栏和划词工具栏等功能，提升网页浏览与信息处理效率。

【AiBase提要:】
✨悬浮球功能支持一键翻译和总结网页内容，轻松跨越语言障碍并节省阅读时间。
💬常驻侧边栏可高效答疑，支持截图提问，大幅提升信息获取效率。
🔍划词工具栏实现选中文本后的即时搜索或翻译，让信息处理更流畅。
详情链接:https://yuanbao.tencent.com/download

（举报）

相关推荐

关键词：

海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

海尔冰箱在人工智能领域取得新突破，主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向，开发了全空间智慧保鲜舱冰箱等140多项行业首创产品，近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱，具备方言识别、降噪技术等功能，显著提升用户体验。市场数据显示，2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能，海尔冰箱正引领行业向精准、智能保鲜时代跨越。

人工智能海尔冰箱科技创新
下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

8月16日，2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出，围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势，依托酷睿Ultra处理器和低代码开发工具，推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务，体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持，加速AI技术普及和商业化进程。

人工智能创新应用大赛
荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

【AI日报】主要内容： 1. B站测试"花生AI"视频工具，3分钟可成片，同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0，实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI，苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐，仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新：恢复GPT-4o默认模式，为GPT-5引入多模式选择，优化交互体验

AI视频创作花生AI B站AI工具
荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

本期AI日报聚焦多项AI技术突破：智谱发布革命性语音代理AutoGLM 2.0，实现全平台语音操控；腾讯元宝接入视频平台提升观影便捷性；字节跳动开源大模型Seed-OSS专注长文本处理；速卖通AI代理助力新品推广效率翻倍；微软测试Copilot智能文件搜索功能；Liquid AI推出低延迟视觉语言模型LFM2-VL；OpenAI月收入首破10亿美元；谷歌Pixel 10系列全面升级AI功能，包括情感识别和实时翻译；Pixel Buds Pro 2引入AI手势控制；ElevenLabs发布支持70+语言的文本转语音API。

AI产品 AutoGLM 2.0
荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

大模型又迎来新一波的迭代周期。近日，从Open AI发布GPT-5，到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周，连续5天每天发布一个新模型，而8月13日发布的，正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是，在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

大模型多模态 AI生图
ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

ISC.AI2025人工智能安全论坛在北京召开，聚焦AI安全治理与创新实践。论坛汇集顶尖专家，探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出，随着Agent技术爆发式应用，AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系，应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素，清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护，中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

人工智能安全大模型安全 AI治理
长视频自己的音乐节：从一个人刷片，到七万人狂欢

当夕阳余晖洒下，毛不易的歌词「一杯敬月光、一杯敬过往」在巨型竖屏出现，所有台下的合唱观众，感受到了一种强烈的共鸣。同一刻、在一起，体验同一种情绪，成了用户与腾讯视频之间的「独家记忆」。这是国内长视频平台首次把音乐节与内容紧密结合，通过一场线下活动，腾讯视频想要回应一个期待:为私密的、个人的线上观影行为，制造一种「共同在场感」。无�

文章搜索核心标签长视频平台
荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

AI 游戏视频生成腾讯混元
荐首超长视频，只是红果的起点

红果，又一次创造历史。 Questmobile的数据显示，抖音集团旗下免费短剧APP红果2025年6月的月活达到2.1亿，同比增长179%，并超过2亿月活的优酷。这意味着，短剧APP第一次超越长视频APP。近年来，“爱优腾”对短剧的态度有了微妙的变化，从“长短之争”的剑拔弩张演化为“取长补短”的协同联动，却依然无法阻拦红果。毋庸置疑，红果正走在高歌猛进的道路上。

短剧APP 红果月活
Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

雷蛇宣布在新加坡设立全球AI卓越中心，并计划在欧洲和美国建立类似机构，推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师，专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件，包括Game Co-AI和QA Co-AI，帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期，预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示，此举将巩固该国作为区域AI创新中心的地位。

雷蛇人工智能游戏创新

今日大家都在搜的词：

热文

3 天
7天

AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

长视频自己的音乐节：从一个人刷片，到七万人狂欢

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

荐首超长视频，只是红果的起点

Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

今日大家都在搜的词：

热文

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

黑神话官号更名系列游戏将开启宏大篇章

京东外卖全职骑手破15万人五险一金每人每月平均缴纳约2000元

REDMI Note 15 Pro+宣布搭载7000mAh金沙江电池：支持90W快充

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

苹果正式入驻小红书 iPhone 17系列下月发布

站长商机