AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

2025-06-19 16:03 · 来源： AIbase基地

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Midjourney推首个视频生成模型V1:最长支持21秒，每月10美元

Midjourney发布了其首个AI视频生成模型V1，主打图像到视频转换功能，支持多种动态模式和文本提示定制，定价亲民且操作简便，但面临版权争议和技术优化空间。

【AiBase提要:】
🌟 主打图像到视频转换功能，支持多种动态模式和文本提示定制。
💰 定价亲民，最低每月10美元即可体验视频生成功能。
⚠️ 面临版权争议，技术仍有优化空间，如高动态场景的轻微闪烁问题。

2、OpenAI CEO表示:GPT-5将在今年夏季发布

本文详细介绍了OpenAI的发展动态，包括GPT-5的发布时间、与微软的合作调整以及在国防领域的突破性进展，展现了OpenAI在人工智能领域的持续领先地位。

【AiBase提要:】
🚀 OpenAI CEO确认GPT-5将在今年夏季发布，行业热切期待。
💰 OpenAI计划重新谈判与微软的合作协议，增强自身市场独立性。
🛡️ OpenAI与美国国防部签署2亿美元合同，标志其在国防领域的崛起。

3、Google Search Live重磅上线!语音对话搜索革新体验，AI助手随时待命!

Google推出的Search Live语音搜索功能，基于AI Mode，允许用户通过语音与搜索引擎进行实时对话，提供无缝交互体验。

【AiBase提要:】
✨ 实时语音对话:通过语音提问并获得AI生成的语音回答，支持连续追问。
🌐 网页链接辅助:每次回答附带相关链接，确保信息透明可信。
🌟 技术融合:结合Gemini模型与Astra技术，处理复杂语音输入并生成自然连贯回答。

4、OpenAI 推出开源客户服务代理框架，助力企业智能化转型

我了解到OpenAI发布了开源的客户服务代理示例，这让我感到非常兴奋。这个示例不仅展示了如何构建智能AI代理，还提供了详细的防护措施和实际应用案例。通过这个框架，企业可以更轻松地实现客户服务的自动化，提高效率并降低成本。

【AiBase提要:】
🚀 使用OpenAI代理SDK构建智能、工作流意识强的AI代理，支持多种业务场景。
🔒 设定安全和相关性防护措施，确保系统安全稳定运行。
📖 提供Python后端和Next.js前端，展示多代理协作及防护机制的实际应用。

5、MiniMax Agent重磅发布!从‘给我代码’到‘告诉我需求’，AI智能代理革新工作流!

MiniMax Agent是一款专为解决长期复杂任务设计的智能代理，具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。它通过深度理解用户需求，自动完成任务规划与执行，让用户专注于更高价值的创意与决策。

【AiBase提要:】
✨ 核心亮点:多场景赋能，包括编程、多模态理解和无缝MCP集成，满足个人及企业级团队需求。
💻 功能优势:从繁琐代码中解放，通过需求理解实现高效任务规划与执行。
🌟 行业影响:智能代理引领未来，重塑生产力工具格局，推动智能化、自动化发展。

6、恶意工具WormGPT 新变种重现江湖，使用Mistral AI和Grok模型编写恶意代码

近日，Cato Network发现两款基于Grok和Mixtral的新版WormGPT，这些工具能帮助网络犯罪分子生成钓鱼邮件、恶意代码及规避AI安全防护。这表明网络犯罪正利用先进AI技术升级作案手段。

【AiBase提要:】
⚠️ 新版本WormGPT基于Grok和Mixtral模型，专用于网络犯罪活动。
🔒 这些工具能绕过AI平台的伦理防护，生成恶意脚本和窃取凭证。
🛡️ 网络安全专家呼吁加强防御策略，如提升威胁检测与响应能力。

7、OpenAI 重磅推出 ChatGPT 企业版折扣，折扣幅度从10%到20%

OpenAI 推出 ChatGPT 企业版折扣，吸引企业用户，降低使用成本，预计到2030年企业客户年收入可达150亿美元。

【AiBase提要:】
🚀 OpenAI 提供企业版 ChatGPT 折扣，幅度10%-20%，助力企业降本增效。
🌟 ChatGPT 作为对话生成工具，被广泛采用，推动 AI 技术普及。
📈 到2030年，企业客户年收入有望达到150亿美元，显示 AI 市场巨大潜力。

8、DeepSite V2升级!支持DeepSeek-R1-0528模型，轻松生成3D网页动画，零代码也能玩转创意!

DeepSite V2通过集成DeepSeek-R1-0528模型，大幅提升了代码生成能力和实时预览体验，使用户仅需简单描述即可生成复杂网页代码，包括HTML、CSS和JavaScript，适用于开发者和非专业人士。

【AiBase提要:】
🚀 支持自然语言生成复杂代码，如3D动画，仅需输入描述即可秒级生成可运行代码。
🌐 实时预览与调整功能让用户即时查看效果并优化结果，确保输出符合预期。
🌱 完全开源免费，支持多模态任务，涵盖网页、游戏、特效及3D交互内容，降低开发门槛。
详情链接:https://deepsite.hf.co/projects/new

9、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线，自动生成专业报告，效率翻倍!

Office-PowerPoint-MCP-Server是一款基于Model Context Protocol（MCP）的开源工具，通过AI助力用户快速创建和编辑PPT演示文稿，提供从零开始生成全新PPT到对现有文件进行精细化修改的多项功能。

【AiBase提要:】
🌟 支持从零创建全新PPT或编辑现有文件，覆盖幻灯片管理、内容填充和数据可视化等多功能。
📊 无缝集成AI助手，通过自然语言指令或代码批量生成PPT，大幅提升企业报告生成效率。
🌐 开源特性允许开发者定制功能，如集成图像生成模型或与外部数据源连接，拓展应用场景。
详情链接:https://github.com/GongRzhe/Office-PowerPoint-MCP-Server

10、比亚迪与字节跳动携手用AI开发动力电池关键技术

比亚迪与字节跳动合作共建‘AI + 高通量联合实验室’，利用AI技术推动动力电池发展，解决快充、寿命和安全等技术难题，加速电池迭代周期，为新能源汽车行业注入新动力。

【AiBase提要:】
🌟 比亚迪与字节跳动共建联合实验室，研发动力电池核心技术。
⚙️ 共享算法、算力和实验数据，攻克快充、寿命和安全等关键问题。
🚀 加速电池迭代周期，促进新材料和新配方的发现，推动行业技术进步。

11、马斯克驳斥 xAI 巨额亏损传闻:每月烧钱10亿美元纯属无稽之谈

xAI 被曝每月烧钱10亿美元，马斯克否认并称这是谣言。xAI 正寻求93亿美元融资，预计全年亏损130亿美元，但马斯克对其未来盈利抱有信心。

【AiBase提要:】
🌟 xAI 每月烧钱10亿美元的传闻被马斯克否认，认为是无稽之谈。
💰 xAI 正寻求93亿美元融资以弥补资金缺口，预计全年亏损达130亿美元。
🚀 尽管面临巨额亏损，马斯克对 xAI 的未来发展充满信心，目标是在2027年实现盈利。

相关推荐

荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

AI日报栏目汇总近期AI领域重要进展：腾讯元宝接入DeepSeek V3.1提升智能助手能力；即梦AI推出多帧功能简化视频制作；可灵AI首尾帧功能升级效果提升235%；钉钉与通义实验室联合发布Fun-ASR语音识别大模型；腾讯CodeBuddy IDE国内版公测；Vercel发布AI Gateway简化模型调用；Anthropic整合Claude Code强化企业开发；阿里发布Mobile-Agent-v3突破GUI自动化；Qoder平台革新编程模式；清华团队GUAVA框架实现0.1秒3D化身生成；谷歌搜索新增AI Agent功能；VAST推出Tripo 3.0推动3D内容创作。

AI 腾讯元宝 DeepSeek
荐AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；快手 Klear-Reasoner 模型成功登顶

AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布，大幅增强长文档分析和代码理解能力；企业微信5.0集成智能搜索、总结和机器人功能；快手Klear-Reasoner模型数学推理准确率超90%；谷歌Docs新增AI语音朗读功能；Firecrawl完成1450万美元融资并推出V2版本API；Meta上线AI语音翻译功能；微软Excel集成Copilot实现一键数据分析；Claude桌面客户端推动AI编程可视化；苹果Xcode将原生集成Cl

AI DeepSeek V3.1
荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

本期AI日报聚焦多项技术突破：阿里通义万相发布Wan 2.2-S2V模型，实现视频音频同步生成；字节跳动研发3D模型生成工具，降低建模门槛；面壁智能推出MiniCPM-V4.5端侧多模态模型；苹果提出RLCF训练法提升模型性能；微软开源VibeVoice-1.5B支持超长语音合成；谷歌Imagen 4正式上线；英伟达发布Jetson Thor机器人计算平台；Genspark推出AI Designer一键生成品牌方案；豆包上线未成年人保护模式。

AI视频生成多模态AI 阿里通义万相
马斯克母亲发帖支持儿子：演示Grok视频生成功能

近日，马斯克母亲梅耶-马斯克发帖演示支持马斯克的Grok视频生成功能。她表示，这次我把手指放在了最近在X上发布的这张照片上，提示是用Grok制作视频”，现在自己的狗摇着尾巴了，自己玩得很开心。她还特别提示，这个视频由@grok Imagine制作。

马斯克 Grok 视频生成
荐AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatcher；我国首个法律垂直大模型“小包公”发布

本文介绍了AI领域最新动态：1)腾讯推出电影级音频生成工具AudioGenie，展现中国AI技术实力；2)阿里开源多模态智能体WebWatcher，突破现有系统局限；3)港大等高校联合推出3D建模技术OmniPart，实现模型组件独立性和清晰度；4)Meta发布无需标注数据的通用图像处理模型DINOv3；5)国内首个法律大模型"小包公"发布；6)ChatGPT移动端收入突破20亿美元；7)安卓厂商借鉴灵动岛设计，新芯片推动AI功能普及；8)欧洲AI公司推出仅94MB的超小模型；9)Claude Code新增编程教学模式；10)AI技术被滥用于电商恶意退款；11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

AI 腾讯AudioGenie 电影级音效
荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

本文介绍了AI领域最新动态：1)快手可灵2.1推出首尾帧功能，提升视频生成效果；2)昆仑万维发布Mureka V7.5音乐模型，优化人声表现；3)腾讯云推出AI开发工具CloudBase AI CLI，可减少80%编码量；4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验；5)Meta开源DINOv3视觉模型，无需标注即可实现卓越性能；6)宇树科技人形机器人H1获1500米赛跑金牌；7)谷歌Gemini新增记忆功能和隐私聊天模式；8)香港大学开源OpenCUA框架，打造个性化电脑助手；9)OpenAI考虑在ChatGPT引入广告；10)谷歌发布超小型开源模型Gemma 3 270M，支持手机端运行。

AI日报快手可灵视频生成
荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

本期AI日报聚焦多项AI领域创新：1）阿里开源Qwen-Image-Edit图像编辑模型，支持中文渲染与精准文本编辑；2）淘宝测试"AI万能搜"功能，重构电商搜索体验；3）小红书发布DynamicFace人脸生成技术，实现高质量图像视频换脸；4）Gemini API新增URL Context功能，简化网页内容获取流程；5）Nvidia推出小型开放模型Nemotron-Nano-9B-v2，支持智能推理开关；6）马斯克发布Grok Imagine 0.1测试版，进军AI图像生成领域；7）Vercel推出iOS版AI开发工具v0；8）理想汽车发布MindGPT 3.1模型，处理速度提升5倍；9）ToonComposer工具简化动画制作流程；10）ElevenLabs推出视频到音乐生成流程。

AI 开源图像编辑
OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI在直播活动中正式推出新一代人工智能模型GPT-5，宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域，实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）形容，与GPT-5交互如同与各领域专家对话，其多维度能力突破将重塑人机协作模式。分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送，免费用户与付�
OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

AI日报栏目聚焦人工智能领域最新动态：1)阿里发布Qwen3-4B轻量级模型，手机端可运行；2)小红书开源多模态大模型dots.vlm1，在图表推理方面表现突出；3)MiniMax推出语音生成模型Speech2.5，多语种表现提升；4)Midjourney推出HD视频模式，提升专业影像质量；5)Cursor1.4版本增强异步任务处理能力；6)谷歌否认AI搜索影响网站流量，但数据显示用户行为改变；7)MiniCPM-V4.0开源发布，号称"手机上的GPT-4V"；8)AMD与高通宣布支持OpenAI的gpt-oss系列模型；9)腾讯开源WeKnora文档智能解析工具；11)疑似GPT-5信息在GitHub泄露；12)FlowSpeech实现书面语转口语的TTS技术突破。

AI模型移动端AI 阿里通义千问

今日大家都在搜的词：

热文

3 天
7天

AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

荐AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；快手 Klear-Reasoner 模型成功登顶

荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

马斯克母亲发帖支持儿子：演示Grok视频生成功能

荐AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatcher；我国首个法律垂直大模型“小包公”发布

荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI的开源模型现已在IBM watsonx.ai上提供

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

今日大家都在搜的词：

热文

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

华为鸿蒙智行新款智界 S7 车型上市：：售价22.98万起

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

李国庆婚礼收到11万余元善款受助学生寄来祝福

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

REDMI Note 15标准版发布：售价999元起

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

站长商机