AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

2025-06-19 16:08 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Midjourney推首个视频生成模型 V1:最长支持21秒，每月10美元

Midjourney发布了其首个AI视频生成模型V1，主打图像到视频转换功能，支持多种动态模式和文本提示定制，定价亲民且操作简便，但面临版权争议和技术优化空间。

【AiBase提要:】
🌟 主打图像到视频转换功能，支持多种动态模式和文本提示定制。
💰 定价亲民，最低每月10美元即可体验视频生成功能。
⚠️ 面临版权争议，技术仍有优化空间，如高动态场景的轻微闪烁问题。

2、OpenAI CEO表示:GPT-5将在今年夏季发布

本文详细介绍了OpenAI的发展动态，包括GPT-5的发布时间、与微软的合作调整以及在国防领域的突破性进展，展现了OpenAI在人工智能领域的持续领先地位。

【AiBase提要:】
🚀 OpenAI CEO确认GPT-5将在今年夏季发布，行业热切期待。
💰 OpenAI计划重新谈判与微软的合作协议，增强自身市场独立性。
🛡️ OpenAI与美国国防部签署2亿美元合同，标志其在国防领域的崛起。

3、Google Search Live重磅上线!语音对话搜索革新体验，AI助手随时待命!

Google推出的Search Live语音搜索功能，基于AI Mode，允许用户通过语音与搜索引擎进行实时对话，提供无缝交互体验。

【AiBase提要:】
✨ 实时语音对话:通过语音提问并获得AI生成的语音回答，支持连续追问。
🌐 网页链接辅助:每次回答附带相关链接，确保信息透明可信。
🌟 技术融合:结合Gemini模型与Astra技术，处理复杂语音输入并生成自然连贯回答。

4、OpenAI 推出开源客户服务代理框架，助力企业智能化转型

我了解到OpenAI发布了开源的客户服务代理示例，这让我感到非常兴奋。这个示例不仅展示了如何构建智能AI代理，还提供了详细的防护措施和实际应用案例。通过这个框架，企业可以更轻松地实现客户服务的自动化，提高效率并降低成本。

【AiBase提要:】
🚀 使用OpenAI代理SDK构建智能、工作流意识强的AI代理，支持多种业务场景。
🔒 设定安全和相关性防护措施，确保系统安全稳定运行。
📖 提供Python后端和Next.js前端，展示多代理协作及防护机制的实际应用。

5、MiniMax Agent重磅发布!从‘给我代码’到‘告诉我需求’，AI智能代理革新工作流!

MiniMax Agent是一款专为解决长期复杂任务设计的智能代理，具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。它通过深度理解用户需求，自动完成任务规划与执行，让用户专注于更高价值的创意与决策。

【AiBase提要:】
✨ 核心亮点:多场景赋能，包括编程、多模态理解和无缝MCP集成，满足个人及企业级团队需求。
💻 功能优势:从繁琐代码中解放，通过需求理解实现高效任务规划与执行。
🌟 行业影响:智能代理引领未来，重塑生产力工具格局，推动智能化、自动化发展。

6、恶意工具WormGPT 新变种重现江湖，使用Mistral AI和Grok模型编写恶意代码

近日，Cato Network发现两款基于Grok和Mixtral的新版WormGPT，这些工具能帮助网络犯罪分子生成钓鱼邮件、恶意代码及规避AI安全防护。这表明网络犯罪正利用先进AI技术升级作案手段。

【AiBase提要:】
⚠️ 新版本WormGPT基于Grok和Mixtral模型，专用于网络犯罪活动。
🔒 这些工具能绕过AI平台的伦理防护，生成恶意脚本和窃取凭证。
🛡️ 网络安全专家呼吁加强防御策略，如提升威胁检测与响应能力。

7、OpenAI 重磅推出 ChatGPT 企业版折扣，折扣幅度从10%到20%

OpenAI 推出 ChatGPT 企业版折扣，吸引企业用户，降低使用成本，预计到2030年企业客户年收入可达150亿美元。

【AiBase提要:】
🚀 OpenAI 提供企业版 ChatGPT 折扣，幅度10%-20%，助力企业降本增效。
🌟 ChatGPT 作为对话生成工具，被广泛采用，推动 AI 技术普及。
📈 到2030年，企业客户年收入有望达到150亿美元，显示 AI 市场巨大潜力。

8、DeepSite V2升级!支持DeepSeek-R1-0528模型，轻松生成3D网页动画，零代码也能玩转创意!

DeepSite V2通过集成DeepSeek-R1-0528模型，大幅提升了代码生成能力和实时预览体验，使用户仅需简单描述即可生成复杂网页代码，包括HTML、CSS和JavaScript，适用于开发者和非专业人士。

【AiBase提要:】
🚀 支持自然语言生成复杂代码，如3D动画，仅需输入描述即可秒级生成可运行代码。
🌐 实时预览与调整功能让用户即时查看效果并优化结果，确保输出符合预期。
🌱 完全开源免费，支持多模态任务，涵盖网页、游戏、特效及3D交互内容，降低开发门槛。
详情链接:https://deepsite.hf.co/projects/new

9、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线，自动生成专业报告，效率翻倍!

Office-PowerPoint-MCP-Server是一款基于Model Context Protocol（MCP）的开源工具，通过AI助力用户快速创建和编辑PPT演示文稿，提供从零开始生成全新PPT到对现有文件进行精细化修改的多项功能。

【AiBase提要:】
🌟 支持从零创建全新PPT或编辑现有文件，覆盖幻灯片管理、内容填充和数据可视化等多功能。
📊 无缝集成AI助手，通过自然语言指令或代码批量生成PPT，大幅提升企业报告生成效率。
🌐 开源特性允许开发者定制功能，如集成图像生成模型或与外部数据源连接，拓展应用场景。
详情链接:https://github.com/GongRzhe/Office-PowerPoint-MCP-Server

10、比亚迪与字节跳动携手用AI开发动力电池关键技术

比亚迪与字节跳动合作共建‘AI + 高通量联合实验室’，利用AI技术推动动力电池发展，解决快充、寿命和安全等技术难题，加速电池迭代周期，为新能源汽车行业注入新动力。

【AiBase提要:】
🌟 比亚迪与字节跳动共建联合实验室，研发动力电池核心技术。
⚙️ 共享算法、算力和实验数据，攻克快充、寿命和安全等关键问题。
🚀 加速电池迭代周期，促进新材料和新配方的发现，推动行业技术进步。

11、马斯克驳斥 xAI 巨额亏损传闻:每月烧钱10亿美元纯属无稽之谈

xAI 被曝每月烧钱10亿美元，马斯克否认并称这是谣言。xAI 正寻求93亿美元融资，预计全年亏损130亿美元，但马斯克对其未来盈利抱有信心。

【AiBase提要:】
🌟 xAI 每月烧钱10亿美元的传闻被马斯克否认，认为是无稽之谈。
💰 xAI 正寻求93亿美元融资以弥补资金缺口，预计全年亏损达130亿美元。
🚀 尽管面临巨额亏损，马斯克对 xAI 的未来发展充满信心，目标是在2027年实现盈利。

（举报）

相关推荐

关键词：

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
爱诗科技下注的AI视频，正在比它预期的更「快」落地

「我们决定全力投入视频生成领域，因为我们坚信视频生成一旦能够落地，其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中，这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。短短两年后，视频大模型的产品化和商业化潜力已经如王长虎判断的那样，在快速落地，形成自己的创作生�

AI视频生成视频大模型产品化
荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

本期AI日报聚焦多项技术突破：阿里千问APP公测，基于Qwen3模型对标ChatGPT；谷歌Veo 3.1支持三图融合生成8秒视频；小米推出"随心修图"功能与7B多模态模型Miloco；谷歌Flow集成Nano Banana模型实现智能抠图；多模态AI工具DeepEyesV2可执行代码与网络搜索；NotebookLM升级支持图像导入检索；JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温，产品迭代加速。

AI 阿里巴巴千问APP
荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划

今日大家都在搜的词：

热文

3 天
7天

AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

跨境支付的未来：人工智能、嵌入式金融和即时结算

爱诗科技下注的AI视频，正在比它预期的更「快」落地

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

人工智能巨头OpenAI拟上市估值或高达1万亿美元

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

站长商机