首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

2025-06-19 16:08 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Midjourney推首个视频生成模型V1:最长支持21秒,每月10美元

Midjourney发布了其首个AI视频生成模型V1,主打图像到视频转换功能,支持多种动态模式和文本提示定制,定价亲民且操作简便,但面临版权争议和技术优化空间。

【AiBase提要:】

🌟 主打图像到视频转换功能,支持多种动态模式和文本提示定制。

💰 定价亲民,最低每月10美元即可体验视频生成功能。

⚠️ 面临版权争议,技术仍有优化空间,如高动态场景的轻微闪烁问题。

2、OpenAI CEO表示:GPT-5将在今年夏季发布

本文详细介绍了OpenAI的发展动态,包括GPT-5的发布时间、与微软的合作调整以及在国防领域的突破性进展,展现了OpenAI在人工智能领域的持续领先地位。

【AiBase提要:】

🚀 OpenAI CEO确认GPT-5将在今年夏季发布,行业热切期待。

💰 OpenAI计划重新谈判与微软的合作协议,增强自身市场独立性。

🛡️ OpenAI与美国国防部签署2亿美元合同,标志其在国防领域的崛起。

3、Google Search Live重磅上线!语音对话搜索革新体验,AI助手随时待命!

Google推出的Search Live语音搜索功能,基于AI Mode,允许用户通过语音与搜索引擎进行实时对话,提供无缝交互体验。

【AiBase提要:】

✨ 实时语音对话:通过语音提问并获得AI生成的语音回答,支持连续追问。

🌐 网页链接辅助:每次回答附带相关链接,确保信息透明可信。

🌟 技术融合:结合Gemini模型与Astra技术,处理复杂语音输入并生成自然连贯回答。

4、OpenAI 推出开源客户服务代理框架,助力企业智能化转型

我了解到OpenAI发布了开源的客户服务代理示例,这让我感到非常兴奋。这个示例不仅展示了如何构建智能AI代理,还提供了详细的防护措施和实际应用案例。通过这个框架,企业可以更轻松地实现客户服务的自动化,提高效率并降低成本。

【AiBase提要:】

🚀 使用OpenAI代理SDK构建智能、工作流意识强的AI代理,支持多种业务场景。

🔒 设定安全和相关性防护措施,确保系统安全稳定运行。

📖 提供Python后端和Next.js前端,展示多代理协作及防护机制的实际应用。

5、MiniMax Agent重磅发布!从‘给我代码’到‘告诉我需求’,AI智能代理革新工作流!

MiniMax Agent是一款专为解决长期复杂任务设计的智能代理,具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。它通过深度理解用户需求,自动完成任务规划与执行,让用户专注于更高价值的创意与决策。

image.png

【AiBase提要:】

✨ 核心亮点:多场景赋能,包括编程、多模态理解和无缝MCP集成,满足个人及企业级团队需求。

💻 功能优势:从繁琐代码中解放,通过需求理解实现高效任务规划与执行。

🌟 行业影响:智能代理引领未来,重塑生产力工具格局,推动智能化、自动化发展。

6、恶意工具WormGPT 新变种重现江湖,使用Mistral AI和Grok模型编写恶意代码

近日,Cato Network发现两款基于Grok和Mixtral的新版WormGPT,这些工具能帮助网络犯罪分子生成钓鱼邮件、恶意代码及规避AI安全防护。这表明网络犯罪正利用先进AI技术升级作案手段。

【AiBase提要:】

⚠️ 新版本WormGPT基于Grok和Mixtral模型,专用于网络犯罪活动。

🔒 这些工具能绕过AI平台的伦理防护,生成恶意脚本和窃取凭证。

🛡️ 网络安全专家呼吁加强防御策略,如提升威胁检测与响应能力。

7、OpenAI 重磅推出 ChatGPT 企业版折扣,折扣幅度从10%到20%

OpenAI 推出 ChatGPT 企业版折扣,吸引企业用户,降低使用成本,预计到2030年企业客户年收入可达150亿美元。

【AiBase提要:】

🚀 OpenAI 提供企业版 ChatGPT 折扣,幅度10%-20%,助力企业降本增效。

🌟 ChatGPT 作为对话生成工具,被广泛采用,推动 AI 技术普及。

📈 到2030年,企业客户年收入有望达到150亿美元,显示 AI 市场巨大潜力。

8、DeepSite V2升级!支持DeepSeek-R1-0528模型,轻松生成3D网页动画,零代码也能玩转创意!

DeepSite V2通过集成DeepSeek-R1-0528模型,大幅提升了代码生成能力和实时预览体验,使用户仅需简单描述即可生成复杂网页代码,包括HTML、CSS和JavaScript,适用于开发者和非专业人士。

image.png

【AiBase提要:】

🚀 支持自然语言生成复杂代码,如3D动画,仅需输入描述即可秒级生成可运行代码。

🌐 实时预览与调整功能让用户即时查看效果并优化结果,确保输出符合预期。

🌱 完全开源免费,支持多模态任务,涵盖网页、游戏、特效及3D交互内容,降低开发门槛。

详情链接:https://deepsite.hf.co/projects/new

9、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线,自动生成专业报告,效率翻倍!

Office-PowerPoint-MCP-Server是一款基于Model Context Protocol(MCP)的开源工具,通过AI助力用户快速创建和编辑PPT演示文稿,提供从零开始生成全新PPT到对现有文件进行精细化修改的多项功能。

image.png

【AiBase提要:】

🌟 支持从零创建全新PPT或编辑现有文件,覆盖幻灯片管理、内容填充和数据可视化等多功能。

📊 无缝集成AI助手,通过自然语言指令或代码批量生成PPT,大幅提升企业报告生成效率。

🌐 开源特性允许开发者定制功能,如集成图像生成模型或与外部数据源连接,拓展应用场景。

详情链接:https://github.com/GongRzhe/Office-PowerPoint-MCP-Server

10、比亚迪与字节跳动携手用AI开发动力电池关键技术

比亚迪与字节跳动合作共建‘AI + 高通量联合实验室’,利用AI技术推动动力电池发展,解决快充、寿命和安全等技术难题,加速电池迭代周期,为新能源汽车行业注入新动力。

【AiBase提要:】

🌟 比亚迪与字节跳动共建联合实验室,研发动力电池核心技术。

⚙️ 共享算法、算力和实验数据,攻克快充、寿命和安全等关键问题。

🚀 加速电池迭代周期,促进新材料和新配方的发现,推动行业技术进步。

11、马斯克驳斥 xAI 巨额亏损传闻:每月烧钱10亿美元纯属无稽之谈

xAI 被曝每月烧钱10亿美元,马斯克否认并称这是谣言。xAI 正寻求93亿美元融资,预计全年亏损130亿美元,但马斯克对其未来盈利抱有信心。

【AiBase提要:】

🌟 xAI 每月烧钱10亿美元的传闻被马斯克否认,认为是无稽之谈。

💰 xAI 正寻求93亿美元融资以弥补资金缺口,预计全年亏损达130亿美元。

🚀 尽管面临巨额亏损,马斯克对 xAI 的未来发展充满信心,目标是在2027年实现盈利。

举报

  • 相关推荐
  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • OpenAI披露GPT系列新进展,微美全息(WIMI.US)正加速AI技术融合与产业变革

    OpenAI创始人Sam Altman宣布将推出开源大模型,性能远超业界预期,其强大的本地运行能力将极大推动AI技术普及。同时透露GPT-5将于今夏面世,支持语音、图像、代码等多模态输入。AI模型成本持续下降,微美全息等企业加速布局"AI+大模型"创新应用。中金指出,未来AI发展将呈现两大趋势:垂直领域定制化Agent需求增长,以及高质量场景数据价值凸显。2025年被视为AI应用大规模落地元年,但技术发展需兼顾创新与安全。