首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

2025-06-19 16:08 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Midjourney推首个视频生成模型V1:最长支持21秒,每月10美元

Midjourney发布了其首个AI视频生成模型V1,主打图像到视频转换功能,支持多种动态模式和文本提示定制,定价亲民且操作简便,但面临版权争议和技术优化空间。

【AiBase提要:】

🌟 主打图像到视频转换功能,支持多种动态模式和文本提示定制。

💰 定价亲民,最低每月10美元即可体验视频生成功能。

⚠️ 面临版权争议,技术仍有优化空间,如高动态场景的轻微闪烁问题。

2、OpenAI CEO表示:GPT-5将在今年夏季发布

本文详细介绍了OpenAI的发展动态,包括GPT-5的发布时间、与微软的合作调整以及在国防领域的突破性进展,展现了OpenAI在人工智能领域的持续领先地位。

【AiBase提要:】

🚀 OpenAI CEO确认GPT-5将在今年夏季发布,行业热切期待。

💰 OpenAI计划重新谈判与微软的合作协议,增强自身市场独立性。

🛡️ OpenAI与美国国防部签署2亿美元合同,标志其在国防领域的崛起。

3、Google Search Live重磅上线!语音对话搜索革新体验,AI助手随时待命!

Google推出的Search Live语音搜索功能,基于AI Mode,允许用户通过语音与搜索引擎进行实时对话,提供无缝交互体验。

【AiBase提要:】

✨ 实时语音对话:通过语音提问并获得AI生成的语音回答,支持连续追问。

🌐 网页链接辅助:每次回答附带相关链接,确保信息透明可信。

🌟 技术融合:结合Gemini模型与Astra技术,处理复杂语音输入并生成自然连贯回答。

4、OpenAI 推出开源客户服务代理框架,助力企业智能化转型

我了解到OpenAI发布了开源的客户服务代理示例,这让我感到非常兴奋。这个示例不仅展示了如何构建智能AI代理,还提供了详细的防护措施和实际应用案例。通过这个框架,企业可以更轻松地实现客户服务的自动化,提高效率并降低成本。

【AiBase提要:】

🚀 使用OpenAI代理SDK构建智能、工作流意识强的AI代理,支持多种业务场景。

🔒 设定安全和相关性防护措施,确保系统安全稳定运行。

📖 提供Python后端和Next.js前端,展示多代理协作及防护机制的实际应用。

5、MiniMax Agent重磅发布!从‘给我代码’到‘告诉我需求’,AI智能代理革新工作流!

MiniMax Agent是一款专为解决长期复杂任务设计的智能代理,具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。它通过深度理解用户需求,自动完成任务规划与执行,让用户专注于更高价值的创意与决策。

image.png

【AiBase提要:】

✨ 核心亮点:多场景赋能,包括编程、多模态理解和无缝MCP集成,满足个人及企业级团队需求。

💻 功能优势:从繁琐代码中解放,通过需求理解实现高效任务规划与执行。

🌟 行业影响:智能代理引领未来,重塑生产力工具格局,推动智能化、自动化发展。

6、恶意工具WormGPT 新变种重现江湖,使用Mistral AI和Grok模型编写恶意代码

近日,Cato Network发现两款基于Grok和Mixtral的新版WormGPT,这些工具能帮助网络犯罪分子生成钓鱼邮件、恶意代码及规避AI安全防护。这表明网络犯罪正利用先进AI技术升级作案手段。

【AiBase提要:】

⚠️ 新版本WormGPT基于Grok和Mixtral模型,专用于网络犯罪活动。

🔒 这些工具能绕过AI平台的伦理防护,生成恶意脚本和窃取凭证。

🛡️ 网络安全专家呼吁加强防御策略,如提升威胁检测与响应能力。

7、OpenAI 重磅推出 ChatGPT 企业版折扣,折扣幅度从10%到20%

OpenAI 推出 ChatGPT 企业版折扣,吸引企业用户,降低使用成本,预计到2030年企业客户年收入可达150亿美元。

【AiBase提要:】

🚀 OpenAI 提供企业版 ChatGPT 折扣,幅度10%-20%,助力企业降本增效。

🌟 ChatGPT 作为对话生成工具,被广泛采用,推动 AI 技术普及。

📈 到2030年,企业客户年收入有望达到150亿美元,显示 AI 市场巨大潜力。

8、DeepSite V2升级!支持DeepSeek-R1-0528模型,轻松生成3D网页动画,零代码也能玩转创意!

DeepSite V2通过集成DeepSeek-R1-0528模型,大幅提升了代码生成能力和实时预览体验,使用户仅需简单描述即可生成复杂网页代码,包括HTML、CSS和JavaScript,适用于开发者和非专业人士。

image.png

【AiBase提要:】

🚀 支持自然语言生成复杂代码,如3D动画,仅需输入描述即可秒级生成可运行代码。

🌐 实时预览与调整功能让用户即时查看效果并优化结果,确保输出符合预期。

🌱 完全开源免费,支持多模态任务,涵盖网页、游戏、特效及3D交互内容,降低开发门槛。

详情链接:https://deepsite.hf.co/projects/new

9、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线,自动生成专业报告,效率翻倍!

Office-PowerPoint-MCP-Server是一款基于Model Context Protocol(MCP)的开源工具,通过AI助力用户快速创建和编辑PPT演示文稿,提供从零开始生成全新PPT到对现有文件进行精细化修改的多项功能。

image.png

【AiBase提要:】

🌟 支持从零创建全新PPT或编辑现有文件,覆盖幻灯片管理、内容填充和数据可视化等多功能。

📊 无缝集成AI助手,通过自然语言指令或代码批量生成PPT,大幅提升企业报告生成效率。

🌐 开源特性允许开发者定制功能,如集成图像生成模型或与外部数据源连接,拓展应用场景。

详情链接:https://github.com/GongRzhe/Office-PowerPoint-MCP-Server

10、比亚迪与字节跳动携手用AI开发动力电池关键技术

比亚迪与字节跳动合作共建‘AI + 高通量联合实验室’,利用AI技术推动动力电池发展,解决快充、寿命和安全等技术难题,加速电池迭代周期,为新能源汽车行业注入新动力。

【AiBase提要:】

🌟 比亚迪与字节跳动共建联合实验室,研发动力电池核心技术。

⚙️ 共享算法、算力和实验数据,攻克快充、寿命和安全等关键问题。

🚀 加速电池迭代周期,促进新材料和新配方的发现,推动行业技术进步。

11、马斯克驳斥 xAI 巨额亏损传闻:每月烧钱10亿美元纯属无稽之谈

xAI 被曝每月烧钱10亿美元,马斯克否认并称这是谣言。xAI 正寻求93亿美元融资,预计全年亏损130亿美元,但马斯克对其未来盈利抱有信心。

【AiBase提要:】

🌟 xAI 每月烧钱10亿美元的传闻被马斯克否认,认为是无稽之谈。

💰 xAI 正寻求93亿美元融资以弥补资金缺口,预计全年亏损达130亿美元。

🚀 尽管面临巨额亏损,马斯克对 xAI 的未来发展充满信心,目标是在2027年实现盈利。

举报

  • 相关推荐
  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • OpenAI奥特曼:GPT5预计今年夏季发布

    OpenAI创始人奥特曼在最新播客中透露,GPT-5预计今夏发布,具体日期未定。 GPT-5将是生成式AI能力的重大升级,《商业内幕》称其远超GPT-4,早期测试者认可进步显著。 GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。上月初,奥特曼发文向GPT-4告别。 目前GPT-4o已经完全替代了GPT-4,前者于2024年5月14日发布,其中o”代表omni”,意为 全能”。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。