首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

2025-06-19 16:08 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Midjourney推首个视频生成模型V1:最长支持21秒,每月10美元

Midjourney发布了其首个AI视频生成模型V1,主打图像到视频转换功能,支持多种动态模式和文本提示定制,定价亲民且操作简便,但面临版权争议和技术优化空间。

【AiBase提要:】

🌟 主打图像到视频转换功能,支持多种动态模式和文本提示定制。

💰 定价亲民,最低每月10美元即可体验视频生成功能。

⚠️ 面临版权争议,技术仍有优化空间,如高动态场景的轻微闪烁问题。

2、OpenAI CEO表示:GPT-5将在今年夏季发布

本文详细介绍了OpenAI的发展动态,包括GPT-5的发布时间、与微软的合作调整以及在国防领域的突破性进展,展现了OpenAI在人工智能领域的持续领先地位。

【AiBase提要:】

🚀 OpenAI CEO确认GPT-5将在今年夏季发布,行业热切期待。

💰 OpenAI计划重新谈判与微软的合作协议,增强自身市场独立性。

🛡️ OpenAI与美国国防部签署2亿美元合同,标志其在国防领域的崛起。

3、Google Search Live重磅上线!语音对话搜索革新体验,AI助手随时待命!

Google推出的Search Live语音搜索功能,基于AI Mode,允许用户通过语音与搜索引擎进行实时对话,提供无缝交互体验。

【AiBase提要:】

✨ 实时语音对话:通过语音提问并获得AI生成的语音回答,支持连续追问。

🌐 网页链接辅助:每次回答附带相关链接,确保信息透明可信。

🌟 技术融合:结合Gemini模型与Astra技术,处理复杂语音输入并生成自然连贯回答。

4、OpenAI 推出开源客户服务代理框架,助力企业智能化转型

我了解到OpenAI发布了开源的客户服务代理示例,这让我感到非常兴奋。这个示例不仅展示了如何构建智能AI代理,还提供了详细的防护措施和实际应用案例。通过这个框架,企业可以更轻松地实现客户服务的自动化,提高效率并降低成本。

【AiBase提要:】

🚀 使用OpenAI代理SDK构建智能、工作流意识强的AI代理,支持多种业务场景。

🔒 设定安全和相关性防护措施,确保系统安全稳定运行。

📖 提供Python后端和Next.js前端,展示多代理协作及防护机制的实际应用。

5、MiniMax Agent重磅发布!从‘给我代码’到‘告诉我需求’,AI智能代理革新工作流!

MiniMax Agent是一款专为解决长期复杂任务设计的智能代理,具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。它通过深度理解用户需求,自动完成任务规划与执行,让用户专注于更高价值的创意与决策。

image.png

【AiBase提要:】

✨ 核心亮点:多场景赋能,包括编程、多模态理解和无缝MCP集成,满足个人及企业级团队需求。

💻 功能优势:从繁琐代码中解放,通过需求理解实现高效任务规划与执行。

🌟 行业影响:智能代理引领未来,重塑生产力工具格局,推动智能化、自动化发展。

6、恶意工具WormGPT 新变种重现江湖,使用Mistral AI和Grok模型编写恶意代码

近日,Cato Network发现两款基于Grok和Mixtral的新版WormGPT,这些工具能帮助网络犯罪分子生成钓鱼邮件、恶意代码及规避AI安全防护。这表明网络犯罪正利用先进AI技术升级作案手段。

【AiBase提要:】

⚠️ 新版本WormGPT基于Grok和Mixtral模型,专用于网络犯罪活动。

🔒 这些工具能绕过AI平台的伦理防护,生成恶意脚本和窃取凭证。

🛡️ 网络安全专家呼吁加强防御策略,如提升威胁检测与响应能力。

7、OpenAI 重磅推出 ChatGPT 企业版折扣,折扣幅度从10%到20%

OpenAI 推出 ChatGPT 企业版折扣,吸引企业用户,降低使用成本,预计到2030年企业客户年收入可达150亿美元。

【AiBase提要:】

🚀 OpenAI 提供企业版 ChatGPT 折扣,幅度10%-20%,助力企业降本增效。

🌟 ChatGPT 作为对话生成工具,被广泛采用,推动 AI 技术普及。

📈 到2030年,企业客户年收入有望达到150亿美元,显示 AI 市场巨大潜力。

8、DeepSite V2升级!支持DeepSeek-R1-0528模型,轻松生成3D网页动画,零代码也能玩转创意!

DeepSite V2通过集成DeepSeek-R1-0528模型,大幅提升了代码生成能力和实时预览体验,使用户仅需简单描述即可生成复杂网页代码,包括HTML、CSS和JavaScript,适用于开发者和非专业人士。

image.png

【AiBase提要:】

🚀 支持自然语言生成复杂代码,如3D动画,仅需输入描述即可秒级生成可运行代码。

🌐 实时预览与调整功能让用户即时查看效果并优化结果,确保输出符合预期。

🌱 完全开源免费,支持多模态任务,涵盖网页、游戏、特效及3D交互内容,降低开发门槛。

详情链接:https://deepsite.hf.co/projects/new

9、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线,自动生成专业报告,效率翻倍!

Office-PowerPoint-MCP-Server是一款基于Model Context Protocol(MCP)的开源工具,通过AI助力用户快速创建和编辑PPT演示文稿,提供从零开始生成全新PPT到对现有文件进行精细化修改的多项功能。

image.png

【AiBase提要:】

🌟 支持从零创建全新PPT或编辑现有文件,覆盖幻灯片管理、内容填充和数据可视化等多功能。

📊 无缝集成AI助手,通过自然语言指令或代码批量生成PPT,大幅提升企业报告生成效率。

🌐 开源特性允许开发者定制功能,如集成图像生成模型或与外部数据源连接,拓展应用场景。

详情链接:https://github.com/GongRzhe/Office-PowerPoint-MCP-Server

10、比亚迪与字节跳动携手用AI开发动力电池关键技术

比亚迪与字节跳动合作共建‘AI + 高通量联合实验室’,利用AI技术推动动力电池发展,解决快充、寿命和安全等技术难题,加速电池迭代周期,为新能源汽车行业注入新动力。

【AiBase提要:】

🌟 比亚迪与字节跳动共建联合实验室,研发动力电池核心技术。

⚙️ 共享算法、算力和实验数据,攻克快充、寿命和安全等关键问题。

🚀 加速电池迭代周期,促进新材料和新配方的发现,推动行业技术进步。

11、马斯克驳斥 xAI 巨额亏损传闻:每月烧钱10亿美元纯属无稽之谈

xAI 被曝每月烧钱10亿美元,马斯克否认并称这是谣言。xAI 正寻求93亿美元融资,预计全年亏损130亿美元,但马斯克对其未来盈利抱有信心。

【AiBase提要:】

🌟 xAI 每月烧钱10亿美元的传闻被马斯克否认,认为是无稽之谈。

💰 xAI 正寻求93亿美元融资以弥补资金缺口,预计全年亏损达130亿美元。

🚀 尽管面临巨额亏损,马斯克对 xAI 的未来发展充满信心,目标是在2027年实现盈利。

举报

  • 相关推荐
  • 昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题

    浙江大学朱凌霄团队基于昇腾AI平台,研发出首个无需训练的长序列视觉指令生成框架LIGER,解决了视频生成领域长期存在的时序一致性难题。该技术通过历史提示和视觉记忆机制保持内容连贯性,并采用基于DDIM反演的记忆校准技术提升准确性。团队还提出引导式渐进蒸馏方法,在保持视频质量基础上实现8倍加速。研究成果入选ICLR2025,构建了包含569个任务的评估数据集。未来将深化多模态生成技术研究,构建自主创新的技术生态体系。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • AI日报:Kimi K2 高速版发布;美图WHEE上线视频超清功能;字节发布新模型Seed Diffusion Preview

    【AI日报】今日AI领域重要动态:1)美图WHEE推出"视频超清"功能,通过AI技术提升视频画质;2)Kimi K2高速版发布,输出速度提升至每秒40 Tokens;3)通义千问开源编程模型Qwen3-Coder-Flash,支持大规模上下文理解;4)Anthropic企业AI市场份额升至32%,超越OpenAI;5)字节跳动发布实验性扩散语言模型Seed Diffusion;6)马斯克将为Grok用户推出视频生成器Imagine和AI虚拟男友;7)Quora的Poe平台推出开发者API;8)Black Forest Labs开源图像生成模型FLUX.1-Krea;9)Augment推出CLI工具Auggie优化开发流程;10)清华开源AI语音模型MOSS-TTSD;11)Claude升级支持多格式文件上传。

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • 首超长视频,只是红果的起点

    红果,又一次创造历史。 Questmobile的数据显示,抖音集团旗下免费短剧APP红果2025年6月的月活达到2.1亿,同比增长179%,并超过2亿月活的优酷。 这意味着,短剧APP第一次超越长视频APP。 近年来,“爱优腾”对短剧的态度有了微妙的变化,从“长短之争”的剑拔弩张演化为“取长补短”的协同联动,却依然无法阻拦红果。 毋庸置疑,红果正走在高歌猛进的道路上。

  • 阿里开源通义万相2.2:可生成电影级高清视频

    阿里云宣布旗下通义万相2.2模型正式开源。 通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。 这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。 此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-