首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

2025-06-18 16:13 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Cursor Pro取消500次请求限制,开启无限使用新篇章

我作为一名开发者,非常高兴看到Cursor Pro取消了每月500次快速请求的限制,这无疑大大提升了开发效率。不过,我也关注到速率限制可能带来的影响,建议大家根据自身需求合理规划使用。

image.png

【AiBase提要:】

🎉 Cursor Pro计划取消500次快速请求限制,推出‘无限使用’模式。

💼 推出全新Ultra计划,月费200美元,提供相当于Pro计划20倍的模型使用量。

📊 Anysphere估值达99亿美元,年化收入超5亿美元,巩固市场领先地位。

2、稀宇科技MiniMax推出视频生成模型Hailuo02

稀宇科技推出全新视频生成模型Hailuo02,其基于Noise-aware Compute Redistribution架构,在复杂场景处理和创作质量提升方面表现优异,大幅降低视频创作门槛。

image.png

【AiBase提要:】

✨ Hailuo02是唯一能高效处理复杂场景如体操动作的模型,已助力创作者生成超3.7亿个视频。

⚙️ NCR架构让模型训练和推理效率提升2.5倍,参数量扩大3倍,支持更大规模数据拟合。

🎥 支持1080p视频生成,性价比高,已在多个平台更新并提供多种分辨率选项。

详情链接:https://hailuoai.com/create

3、谷歌发布超强AI模型 Gemini2.5Flash-Lite:推理速度更快、成本更低!

谷歌推出Gemini2.5Flash-Lite,这是其系列中最轻量化、最具成本效益的AI模型,具备快速推理、低延迟的特点,适合多种应用场景,包括实时翻译和高吞吐量分类任务。

image.png

【AiBase提要:】

⚡️Gemini2.5Flash-Lite推理速度快,延迟低,适合实时翻译和高吞吐量分类任务。

🔍支持超长上下文处理,达到100万token,灵活性强,适合复杂系统开发。

🌐集成于Google AI Studio、Vertex AI平台及谷歌搜索,助力开发者高效工作。

4、科大讯飞再发力!全新星火X1升级版将于7月重磅上线!

科大讯飞即将发布星火X1升级版,预计7月上线。该版本在性能、用户体验以及市场布局上均有显著提升,展现了科大讯飞在智能语音领域的持续创新能力。

【AiBase提要:】

🌟 星火X1升级版将于7月发布,性能全面提升,提供更流畅和智能的使用体验。

🌐 科大讯飞与多家企业合作,加速市场拓展,彰显其在数字经济中的领先地位。

💻 用户界面和交互体验显著改善,带来更高效便捷的应用体验。

5、腾讯元宝推出 AI 编程模式,实现实时代码生成与预览

腾讯元宝上线全新AI编程模式,通过双栏界面实时生成代码并预览效果,支持多语言在线运行,降低学习门槛,特别适合教育和亲子场景。

image.png

【AiBase提要:】

🌟 用户可通过双栏界面实时生成和预览代码,提升开发效率。

🚀 支持多种编程语言在线运行,无需配置环境,简化操作流程。

👨‍👩‍👧‍👦 功能适合教育和亲子场景,激发创造力与编程兴趣。

6、OpenAI 宣布 GPT-4.5将在 API 中下线,开发者感到困惑与失落

OpenAI计划在2025年7月14日从API中移除GPT-4.5预览版,这对依赖该模型的开发者造成了重大影响。尽管如此,GPT-4.5仍可供ChatGPT个人用户使用,且OpenAI建议开发者转向GPT-4.1或其他模型。

image.png

【AiBase提要:】

📅 OpenAI将于2025年7月14日从API中下线GPT-4.5预览版,这是开发者需要尽快适应的重要变化。

🤖 虽然GPT-4.5不再支持API使用,但它仍可作为ChatGPT个人用户的工具,提供持续的服务。

🔄 OpenAI鼓励开发者迁移到GPT-4.1或其他替代模型,以确保业务连续性并降低运营成本。

7、苹果新Speech API转录速度惊人,胜过OpenAI Whisper55%

苹果新推出的Speech API在转录速度上表现出色,仅用45秒就完成了对一段34分钟4K视频的转录,远超其他工具如OpenAI的Whisper。这项技术的优势不仅体现在速度上,还在于其本地化运算能力,使得多段视频处理效率更高。

image.png

【AiBase提要:】

🌟 苹果新Speech API转录34分钟4K视频仅需45秒,速度超越竞争对手。

⏱️ 与OpenAI Whisper相比,苹果技术提升了约55%的效率,表现显著。

📈 本地化运算优势使Yap在多段视频处理上效率更高,为用户节省大量时间。

8、百度首推双数字人互动直播间,文心大模型4.5T驱动多模态技术新突破

本文介绍了百度推出的全球首个双数字人互动直播间,基于文心大模型4.5T,展示了多模态技术的突破性进展,对直播行业及内容创作生态产生了深远影响。

【AiBase提要:】

🌟 文心大模型4.5T实现多模态联合建模,大幅提升数字人交互体验。

🌐 双数字人直播间助力电商、教育等领域内容创作,降低成本并提升多样性。

🤝 开源计划推动多模态AI技术普及,助力中小企业和开发者创新应用。

9、OpenAI CEO揭露Meta 曾试图以1亿美元挖OpenAI 人才最终失败

Meta 曾向 OpenAI 和谷歌 DeepMind 的顶尖 AI 研究人员提出高额薪酬挖角,但未能成功。OpenAI CEO Sam Altman 认为,OpenAI 的创新文化和 AGI 发展前景吸引了优秀员工。同时,OpenAI 正在研发基于 AI 的社交媒体应用,与 Meta 展开竞争。

【AiBase提要:】

📌 Meta 向 OpenAI 提出高额挖角报价,但未能成功招揽优秀员工。

💼 Sam Altman 认为 OpenAI 员工更看重公司的创新文化和 AGI 发展前景。

🤖 OpenAI 正在研发基于 AI 的社交媒体应用,试图在社交网络领域与 Meta 竞争。

10、告别“AI感”!Krea1公测开放,超现实纹理与细节、多样化艺术风格

Krea AI推出的首款图像生成模型Krea1公测版已开放,解决了传统AI图像生成的“AI感”问题,提供超现实纹理、多样化风格及个性化定制支持,同时具备实时编辑功能。

【AiBase提要:】

✨超现实纹理与细节:支持1.5K原生分辨率,最高可达4K超高清,展现细腻纹理与逼真材质。

🎨多样化艺术风格:精准理解复杂艺术风格需求,避免千篇一律的“AI图像”输出。

🌟个性化定制支持:允许上传参考图像或数据集,实时调整生成结果,增强创作者控制力。

11、特斯拉Grok车载 AI 助手即将上线,个性化定制让驾驶更有趣

特斯拉的Grok车载AI助手预计为车主带来全新智能体验,具备互动性且支持个性化定制,包括不同‘个性’版本及儿童模式,但目前仅限AMD芯片车型。随着Robotaxi平台推进,Grok的重要性愈发凸显。

【AiBase提要:】

🚗 Grok车载AI助手将打破人与车的传统界限,提供丰富交流方式,如问答及个性化定制。

👨‍👩‍👧‍👦 支持多种个性化选项,例如不同性格版本及儿童模式,适合家庭用户。

🔄 仅限AMD芯片车型,新车型将享受更强智能科技,推动车载AI技术成熟。

12、谷歌Gemini重磅升级!视频上传与分析功能正式上线

谷歌正式推出Gemini2.5Pro和Flash版本,全面开放给用户,并新增视频上传与分析功能,支持安卓和网页端,增强视频处理能力。

【AiBase提要:】

🌟Gemini新增视频上传与分析功能,可在安卓和网页端轻松上传视频进行内容分析。

🎥Gemini能全面分析视频内容,包括概述、查找片段或物品,并展示相关片段,提升视频处理效率。

🏆Gemini在视频分析领域超越ChatGPT,提供更便捷的使用体验,巩固市场竞争力。

举报

  • 相关推荐
  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 分析师称MacBook Pro将升级OLED屏:Mini LED退场

    Omdia分析师Linda Lin在一份研究报告中重申,首批搭载OLED屏幕的MacBook将于2026年问世。 尽管她未特别提及MacBook Pro,但业界普遍认为,OLED屏将率先在高端MacBook Pro上首发,随后才会应用到价格更低的MacBook Air系列上。 当前MacBook Pro使用的是Mini LED屏,这块屏升级了液晶层背光,把背光中的LED灯小型化,本质上仍然是LCD屏幕,每个LED灯珠尺寸约在50-200um之间,让背光层拥有更多的背�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。