首页 > AI头条  > 正文

Kimi开放平台宣布价格调整:模型推理服务与上下文缓存双双降价

2025-04-07 16:13 · 来源: AIbase基地

4月7日,Kimi开放平台正式发布公告,宣布基于Moonshot AI一年来的技术积累和性能优化,对平台提供的模型推理服务价格进行调整,同时大幅下调上下文缓存价格。这一举措标志着Kimi开放平台在提升技术能力的同时,进一步优化用户体验,推动人工智能服务的普及与应用。

据Kimi开放平台官方介绍,此次价格调整得益于Moonshot AI在过去一年中在模型训练、推理加速及资源利用率优化方面的显著突破。通过持续的技术迭代,平台不仅提升了模型的处理效率和性能,还降低了运营成本。官方表示,这些成果让Kimi有能力将更多实惠回馈给用户,进一步降低企业与开发者接入大模型服务的门槛。

QQ20250407-161111.png

从调整内容来看,模型推理服务的价格普遍下调,降幅根据不同模型规格和使用场景有所差异。与此同时,上下文缓存价格也迎来显著下调,这一调整尤为引人注目,因为Kimi平台以超长上下文处理能力著称,此举将进一步提升用户在处理长文本任务时的成本效益。

Kimi开放平台自推出以来,以支持超长上下文输入(最高达200万字)为核心竞争力,广泛应用于文档分析、文献综述、代码复现等场景。此次上下文缓存价格的下调,意味着用户在处理复杂任务时将享受更低的成本。例如,对于需要频繁调用长文本数据的企业用户或开发者来说,这不仅能减少费用支出,还能提升开发效率。

一位长期使用Kimi API的开发者表示:“上下文缓存价格下调对我们来说是个大利好。之前处理大篇幅文档时成本较高,现在可以用更低的预算完成更多任务,性价比大幅提升。

  • 相关推荐
  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

    Kimi K2的发布几乎没什么预兆。 2025年7月11日深夜,月之暗面直接开源了这个万亿参数模型,整个AI圈子一下子就热闹起来。模型的能力很强,尤其是在代码和Agent任务上,没多久,它就和Grok4一起出现在了马斯克转发的热门模型趋势榜单上。

  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • 模型推理协作正式开启,魔乐社区让模型跑遍“中国芯”

    魔乐社区启动"模型推理适配协作计划",旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式,联合开发者、芯片厂商等生态伙伴,构建从工具链到知识库的全栈支持体系,打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行,提供模型转换工具和优化指南,降低开发门槛。目前已有文心大模型4.5等首批适配成果�

  • 从“五位一体”到AI开放平台,盈米基金是如何布局AI生态的?

    盈米基金在2025亚马逊云科技中国峰会上展示AI战略布局,推出"五位一体"数字化投顾体系。副总裁刘永指出,AI可弥补互联网金融服务在深度交互上的短板,实现"广度"与"深度"结合。盈米已构建三大AI应用场景:1)"且慢AI小顾"智能投顾助手,覆盖75%投顾场景,积累超100万有效用户提问;2)"AI编辑部"人机协同系统,每周产出600篇高质量金融�

  • 电商多平台大商家电商erp价格多少钱

    文章探讨了电商多平台大商家ERP系统的价格差异问题。作者公司在天猫、京东、抖音、拼多多等平台运营,日单量2万,人工表格管理已无法满足需求。调研发现同类ERP报价从3000到30万不等,最终选择了快麦ERP。该系统显著提升了运营效率:库存同步延迟从10分钟降至5秒,超卖损失减少80%;拣货效率提升50%,临时工减少1/3;财务对账时间从3天缩短至半小时。综合节省的人工、赔付和加班费用,远超系统本身价格。作者建议企业选择ERP时要全面核算隐性成本,而非仅比较报价。

  • 最新AI模型哪里看?查找最佳AI模型平台推荐

    文章介绍了AI领域快速迭代背景下,开发者如何高效追踪最新模型动态。主要渠道包括:1)官方渠道(GitHub、公司官网/博客);2)科技媒体和社区(Twitter、Reddit等);3)专业聚合平台(推荐AIbase模型广场)。重点推荐AIbase平台,其优势在于:实时更新全球最新模型、结构化展示关键信息、支持多维筛选排序、直达相关资源链接。建议开发者善用官方渠道获取源头信息,同时�

今日大家都在搜的词: