首页 > 业界 > 关键词  > AI大模型最新资讯  > 正文

Kimi开源底层推理框架,1小时GitHub揽星1.2k

2024-11-29 17:52 · 稿源: 量子位公众号

什么?Kimi底层推理架构刚刚宣布:开!源!了!你没听错,就是那个承载了Kimi线上80%以上流量的架构。大约几小时前,月之暗面Kimi联合清华大学等机构,开源了大模型推理架构Mooncake。根据官方介绍,本次开源将采用分阶段的方式:逐步开源高性能KVCache多级缓存Mooncake Store的实现,同

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • 讯飞智能臂筒式血压计发布:AI大模型赋能,家庭血压监测迈入智慧时代

    4月2日,科大讯飞旗下讯飞医疗发布首款搭载讯飞医疗星火大模型的智能血压计——讯飞智能臂筒式血压计。产品包含X3、X5、X7三款型号,主打双模精准测量、AI语音交互、远程数据同步等核心功能。这标志着家庭血压监测行业正从“单点测量”迈入“智慧管理”新阶段。该产品以星火医疗大模型为核心,依托语音交互、数据解读、趋势分析、健康指导的全链路能力,重构家用血压管理体验,让居家测量也能拥有与医院同等专业、可信的结果。讯飞智能臂筒式血压计预售首发优惠价格:X3首发价349元,X5首发价699元,X7首发价999元。

  • 当健康产业换上“AI操作系统”:2026西普会发布年度主题,大模型进入垂直产业深水区

    从“通用大模型”到“产业智能体”,健康产业正在成为AI技术落地的最大试验场之一。4月9日,第十九届西普会主题正式发布——“走进AI时代:健康产业的范式革命与路径选择”,大会定于8月11日至16日在海南博鳌举行。对于AI科技圈的从业者而言,这个主题的价值不在于它提到了AI,而在于它释放了一个信号:健康产业正在将AI视为底层操作系统,而不是一个提效工具。 这意味

  • 悠然远智大模型服务平台正式上线:首发行业级AI视觉智能体

    考拉悠然发布“悠然远智”大模型服务平台,实现AI视觉智能体“定义即运行”。该平台基于全栈自研多模态大模型,让业务人员通过自然语言指令即可定义、创建并驱动具备专业理解与执行能力的AI智能体,将事件检测算法上线周期从“数周”缩短至“分钟级”。平台提供三种开箱即用的智能体工作模式,覆盖审核、增强与检测等场景,支持零样本视觉推理,无需标注数据与模型训练即可直接分析视频流,输出结构化判断结果,形成“感知-理解-决策”的完整执行闭环。

  • 最强游戏小钢炮!红魔游戏平板5 Pro关键配置曝光:骁龙8E5、内置豆包大模型

    红魔游戏平板5 Pro已官宣即将登场,不过具体发布时间尚未公布。 随着预热推进,新机核心配置逐步浮出水面。 今日,博主数码闲聊站”曝光红魔游戏平板5 Pro最新工程机核心配置,新机将配备一块9英寸OLED屏幕,分辨率为2400*1504,支持185Hz超高刷新率。 相较于LCD屏幕,OLED屏会在亮度、刷新率、对比度、色准、屏占比等各方面都明显领先。

  • 谷歌发布Gemma 4大模型:31B登顶开源第三!手机可离线运行

    今天凌晨,谷歌DeepMind正式推出新一代开源大模型Gemma 4,该模型与谷歌闭源旗舰Gemini共享底层技术,也是时隔一年对Gemma 3的重大升级。 此次谷歌一改此前自有协议,采用Apache 2.0商业友好型许可证开源,开发者可无门槛自由修改、分发和商用。 一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身Arena

  • 字节跳动发布全双工语音大模型Seeduplex!豆包率先接入:打电话可边听边讲

    字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。 目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。 Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破: 精准抗干扰:

  • 全球首个影视行业大模型!PixVerse C1发布:最高1080P、15秒直出

    爱诗科技正式推出PixVerse C1,这是全球首个影视行业大模型,主打专业级视频生成,最高可直接输出1080P、15秒视频,还能做到音画同步、自动分镜,普通人也能快速做出影视级短片。 C1支持文生、图生、参考生成、首尾帧控制多种方式,不用复杂操作,按提示词就能自动完成分镜和剪辑,把创意一步变成成片。 多宫格分镜图可以直接转成连贯视频,自带专业镜头感,省去大�

  • 小米大模型新里程碑!雷军宣布好消息:MiMo调用量超过1万亿Token

    小米CEO雷军4月3日发文宣布,其大模型MiMo单日调用量突破1万亿Token,创下新里程碑。小米自去年4月开源首个推理大模型Xiaomi MiMo,12月发布并开源自研模型MiMo-V2-Flash,今年3月推出面向Agent时代的旗舰基座模型MiMo-V2-Pro。该模型总参数量突破1T,激活参数达420亿,较前代扩大约3倍,支持1M超长上下文,在多项基准评测中表现优异,其Coding Agent、通用Agent和Tool Use能力与Claude Sonnet 4.6、GPT-5.2、Gemini 3.0 Pro处于同一梯队。

  • AI日报:腾讯研发新AI产品探梦DreamNow;MiniMax 2.7 确认本周开源;千问3.6Plus登顶OpenRouter 全球大模型调用榜

    本期AI日报聚焦多领域进展:腾讯推出AI互动影游平台“探梦DreamNow”,降低创作门槛;阿里千问3.6 Plus单日调用量破万亿Token,登顶全球模型调用榜;谷歌发布离线AI听写应用Eloquent,保障数据安全;国产模型MiniMax 2.7确认开源,降低成本提升可用性;宇树科技移动机器人专利获授权,简化感知架构;专业动画工具OiiOii上线,AI赋能动画制作;通义千问上线财经分析模块,接入实时行情与财报;前迪士尼工程师与Midjourney打造仿生机器人Éloi,探索情感交互。

今日大家都在搜的词: