首页 > AI头条  > 正文

小米开源3090亿参数MiMo-V2-Flash大模型,推理速度碾压主流竞品,API低至0.1美元/百万Token

2025-12-17 08:56 · 来源: AIbase基地

小米正式进军高性能开源大模型赛道。近日,公司发布了全新基础语言模型 MiMo-V2-Flash,并同步以 MIT协议全面开源 模型权重与推理代码。该模型以“超高速、高效率”为核心卖点,在推理、代码生成与智能体任务中表现尤为突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,引发开发者社区广泛关注。

image.png

MiMo-V2-Flash采用稀疏激活架构,总参数量高达3090亿,但每次推理仅激活150亿参数,在保持强大能力的同时显著降低计算开销。这一设计使其在多项公开基准测试中稳居开源模型第一梯队,兼顾性能与成本效率。

网友实测反馈显示,MiMo-V2-Flash的响应速度“快得令人意外”——在相同硬件环境下,其生成延迟明显低于DeepSeek等竞品,尤其在多轮对话与复杂逻辑推理场景中优势更为显著。有开发者评价:“不是快一点,是快一个量级。”

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSeek快

为加速生态落地,小米同步推出极具竞争力的API定价:每百万输入Token仅0.1美元,输出Token0.3美元,并提供限时免费试用。这一价格远低于主流商业模型,为中小企业和独立开发者提供了高性价比的替代方案。

值得注意的是,MiMo-V2-Flash并非仅面向开发者,其通用能力也适配日常AI助手场景,可无缝集成至手机、智能家居、车载系统等小米“人车家全生态”终端。就在模型发布当天,小米将举办 人车家全生态合作伙伴大会,预计将进一步披露MiMo-V2-Flash在端云协同、设备端部署及多模态扩展等方面的深度应用规划。

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSeek快

在国产大模型竞争白热化的当下,小米选择以“高性能+真开源+低门槛”组合拳切入,不仅彰显其AI战略的长期决心,更可能重塑开源模型的性能与成本预期。当3090亿参数的巨模型也能“快如闪电”,大模型的竞技场,又多了一位不容忽视的重量级玩家。

  • 相关推荐
  • 全面开源 小米宣布自研大模型MiMo公测限免延长20天

    12月中旬,小米正式发布并开源自研大模型MiMo-V2-Flash。 今日,MiMo小米大模型Core团队宣布,原定于2025年12月底结束的免费试用期,将延后至2026年1月20日14:00。 在此期间,用户可继续免费使用MiMo-V2-Flash模型API,使用其核心功能,包括高效文本生成、代码处理等。 官方表示,MiMo API开放平台的支付能力系统将于公测结束前启用,并进行为期一周左右的试运行。 试用期间用户可�

  • 昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA

    北京大学张牧涵团队提出TransMLA转化框架,实现无需重训即可将主流大模型(如LLaMA、Qwen)从GQA架构迁移至MLA架构。该框架通过四大核心技术模块解决迁移痛点:结构映射、RoRoPE位置编码适配、频率折叠融合及KV矩阵均衡化,在昇腾算力支持下,成功在LLaMA-2-7B上裁剪68.75%的KV缓存,仅轻微性能损失。昇腾硬件的高效并行架构与存储优化体系为技术落地提供关键支撑,推动TransMLA集成至高性能推理框架生态,大幅降低企业升级成本,为长上下文推理提供自主算力解决方案。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • 今夕何年?背单词App冲上美国总榜,月入百万美元?

    前几天,我们曾在《教“美国人”学英语,单款产品月入千万?》观察过一个“反常识”的产品教美国人学英语,月入260万美元。 这还没过一周时间,又有一款面向美国市场的语言学习产品,冲上了美国下载总榜 Top100。

  • 苹果谷歌官宣合作:新一代Siri选定使用Gemini大模型

    苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。

  • 直击新手痛点!佳能PowerShot V1评测:画质碾压手机、操作一键搞定

    佳能PowerShot V1定位为“新手Vlog神器”,兼顾专业画质与便携机身。它搭载约1.4英寸CMOS传感器,支持4K录制,画质超越手机。内置可调三档转速的冷却风扇,解决长时间拍摄过热问题。智能功能丰富,如“高级A+”模式可自动识别场景并调整参数,内置多种创意滤镜实现“滤镜直出”。机身小巧轻便,重量仅约426克,适合旅行携带。针对短视频带货场景,设有“特写演示用短片”模式,可智能切换商品与人物对焦。官方指导价具竞争力,结合优惠后实际入手价格在6000元以内,并常附赠Vlog套装等实用配件,为新手提供一站式创作解决方案。

  • 苹果新一代Siri要来了!选定谷歌Gemini大模型提供支持

    苹果将与谷歌合作,为今年晚些时候推出的产品功能(如Siri)提供人工智能支持。 谷歌将通过Gemini模型和云技术,为苹果未来的基础模型提供动力。 苹果在声明中表示:经过仔细评估,我们认为谷歌的技术为苹果基础模型提供了最强大的基础,我们对它将为用户带来的创新体验感到兴奋。” 据悉,苹果拟每年支付谷歌约10亿美元,获取定制化Gemini模型使用权,核心版本为1.

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • 太壕了!莉莉丝年会奖品出炉:特等奖30g金条、一等奖RTX 5090

    进入2026年,各大公司陆续开启年会模式,相比总结业绩、规划未来,年会抽奖无疑是最让员工期待的环节。 日前,莉莉丝游戏公布2026年年会奖品清单,奖品阵容十分壕”,且全员100%中奖,引发网友热议。 具体来看,特等奖为30g定制金条,共准备5根,按当前金价计算,单根价值接近3万元。 一等奖为RTX 509032G显卡,二等奖至四等奖分别为iPhone 17 Pro Max、iPhone 17 Pro、iPhone 17,�

今日大家都在搜的词: