首页 > 业界 > 关键词  > 多模态模型最新资讯  > 正文

Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生

2025-01-21 15:38 · 稿源: 新智元公众号

【新智元导读】来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。还记得吗,AI大神Karpathy曾说过,「英文是最热门的编程语言」。两年后的现在,这个规则彻底要被颠覆了。从今天起,中文很有可能成为全球最热门

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • MiroMind 破局:在大语言模型的夹缝中,陈天桥在造什么?

    本文阐述了陈天桥创立的MiroMind在AI领域的独特路径。文章将当前主流AI分为“文科模型”(如OpenAI,侧重语言生成与模拟)和“理科模型”(MiroMind追求的方向,强调因果推理与可验证性)。MiroMind反对单纯追求“行为主义”(图灵测试)或“功能主义”(替代工作),提出构建“通用推理引擎”的新定位。其核心是放弃“全知全能”幻想,承认模型会出错,通过引入“自我纠错”机制和外部反馈闭环来生存。目标不是聊天机器人,而是“可审计、可验证的通用问题求解器”,瞄准科研、工业等高容错门槛的B端“深水区”。文章以BrowseComp案例说明,小参数模型通过Agent交互可战胜更大模型,证明了推理能力可通过架构创新实现。最终,作者将理想的AGI比作一把精准剔除谬误的“手术刀”,而非无所不知的“神”。

  • AI日报:腾讯混元图像3.0正式开源;Clawdbot迫于压力更名Moltbot;月之暗面发布 Kimi Code

    本期AI日报聚焦多领域AI新动态:腾讯混元图像3.0开源,成为全球最强开源图生图模型;月之暗面发布Kimi Code,推动国产AI编程工具进入新阶段;开源项目Clawdbot因商标风险更名Moltbot,并遭诈骗者利用旧账号发布虚假代币;谷歌AI Plus计划正式扩展至美国等35个市场,月费不足8美元;OpenAI发布基于GPT-5.2的科研协作平台Prism;谷歌Aluminum OS界面首曝,深度融合Android与ChromeOS;Mistral AI发布终端编程助手Vibe 2.0,步入“子代理”时代;小米AI眼镜深度集成支付宝,实现停车缴费与健康管理“无感交互”。

  • AI日报:Kimi K2.5上线;阿里发布推理模型Qwen3-Max-Thinking;Claude 深度集成 Slack 等办公神器

    本期AI日报聚焦多款AI产品更新:Kimi K2.5上线,视觉与工具调用功能升级;腾讯搜狗输入法20.0版本全面AI化;阿里发布万亿参数Qwen3-Max-Thinking模型,性能对标国际顶尖;阿里健康AI应用“氢离子”新增动态证据定位功能;百度文心APP开启“多人多Agent”群聊内测;千问PC和网页端上线国内最强推理模型;Anthropic推出交互式应用,深度集成办公工具;蚂蚁灵波开源空间感知模型LingBot

  • 星辰智能体平台全新升级:构建全栈多模交互能力,赋能企业智能化转型

    星尘智能体平台升级版正式发布,推动智能体从“参数竞赛”迈向“应用落地”。平台以感知物理世界、理解复杂上下文、多模态自然沟通为核心,整合语音、视觉、运动与执行的全栈解决方案,助力智能体从“单点工具”升级为具备五官、手脚与个性的企业级“数字合伙人”。此次升级率先打通星尘智能体平台与AIUI平台,破解行业普遍存在的响应延迟、语义割裂、系统状态不同步等痛点,简化智能体与硬件设备的对接流程,改变传统研发中多接口并行对接、周期冗长的困境。企业可实现智能体一键接入语音交互,在AIUI“听懂指令、理解意图、执行动作、语音反馈”的基础上,叠加个性化交互能力与多模态感知输出,极速适配机器人、智能穿戴等各类硬件,快速落地工业、家庭、消费等多元业务场景,以更低的人力与时间成本,实现交互效率与效果的双重提升。

  • Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5

    国产开源大模型即将迎来新一波升级,除了万众期待的DeepSeek V4之外,月之暗面的Kimi也开始招募测试人员了,意味着很快也会上线。 根据Kimi的公告,他们即将开启Kimi新模型API内测计划,已完成「企业认证」的 Kimi 开放平台用户,均可申请。 前不久智谱、Minimax发布新一代模型之前都有招募测试的操作,而且内测没多久就开放了大模型的公开访问及API,随后又进一步开源给社�

  • 影视飓风Tim回应字节Seedance 2.0模型:能力太恐怖

    知名视频博主Tim深度评测字节跳动AI视频模型Seedance2.0,盛赞其视频生成精细度、运镜流畅性及音画匹配度,称其可能“改变视频行业”。但他在测试中发现“恐怖”细节:仅上传个人照片,系统便自动生成高度相似的声音并匹配语气;上传建筑正面照后,模型竟能生成建筑背面的运镜,仿佛“知道”背后景象。Seedance2.0采用双分支扩散变换器架构,能同时生成视频与音频,用户上传图片或提示即可在60秒内生成带原生音频的多镜头序列视频。

  • 百度发布文心大模型5.0正式版:2.4万亿参数 原生全模态建模

    今日,百度文心Moment”大会在上海召开。 大会现场,百度正式发布了文心大模型5.0正式版。 据介绍,该模型基于原生全模态建模,拥有2.4万亿参数,支持文本、图像、音频、视频等多种信息理解输出。 目前,文心5.0正式版可在百度千帆平台调用,文心一言官网、百度慧播星及文心助手等其他百度AI产品也已接入。 此前,文心5.0以1460分位列LMArena文本榜国内第一、全球第八�

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • AI日报:MiniMax Music 2.5 发布;蚂蚁灵波开源世界模型LingBot-World;谷歌 Gemini 3.5 泄露

    本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。

  • ChatGPT周活跃用户已超8亿!OpenAI即将推出升级版聊天模型

    近日,OpenAI首席执行官奥尔特曼正向员工和投资者表示,公司的发展势头依旧向好。 一份内部Slack通讯消息显示,奥尔特曼于上周五向OpenAI员工透露,ChatGPT月度增长率重回10%以上。 ChatGPT的周活跃用户虽然已超8亿,但谷歌和Anthropic的市场份额正持续提升。 他还表示,OpenAI还将推出一款升级后的聊天模型”。

今日大家都在搜的词: