首页 > 业界 > 关键词  > 多模态模型最新资讯  > 正文

月之暗面推出全新SOTA模型k1.5:可同时处理不同模态信息

2025-01-21 11:14 · 稿源: 快科技

快科技 1 月 21 日报道:据悉,月之暗面公司正式发布其创新成果——k1.5 多模态思考模型,该模型在多模态推理和通用推理能力上取得重大突破。

强大的多模态推理能力:k1.5 模型可同时处理来自文本、图像、声音等不同模态的数据,提供全面而精准的理解和知识。这对于视觉问答、视觉常识推理、视觉语言导航等复杂任务至关重要。

出色的通用推理能力:k1.5 模型能够跨越不同领域和场景,灵活解决复杂问题。无论是代码编写、数学求解,还是难题处理,它都能提供有效的支持。

目前,k1.5 多模态思考模型的预览版已逐步上线 Kimi.com 网站和 Kimi 智能助手 App 最新版本。用户可通过模型切换按钮体验其升级功能。

举报

  • 相关推荐
  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • 科大讯飞AI眼镜开放预约:仅重40克 支持多模态降噪翻译

    科大讯飞近日在世界移动通信大会上发布了一款创新产品讯飞AI眼镜。这款专为跨语言交流设计的智能设备重量仅40克,目前产品已开启预约通道。 虽然具体售价和正式发售日期尚未公布,但官方透露提前预约可享受299元抵扣优惠。 这款眼镜突破了传统翻译设备的形态限制,通过镜片实时投射翻译字幕,并配合内置扬声器输出语音译文。 当对话双方交流时,系统可同步完成�

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • 海尔智家发布行业首个AI+细分岗位能力模型

    随着AI 应用迈入规模化落地的关键阶段,兼具数字化思维与AI 技术能力的复合型人才成为行业发展的刚需。数据显示,2030年全球AI人才缺口预计达500万,中国占比超过40%。基于这一现状,3月5日,海尔智家率先发布了行业首个AI+细分岗位能力模型,涵盖AI产品经理与AI技术开发工程师岗位能力模型。该模型涵盖6大核心能力维度、24项细分能力指标,通过“标准制定—人才培养—�

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑 超越人类

    今日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。 相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、PPT等复杂办公场景中的表现更加出色。 此次更新带来了两个版本:更擅长复杂推理任务的GPT-5.4 Thinking,以及性能更强、面向企业高端需求的GPT-5.4 Pro。 其中,GPT-5.4 Thinking主�

  • 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,在算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致昂贵算力资源的闲置,更直接影响业务响应质量。由此可见,构建高效、稳定的数据供给通道,已成为AI基础设施演进的关键方向。为验证企业级SSD在真实AI�

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • AI日报:美团Tabbit浏览器开启公测;通义发布语音双模型;Notion 引入首个开源权重模型 MiniMax M2.5

    本期AI日报聚焦多领域AI新动态:美团旗下Tabbit浏览器公测,集成多模型AI Agent,实现网页自动化执行;阿里通义发布语音双模型,支持自然语言控制音色与场景;Notion引入开源模型MiniMax M2.5,打破闭源垄断,提升性价比;谷歌升级Flow AI工具,整合视频、绘画与特效功能;阿里巴巴AI品牌统一更名为“千问”,强化战略聚焦;三星宣布2030年迈向“AI工厂”,以Agentic AI驱动全链路自治;OpenAI疑似收购顶级域名GPT.com,巩固品牌地位;北京大学与OceanBase打造LoVR基准,入选WWW 2026,开启全视频智能检索新模式。

今日大家都在搜的词: