开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude

2025-08-01 09:45 · 来源： AIbase基地

【AIbase 报道】近日，一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型（LLM），试图在拥挤的开源AI赛道中突围。不同于传统的参数堆叠策略，这家由前谷歌工程师创立的公司，押注“机器直觉”与自我改进的推理能力，打造出真正能“边用边学”的AI模型。

模型不仅回答问题，更学习“如何回答问题”

Cogito v2系列包括四个模型，参数规模从 70B 到671B 不等，分为密集模型（Dense）和专家混合模型（MoE），均已在 Hugging Face、Together AI 等平台开放使用。旗舰模型 Cogito v2-671B MoE 被称为“思维效率最优”的推理型AI，推理路径比 DeepSeek R1缩短60%，性能却能与 Qwen1.5-72B 和 Claude4Opus 接近甚至超越。

其核心技术在于模型不仅在运行时进行“内省式推理”，更将这些推理路径提炼回模型权重中，形成内化直觉。这一机制，让模型能像 AlphaGo 通过对弈强化策略一样，在每一次推理中“变得更聪明”。

元宇宙科幻赛博朋克绘画 (4)大模型

推理实力实战检验:速度更快，路径更短

Deep Cogito 发布了多个测试样例来验证其“机器直觉”:

在数学问题中，Cogito671B 凭借短至100token 的推理链准确得出结论，而 DeepSeek R1则用了200+ token。
在法律类推理中，它采用两步逻辑结构输出清晰结论，超过许多模型甚至真实法学硕士学生的表现。
在经典亲属逻辑题“爱丽丝是查理的祖母吗?”中，Cogito v2成功避开了代词混淆陷阱，准确输出“祖母”。

更低成本的训练路线，挑战百万级预算神话

尽管 Cogito v2的模型规模庞大，Deep Cogito 称其训练8个模型总成本不到350万美元，这与 OpenAI、Anthropic 动辄上亿美元的研发开销形成鲜明对比。

公司首席执行官 Drishan Arora 表示:“更好的模型不是训练更多数据，而是训练更有意义的数据。”这正是 Cogito 模型得以在推理任务上突破的关键所在。

开源理念延续，打造“会进化的模型体系”

Cogito v2模型目前已可通过 Hugging Face、Baseten、RunPod、Unsloth 等平台下载或API调用。为轻量化部署场景，Cogito671B 还推出了 FP8量化版本，支持大模型以更低硬件门槛运行，推理效率提升，准确率仅微幅下降。

更重要的是，Deep Cogito 承诺所有模型开源，并将持续迭代、优化，形成以“推理链反馈+自我提升”为核心的新型模型训练路径。

目前，Cogito v2已获得 Benchmark 和 South Park Commons 等知名机构的关注与支持，并被视为开源AI领域的一匹黑马。

相关推荐

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式发布GPT-5，与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出；Claude4Opus编程优异(72.5%)但数学较弱(33.9%)；Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面，GPT-5和Gemini2.5Pro定价相近($1.25-$10)，Claude4Opus较高($15-$75)。建议根据需求选择：GPT-5适合综合应用，Claude4Opus适合专业编程，Gemini2.5Pro适合长文档�
蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案，通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code，实现本地化部署。该方案具有三大优势：1）成本直降90%，免翻墙使用；2）支持128K超长上下文处理，编程能力超越主流模型；3）提供600万token免费额度。平台采用交互式界面设计，支持移动端操作和WebSocket通信，集成文件管理、Git工具和会话追踪功能，�

AI编程 Claude Code
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析
GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

2025年8月7日，OpenAI正式发布GPT-5，官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升，在AIME2025测试中取得94.6%的高分，处理速度也有明显改善。但与竞争对手相比仍存在差距：Claude4在代码生成和逻辑推理方面表现优异，支持200K token长文本；Gemini2.5具备2M超大上下文窗口和全模态支持；国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�
荐谁在往“DeepSeek们”的回答里塞广告？

AI正在重塑现代职场与当代生活。如果说在过去，人们遇到问题往往会首选“搜一下”，如今，则变为“问问AI”。或许是ChatGPT和DeepSeek，也可能是豆包和元宝…… 从数据来看，头豹研究院数据显示，全球AI搜索的用户量从2024年1月的3.1亿增长至2025年2月份的19.8亿，增长率达538.7%。而当AI在日常工作和生活中越来越成为不可或缺的工具，变化正悄然发生。当DeepSeek的回答里频繁�

AI搜索职场变革现代生活
智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

大模型重塑了人工智能的产业格局，但却没有彻底颠覆人类的生产模式。在这背后，并非其技术力量不足，而是当前的应用形态仍停留在“工具赋能”的初级阶段，大模型的潜力被束缚在碎片化场景中，未能转化为重构生产逻辑的核心动能。正如360集团创始人、董事长周鸿祎所言，大模型的能力其实已经相当强大，甚至超越了我们中的许多人。只是其潜力尚未被挖掘。而�

大模型人工智能生产模式
GPT-4.5和Claude4哪家强?一文看懂优劣差异，附最实用AI大模型对比工具!

文章对比分析了GPT-4.5和Claude4两大AI模型的性能差异：GPT-4.5在响应速度、编程能力和生态开放度上占优，适合实时对话和内容创作；Claude4则在长文本处理（200k+上下文）、安全性和企业适配性方面表现突出。推荐使用AIbase的模型对比工具（https://model.aibase.com/zh/compar）进行多维度智能筛选，根据具体场景（如客服、写作、编程等）选择最适合的模型。核心结论：没有绝对优劣，�

AI大模型 GPT-4.5 Claude
AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构，激活参数32B，支持128K上下文，在代码调试和自动化流程方面表现突出；Qwen3-Coder为480B参数的MoE模型，原生支持256K上下文，擅长大规模代码库理解和API集成。二者在中级任务表现接近，但K2在复杂可视化任务更优，Qwen3在多轮Agent调用更稳定。建议根据需求选择：注重调试自动化选K2，需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

AI大模型选型编码能力对比性能评测
谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

据媒体报道，谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。该模型能够根据用户的文本提示，快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界，更创新性地引入了可提示世界事件” 功能。用户通过简单文本指令，即可实时修改虚拟环境，显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能（AGI）的�
荐AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

【AI日报】汇总了最新AI领域动态：1)腾讯开源混元系列小尺寸模型，适用于消费级显卡；2)昆仑万维发布推理大模型MindLink，提升回答透明度；3)B站推出AI原声翻译功能，保留UP主音色；4)谷歌Gemini 2.5在数学奥赛夺金，展现强大推理能力；5)OpenAI展示GPT-5网络信息整合特性；6)苹果组建AI团队挑战ChatGPT；7)高德地图推出全球首个AI原生地图应用；8)Adobe推出AI图像合成工具Harmonize；9)NVIDIA发布革命性视频渲染技术；10)谷歌推出Android Studio免费AI编程助手；11)开源结构化信息提取工具LangExtract；12)Figma开发者模式升级提升设计转代码效率。

人工智能开源模型腾讯混元

今日大家都在搜的词：

热文

3 天
7天

开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude

模型不仅回答问题，更学习“如何回答问题”

推理实力实战检验:速度更快，路径更短

更低成本的训练路线，挑战百万级预算神话

开源理念延续，打造“会进化的模型体系”

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

荐谁在往“DeepSeek们”的回答里塞广告？

智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

GPT-4.5和Claude4哪家强?一文看懂优劣差异，附最实用AI大模型对比工具!

AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

荐AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

今日大家都在搜的词：

热文

京东养车50亿补贴更名震骨价号称补贴不「唬」

AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线A

REDMI Turbo 5已备案：首发天玑8500处理器

微信内存一下就少了10G上热搜无需担心误删重要资料

iPhone17系列仅标准版没涨价分析师称Pro机型将上调50美元

海底捞回应“改为半自助模式” 客服辟谣：系不实传闻

苹果iOS 26 Beta 5上线：细节优化更新内容一览

AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌

AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm

荣耀Magic7 Pro 16+512G卫星通信版开售：售价5199元

李想回应理想被黑：知道是谁干的背后有专业水军

AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKB

周鸿祎称很多成功人士看不起新东西 AI时代需终身学习

站长商机