首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

冯骥谈DeepSeek:可能是个国运级别的科技成果

2025-01-27 11:38 · 稿源: 快科技
<a href="//www.chinaz.com/tags/855878.shtml" target="_blank"><span>DeepSeek</span></a>:中国科技的重大突破

DeepSeek:一项可能改变国运的科技成就

游戏科学创始人冯骥在近期发文中高度评价了DeepSeek,称其是一项具有国家级影响力的技术创新。

冯骥强调,如果AI大模型能够实现以下任何一项,都将是重大突破,而DeepSeek同时实现了所有这些目标:

  • 比肩OpenAI O1的强大推理能力
  • 成本低廉,训练和使用费用低一个数量级
  • 开源,可公开下载和部署,并提供详细的训练指导
  • 免费,官方服务免费提供
  • 联网,支持实时搜索推理(O1目前不支持)
  • 本土,由中国本土团队开发,无海外背景或资深行业经验

冯骥大力推荐使用DeepSeek,希望它能帮助人们重新认识人工智能并将其融入日常生活。他还表示,由一家纯粹的中国公司取得如此令人震撼的突破是值得庆幸的,知识与信息的平等由此迈出了坚实的一步。

DeepSeek:令人惊叹的开源大模型

DeepSeek是由量化巨头幻方量化旗下大模型公司深度求索开发的。其推理大模型DeepSeek-R1于1月20日正式发布,凭借其卓越的性能和高性价比在海外开发者社区引起了广泛关注。

作为一款开源模型,DeepSeek-R1在数学、代码和自然语言推理等任务上的表现可与OpenAI O1模型正式版相媲美。它采用MIT许可协议,支持免费商用和衍生开发。

目前,DeepSeek-R1在Chatbot Arena大模型排名榜上已升至全类别第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型分类中与O1模型并列第一。

DeepSeek在各大应用商店也取得了不俗的成绩,在苹果App Store中国区免费榜登顶,在美国区免费榜升至第六位,超越了Google Gemini等美国科技巨头的生成式AI产品。

举报

  • 相关推荐
  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • CCF科技成果奖揭晓:国内开源社区斩获最高荣誉

    近日,中国计算机学会公布2025年度“CCF科技成果奖”评选结果,共有38个项目获奖。其中,“开放麒麟(openKylin)操作系统及开源社区”项目凭借在核心技术创新与产业落地中的突出贡献,荣获科技进步特等奖。该项目面向桌面应用场景,在RISC-V架构适配、移动应用兼容、智能引擎框架等方面取得突破,已在金融、通信、能源等行业规模化应用。目前,openKylin社区已吸引1300多家生态伙伴加入,构建了覆盖硬件、软件、AI等领域的全栈生态。作为全球领先的开源桌面系统根社区,该项目通过技术输出与国际协作,持续提升我国在开源领域的影响力,为全球开源生态注入中国力量。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

今日大家都在搜的词: