首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿

2025-01-27 11:38 · 稿源: 快科技
<a href="//www.chinaz.com/tags/855878.shtml" target="_blank"><span>DeepSeek</span></a> 创始人<a href="//www.chinaz.com/tags/932223.shtml" target="_blank"><span>梁文锋</span></a>:中国 AI 亟需生态建设

随着 DeepSeek 在全球爆火,其创始人梁文锋逐渐走上台前。

近期,据媒体报道,此前鲜少露面的梁文锋受邀参加专家座谈会,并发表了重要讲话。

梁文锋认为,中国 AI 产业不能永远处于跟随地位。尽管中美 AI 领域存在着技术差距,但更本质的差异在于,中国 AI 更多是模仿,而西方国家则注重原创。

梁文锋指出,英伟达的领先不仅是一家公司的努力,而是整个西方科技界共同参与的结果。他们能够预见技术趋势,并制定清晰的发展路线图。

他强调,中国 AI 发展也需要构建这样的生态系统。目前,国产芯片发展面临的困境之一就是缺乏配套的技术社区,导致只能获取二手信息。

谈到开源,梁文锋表示,在颠覆性技术面前,闭源形成的护城河是暂时的。即使 OpenAI 闭源,也无法阻止他人超越。因此,DeepSeek 将价值沉淀在团队建设上,通过不断积累知识和创新文化,形成自身的竞争优势。

公开资料显示,梁文锋出生于 1985 年,拥有浙江大学信息与电子工程学系本硕学位。他于 2008 年开始带领团队探索机器学习在量化交易中的应用。

2015 年,梁文锋成立幻方量化,2019 年,其资金管理规模突破百亿元。

2019 年,幻方量化自主研发了萤火一号训练平台,总投资近 2 亿元,搭载 1100 块 GPU。两年后,萤火二号的投入增加到 10 亿元,搭载约 1 万张英伟达 A100 显卡。

2021 年,梁文锋与团队合作开发的萤火二号系统,配备了 1 万张 A100 GPU 芯片,性能接近 DGX-A100,但成本和能耗分别降低了一半和 40%。

2023 年,梁文锋宣布进军通用人工智能领域,并创办了 DeepSeek,致力于开发真正达到人类水平的人工智能。

2024 年,DeepSeek 发布了混合专家语言模型 DeepSeek-V2。同年,DeepSeek-V3 问世,这款性能优异且性价比极高的语言模型被业界称为 " 来自东方的神秘力量 "。

2025 年,DeepSeek 发布的 R1 模型在性能上比肩甚至超越了 OpenAI 的 o1,并且完全开源,以极低的成本实现了这一突破。

举报

  • 相关推荐
  • 陕西一景区介绍标注作者为DeepSeek 工作人员:有版权问题

    近日,陕西渭南的一处景区引发了网友们的热议,原因竟是景区介绍牌上标注的作者是一个颇为特别的名字——“DeepSeek”。 不少游客在看到这个作者名时,都误以为是个外国人的名字,仔细一瞧才发现,这原来是一款人工智能助手的名字。景区工作人员解释说,这块介绍牌是去年摆放的,上面的内容确实是由DeepSeek生成的,主要是对尧头窑进行一个简单的介绍。

  • DeepSeek V4 Lite悄然更新:2000亿小参数性能逼近美国顶流

    虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。 DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。 然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区�

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • AI日报:MiniMax发布Expert 2.0与云端助手MaxClaw;DeepSeek V4 细节曝光;肯德基AI 点餐助手接入通义千问

    本期AI日报聚焦多款AI产品动态:MiniMax发布Expert 2.0与云端助手MaxClaw,降低专业AI Agent开发门槛;DeepSeek V4细节曝光,具备万亿参数与原生多模态能力;肯德基接入通义千问推出AI点餐助手“小K”;华强北AI眼镜在美销量暴涨;Perplexity发布通用AI代理Computer,集成多模型协同工作;三星Galaxy S26系列手机AI功能全面升级;三七互娱“小七大模型”深度落地游戏出海等场景。整体呈现AI

  • DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

    DeepSeek于2月11日悄然更新模型,主要提升上下文能力至1M,可一次性处理《三体》三部曲等超长文本。官方强调这是最新模型,未命名特定子版本。实测显示其在编程、物理模拟等多方面能力均有提升,甚至超越此前所有版本达到SOTA水平。不过,新模型在部分具体问题(如50米距离洗车方式)上回答不一致,其是否为完整版尚不确定。

  • 一年了 美国还在追着抹黑!曝DeepSeek春节再扔王炸 最新披露

    一年了,美国还在追着Deepseek抹黑,可中国最新的Seedance都2.0了。中国视频生成模型Seedance2.0吸引全球目光时,当地时间2月12日,美国人工智能公司OpenAI向美国众议院提交了一份备忘录,再次抹黑中国人工智能大模型DeepSeek,称其抄袭”了美国的大模型。DeepSeek的下一代模型V4或将在今年春节前后正式发布。

  • 提升7倍 DeepSeek官宣测试全新大模型:或为V4 Lite

    前几天国产AI来了一波爆发,智谱GLM-5、Minimax2.5及DeepSeek在11日同一天都发布了新的大模型,其中DeepSeek的自然最受关注。此前我们已经报道过了,这次更新主要是提升了上下文能力,达到了1M之前的DeepSeeV3系列也就是128K,这方面相对前代V3系列大模型提升了7倍。传闻中的DeepSeekV4满血版是1.5万亿参数,比V3系列翻倍还多会使用之前DeepSeek研究的Engram、mHC等新技术,性能全面提升的同时成本还低,这个期待值还是很高的。

  • DeepSeek回应被指变冷淡:已收到反馈 为平衡效率与情感

    DeepSeek近期技术升级后,其AI助手风格从“细腻共情”转向“公事公办”,引发用户争议。部分用户认为新版更理性客观,能专注问题本身;也有人批评其语气疏离、缺乏温度。官方解释称,调整旨在提升信息密度与响应效率,并为2026年V4版本进行极限压力测试。这表明AI在拟人化与功能性之间寻求平衡,不同用户对交互风格存在差异化需求。

  • 定义AI时代的品牌语言:“八大黄金维度”比谷歌EEAT更适配GEO未来

    文章探讨了在生成式搜索兴起的背景下,品牌营销评估体系的重构。重点对比了谷歌的EEAT框架(经验、专业、权威、可信)与聚界智能提出的“面向AI权威信源的八大黄金维度”。后者专为AI时代设计,包含真实性、科普性、结构性、权威性、热点性、多模态、时效性、一致性八个维度。文章指出,八大维度不仅定义了优质内容,更提供了让AI理解并信任品牌的系统方法,强调从被动评估转向主动构建,从单点优化转向系统协同,更契合企业品牌传播的本质需求,是定义AI时代品牌语言的关键。

  • DeepSeek更新上下文达百万级token:可一次性处理超长文本

    DeepSeek近日在网页端及APP端完成版本更新,正式将上下文窗口扩展至1M(百万) Token,迎来对话容量的显著跃升。 相较于去年8月发布的DeepSeek V3.1所支持的128K上下文,新实装模型的上下文能力较两个月前更新的V3.2提升达八倍。 网友实测显示,DeepSeek已可一次性处理《三体》三部曲体量的超长文本,并在问答中明确表示其知识截止日期更新至2025年5月。

今日大家都在搜的词: