首页 > 业界 > 关键词  > AI技术最新资讯  > 正文

AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业

2025-01-12 15:20 · 稿源: 快科技
中国AI领军企业<a href="//www.chinaz.com/tags/855878.shtml" target="_blank"><span>DeepSeek</span></a>横空出世,震撼全球科技界

DeepSeek: 中国AI领域的开年重磅突破

据国内外媒体报道,DeepSeek以其卓越的本土研发实力震惊了全球科技界。这家AI创业公司汇聚了一支由清北等名校精英组成的精英团队,以其独特的人才结构和技术成就成为业界瞩目的焦点。

规模虽小,实力不俗

DeepSeek团队规模精干,工程师和研究人员仅有139人。与之相比,海外同行的OpenAI拥有1200名研究人员,Anthropic也有500多名。但DeepSeek凭借其强大的研发能力,在业界脱颖而出。

一系列吸睛标签,大放异彩

DeepSeek凭借"未寻求外部融资"、"创始人囤卡富翁"、"团队成员均为清北等名校毕业生"等一系列吸睛标签,成功在AI创业圈中崭露头角。

V3开源模型表现亮眼

2024年12月,DeepSeek发布了最新的V3开源模型。该模型在评测中表现出色,超越了阿里自研的Qwen2.5-72B和Meta自研的Llama 3.1-405B等顶级开源模型,甚至与GPT-4o、Claude 3.5-Sonnet等顶级闭源模型相媲美。

训练成本低于同类模型,打破限制

值得注意的是,DeepSeek V3大模型发布后完全开源,其训练成本远低于同类模型。数据显示,OpenAI GPT-4的训练成本高达6300万美元,而DeepSeek-V3的成本仅为其十分之一不到。此外,DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的,远远低于硅谷大厂普遍使用的数十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈。

全球AI专家赞誉有加

DeepSeek-V3模型的出色表现,得到了全球AI专家的高度赞扬。OpenAI创始团队成员Andrej Karpathy发帖赞叹:"DeepSeek-V3性能高过Llama3最强模型,且耗费资源仅十分之一,未来或许不需要超大规模的GPU集群了。" Meta科学家田渊栋惊叹道:"FP8预训练、MoE、预算非常有限的强大性能、从CoT中提取以进行引导——这是伟大的工作!"。

中国AI技术创新佼佼者

DeepSeek的创始人梁文锋表示,中国需要逐步成为技术的贡献者,而不是一直依赖西方的创新成果。他强调了中国AI发展需要建立自己的技术生态,并指出很多国产芯片发展不起来,正是因为缺乏配套的技术社区和前沿技术的参与。

独特历程,独树一帜

DeepSeek的母公司幻方量化是一家量化基金起家的企业,与DeepSeek的用人风格相似,均注重本土人才。DeepSeek在AI产品正式亮相前,曾长时间内部孵化该产品,并招聘文科人才提供相关知识来源。这一独特的历程使得DeepSeek在AI领域独树一帜,成为中国AI技术创新的佼佼者。

举报

  • 相关推荐
  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • 华为FreeClip 2耳夹耳机发布:搭载自研NPU AI处理器 1299元

    华为于9月24日正式发布全新FreeClip 2耳夹式耳机,售价1299元,10月14日开启预售,10月20日正式上市。耳机主打独特设计、卓越性能与丰富功能,提供丹宁蓝、摩登黑、羽纱白三色可选。充电盒采用玲珑方盒设计,体积缩小17%,耳机本体重量减轻9%至5.1克,佩戴更轻盈舒适。搭载华为自研第三代音频芯片,首款集成NPU+AI处理器,算力提升10倍,支持超澎湃双擎单元,音质与低频动力均提升100%。具备IP57级防尘抗水抗汗能力,支持左右耳自适应技术,无需区分左右耳即可佩戴。AI功能方面,支持鸿蒙AI耳边助手,可实现随唤随应、连续对话等便捷操作,并具备实时听译功能,支持中文与20种语言互译。续航方面,单耳续航达9小时,整机续航长达38小时,满足长时间使用需求。此外,耳机还支持离线查找与楼层定位功能,充电盒新增近距离星闪精准查找,50米内轻松找回耳机。

  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • AI日报:腾讯开源图像模型HunyuanImage2.1;​爱诗科技获6000万美元融资;​Freepik上线豆包Seedream4.0图像模型

    本文汇总了AI领域的最新动态:腾讯升级混元生图模型至2.1版,支持2K分辨率与中英文输入;爱诗科技获阿里领投6000万美元融资,聚焦AI视频生成;Freepik上线Seedream 4.0图像模型,提供高分辨率生成选项;阿里千问新模型通过MoE架构提升推理效率10倍;微软在Office 365中集成Anthropic技术,调整AI供应商策略;首款AI Agent浏览器Fellou CE发布,简化工作流程;清华团队开源GUAVA技术,实现

今日大家都在搜的词: