首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

2025-01-28 10:52 · 稿源: 量子位公众号

DeepSeek大爆出圈,现在连夜发布新模型——多模态Janus-Pro-7B,发布即开源。在GenEval和DPG-Bench基准测试中击败了DALL-E3和Stable Diffusion。想必大家这几天完全被DeepSeek刷屏了吧。它长时间霸榜热搜第一,甚至AI第一股英伟达直接被干崩了——最大跌幅近17%,一夜蒸发5890亿美

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • DeepSeek爆火后英伟达首份财报发布:利润大增80%

    美东时间2月26日盘后,英伟达公布了2025财年第四季度业绩报告。这是今年1月末DeepSeek横空出世后,英伟达公布的首份财报,华尔街和所有投资者都在关注。2025财年英伟达营收达到1305亿美元,同比增长114%;预计2026财年Q1营收区间为430亿美元上下浮动2%。

  • 全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

    【新智元导读】由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!这一成就,再次让AI社区轰动。博客地址:https://turningpointai.notion.site/the-multimodal-aha-moment-on-2b-model开源项目:https://github.com/turningpoint-ai/VisualThinker-R1-ZeroDeepSeek-R1的独特推理能力,能成功扩展到多模态推理领域吗?UCLA等机构的研究者发现,虽然目前已经涌现出许多试图复现DeepSeek-R1的研究,然这些研究大多遭遇了这个难点:很难复现出R1所表现出的回答长度增加和思考模式。在台湾大学获得硕士学位,导师是Chih-JenLin教授。

  • DeepSeek第三弹:开源DeepGEMM!

    今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。本次开源属于DeepSeek开源周”的第三项项目,此前已发布FlashMLA和DeepEP。

  • DeepSeek超越150万模型:成全球最受欢迎开源大模型

    今天凌晨3点,全球最大开源平台之一huggingface联合创始人兼首席执行官ClementDelangue发布了最新数据:中国开源大模型DeepSeek-R1在150万模型中,成为该平台最受欢迎的开源大模型,点赞超过1万。Clement还特意发文恭喜DeepSeek-R1的下载量超过1000万次,同样创造了huggingface平台有史以来最受欢迎的模型。这也一度让凭借AI显卡爆火的英伟达损失惨重,市场对AI算力是否存在巨大市场泡沫产生了怀疑,芯片股纷纷大跌,英伟达甚至在1月28日创下了美股单日跌幅最高记录,大跌近17%,单日市值蒸发约4.3万亿人民币。

  • DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

    今天是DeepSeek开源周第二日,一早,DeepSeek如约就放出了开源代码库DeepEP王炸。DeepEP是首个用于MoE模型训练和推理的开源EP通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。6、深度优化场景针对NVLink到RDMA的非对称带宽转发场景进行专项优化,提升异构网络下的传输性能;此外,它还支持SM数量动态控制,平衡不同任务的吞吐量需求。

  • 本周开始,DeepSeek 宣布将开源 5 个代码库!

    备受关注的中国人工智能模型公司DeepSeek已宣布,将开源五个关键代码库。在此之前的2月21日,Deepseek通过官方SNS平台宣布了这一消息。”长期以来,开源一直被视为实现技术民主化和提高透明度的一种重要方式,Deepseek本次的开源也受到了开源支持者的欢迎。

  • 瓴羊Quick BI正式接入DeepSeek

    “在AI技术重构企业数据价值的浪潮中,如何让大模型能力真正穿透企业数据壁垒,成为行业关注的焦点。”2月17日,阿里云智能集团瓴羊旗下智能商业分析产品——QuickBI宣布完成与DeepSeek大模型的深度适配,通过"领域模型开放生态"双引擎驱动,为企业提供安全高效的智能数据分析解决方案。随着DeepSeek的接入,QuickBI将进一步加深企业场景落地的数智化实践,为千行百业开启"所问即所得"的智能决策新时代。

  • 不受DeepSeek影响,英伟达新财报创记录,收入超1300亿美元

    今早5点,全球AI领导者英伟达在官网发布了,第四季度和2025财年的财务业绩报告。第四季度收入创纪录达到393亿美元,比第三季度增长12%,比去年同期增长78%;数据中心第四季度收入创纪录达到356亿美元,比第三季度增长16%,比去年同期增长93%。全球超过75%的最强超级计算机系统由NVIDIA技术驱动。

  • 寻找DeepSeek梁文锋

    AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球,成为史上最快突破3000万日活跃用户的APP,如今当下各行各业都在被DeepSeek化。就是这样一家公司,在爆火之前,外界知之甚少,它极少出现在媒体报道、猎头招聘、同行调研之中,也从未像“AI六小龙”那样激起过市场的水花。但无论如何,DeepSeek打破巨头了在AI领域的叙事,现在投资人们迫切希望在下一个DeepSeek出现之�

  • 广告盯上DeepSeek

    AI搜索加广告,是必然吗?定焦One原创作者|王璐编辑|魏佳DeepSeek们最近因为答案中疑似“夹带”广告被骂了。起因是科普博主“三个老爸实验室”称在腾讯元宝接入的DeepSeek里发现,生成答案中有“建议通过58到家等正规平台比价预约”“建议通过快回收平台或本地正规回收商询价”等广告倾向性内容。需要提醒大家的是,即便有没有广告,AI的回答也不是绝对客观中立。

热文

  • 3 天
  • 7天