首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

超越DeepSeek-R1,英伟达开源新王登顶,14万H100小时训练细节全曝光

2025-05-07 08:54 · 稿源: 新智元公众号

现在,英伟达Llama-Nemotron系列模型,正式超越DeepSeek-R1!而且,这些模型已经全部开源了。换句话说,在推理吞吐量和内存效率上显著超越DeepSeek-R1的一系列推理模型,已经开源可用了。超越DeepSeek-R1的模型,究竟是怎么炼出的?就在刚刚,英伟达发布了技术报告中,揭秘了模型训

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • DeepSeek V4.1灰度测试:代码能力大提升 天差地别

    6月过半,DeepSeek V4.1发布的日期越来越近了,已经有网友疑似收到了新模型的灰度测试,测试后称代码能力大幅提升。 Linux.do社区网友@风 云雨发帖称,DeepSeek的网页版疑似上架了V4.1 Flash模型,他观察到了两个变化,一个是知识水平从2025.5月份提升到了2026.1月份,其次就是常用的鸬鹚SVG测试能力也变得更好了。 目前还没看到太多的V4.1验证,估计还在灰度测试中,在4.0发布之前

  • AI日报:字节发布Seedance 2.0 Mini;Kimi 2.7 Code 高速版大模型正式上线;DeepSeek完成逾70亿美元首轮融资

    字节跳动发布Seedance 2.0 Mini,主打性价比。月之暗面推出Kimi 2.7 Code高速版,输出速度飙升6倍。腾讯、高榕等巨额投资AI天才林俊旸的新实验室。阿里云QoderWork上线“意识”功能,DeepSeek完成超70亿美元融资。阿里发布Qwen-Robot具身模型,支付宝开启AI助手“蚂宝”邀测。

  • 收费才是DeepSeek的“成人礼”

    DeepSeek首次融资的“金主”名单,逐渐浮出水面。 6月3日,媒体报道称,DeepSeek计划募集约500亿元人民币,投后估值达3500亿至4000亿元。相比上月底传闻的700亿元,最新传出的融资规模略有收缩。 除了DeepSeek创始人梁文锋承诺投入200亿元外,腾讯考虑投资100亿元,宁德时代也可能投资50亿元。综合多方消息,其他潜在投资方包括国家集成电路产业投资基金、网易、京东、砺思资�

  • 科龙云朵猫Ultra上手:星闪雷达+DeepSeek语音,智能柜机选它就对了

    买空调最易踩的坑不是匹数选小,而是花大几千买回家却发现风只往一个方向吹、角落的人感受不到凉意、调温还得满屋找遥控器。科龙云朵猫Ultra在3000-5000元价位,用星闪雷达和双语音大模型给出了够聪明、够舒适的答案:星闪雷达2.0能精准感知6米内多人位置,实现风避人、风随人、人近柔风、人离节能四大模式;内置DeepSeek与星海大模型,支持6种方言识别和离线语音控制;170°超广角送风搭配216种风感组合,APF值高达5.30,远超新一级能效标准26%,AI懒人省电模式再省35%。对比美的酷省电PRO和TCL智炫风,它在人体感知、复杂语音指令和柔风技术上优势明显,全生命周期性价比极高,尤其适合有孩有宠或多代同堂家庭。

  • DeepSeek首轮募资500亿元 腾讯、宁德时代拟战略参投

    DeepSeek即将完成规模约500亿元人民币(约合74亿美元)的首轮融资,腾讯控股与宁德时代有望成为本轮最大的外部投资方。 据知情人士透露,本轮融资完成后,DeepSeek的整体估值将攀升至3500亿至4000亿元人民币(约合520亿至590亿美元)。 在资金募集构成方面,DeepSeek创始人梁文锋个人已承诺出资200亿元。作为外部财务与战略支持方,腾讯正考虑注资100亿元,而电池行业龙头宁德

  • 稳住基本盘的小米,紧追DeepSeek

    ​小米一季度财报发布后第二天,MiMo先有了新动作。 就在刚刚,小米宣布MiMo-V2.5系列API永久降价,最高降幅99%,Token Plan同价位用量提升至5至8倍。几天前,DeepSeek刚把V4-Pro的2.5折优惠改成永久价。小米这次跟进,意味着MiMo正在以更低门槛加速参与大模型竞争。 “从短期来看,我们面对成本周期、需求周期和竞争周期三重周期叠加的挑战;长期来看,我们正进入AI重构人车家全

  • 阿里发布首个具身大模型Qwen-Robot系列:三个模型支持协同运转

    近日阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,涵盖VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav与世界模型Qwen-RobotWorld三大核心模型。 这是千问大模型家族首个完整的具身智能模型矩阵三个模型分别为机器人赋予操作能力、导航能力和环境认知能力,既可独立部署,亦可协同运转,为各类形态的机器人走向真实场景提供了统一的通用底座”。 当前,全球具身智�

  • 小米MiMo要蹭着DeepSeek蹦上牌桌

    ​5月27日,小米把 MiMo-V2.5系列 API 永久降价。 MiMo-V2.5-Pro 的输入缓存命中价格降到0.025元/百万 tokens,输入未命中价格3元/百万 tokens,输出价格6元/百万 tokens。普通版 MiMo-V2.5更低:缓存命中0.02元,输入未命中1元,输出2元。 这不是一次常规促销。 因为把价格横向一比就会发现,小米这次不是随便降价,而是直接对标 DeepSeek。 MiMo-V2.5-Pro 对 DeepSeek V4-Pro,MiMo-V2.5对 DeepSeek V4-Flash�

  • 本月第四次!DeepSeek又崩了约半小时 现已修复

    今日上午,AI平台DeepSeek再度发生服务中断,这是其本月第四次出现大规模异常故障。 据用户反馈,当日10时21分起,DeepSeek网页对话服务与API接口均无法正常使用,出现服务器繁忙” 等提示。 官方状态页面将本次故障定级为部分中断”,并于10时27分确认已定位故障原因,随即开展修复工作。 至10时50分,所有受影响服务均恢复正常运行,本次中断时长约29分钟。

  • 车载芯片干翻4万元英伟达超算!理想发布全球首款数据流AI芯片马赫M100

    理想汽车今日举办Livis Day理想汽车软件与具身智能发布会。 会上,理想汽车正式发布全球首款数据流AI芯片马赫M100,该芯片采用5nm车规级工艺,单芯算力1280 TOPS,实际运行效率超82%,是目前全世界量产最强大的智驾级算力芯片。 据理想官方介绍,冯诺依曼架构统治计算行业整整70年,但其指令队列掩盖了计算本有的并行度,需要海量晶体管承担真实计算以外的管理开销。 而

今日大家都在搜的词: