首页 > 业界 > 关键词  > scaling最新资讯  > 正文

Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈

2024-11-18 08:40 · 稿源: ​新智元公众号

就连「量化」也不管用,scaling law真的要终结了吗?一提scaling law,人们重点关注的是参数规模、数据量等因素,却忽视了「精度」这一关键变量。哈佛斯坦福MIT等机构研究人员竟发现,低精度训练会降低模型的「有效参数量」!对此,他们提出了「精度感知(precision-aware)」scali

......

本文由站长之家合作伙伴自媒体作者“​新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态理解模型

    火山引擎宣布Doubao-Seed-2.0-lite升级,成为豆包大模型家族首款全模态理解模型。新版支持视频、图像、音频、文本原生统一理解,并同步升级Agent、Coding与GUI能力,增强多模态推理。在视觉理解上,该模型在物理HiPhO、医疗MedXpertQA等高阶学科推理任务中大幅超越2月发布的Doubao-Seed-2.0-pro,并在BabyVision、WorldVQA等领域达SOTA水平。升级重点融入语音理解,可同时处理多种输入模态并完成跨模态联合推理,支持19语种语音转写及中英等互译,捕捉情绪、环境声等细节。该模型还深度适配OpenClaw等框架,强化深度搜索与Skill动态调用,实现越用越聪明。

  • 酷鲨科技CBM-D-40高精度PTP授时服务器:精准·稳定·国产·成熟

    文章介绍了酷鲨科技CBM-D-40高精度PTP授时服务器。该设备针对通信基站切换、电力系统保护动作、数据中心交易记录等关键环节对精准时间同步的依赖需求而设计。其核心优势在于纳秒级授时精度、多源自动切换、强大守时能力及国产化设计,支持北斗/GPS等多种时间源,确保在复杂网络环境中稳定运行。产品已广泛应用于通信、电力、交通等领域,并通过成熟的服务体系赢得�

  • 皇冠CAD2026 R3、工业造型软件CrownStyling及工业母机正向设计平台IMDP发布会圆满召开

    2026年4月28日,华天软件举办发布会,推出完全自主研发、云原生架构的三维CAD平台——皇冠CAD2026R3、工业造型软件CrownStyling及工业母机正向设计平台IMDP。皇冠CAD2026R3在六大维度实现超50项更新,可处理亿级面片大型装配体;CrownStyling填补国产工业造型设计空白,具备曲面设计、逆向建模等核心能力;IMDP平台填补我国工业母机全流程正向设计空白。目前,皇冠CAD已服务超600家企业,注册用户突破50万。

  • 千问AI眼镜升级全球首款空间3D显示技术:主动感知用户需求

    千问AI眼镜S1今日迎来版本更新。本次升级不仅带来了主动式AI生活助理功能,更首发了全球首款空间3D显示技术,彻底改变传统智能眼镜用户提问、设备回答”的被动交互模式。 新搭载的空间3D显示能力,让信息呈现具备真实的纵深、层次与距离感。 得益于双光机双目Micro LED近眼显示方案,入眼峰值亮度高达4000尼特,即使在户外强光下也能清晰可见。这种显示方式更贴近真�

  • 仅需1/10 Token消耗!百灵Ling-2.6-flash正式发布:104B参数实现SOTA级Agent

    今日,蚂蚁百灵正式推出 Ling-2.6-flash一款总参数量 104B、激活参数 7.4B 的 Instruct 模型。该模型主打Token 效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 据权威三方评测Artificial Analysis 数据,Ling-2.6-flash 展现了突出的 Token Efficiency 优势,以 15M output tokens 实现了 26 分 的 Intelligence Index,在保持较强智能水平的同时,将输出消耗控�

  • LibTV 上线 HappyHorse 1.0:携手顶级模型打造一站式 AI 视频创作平台

    4月28日,阿里巴巴ATH事业群开发的HappyHorse1.0视频生成模型首发登陆LibTV。该模型采用音视频联合生成方案,支持15秒多镜头叙事、多画幅适配及1080P输出,在画面质感、运镜流畅度和人物真实感上显著改善。LibTV是LiblibAI推出的一站式AI视频创作平台,整合剧本、分镜、剪辑等环节,提供结构化工作流,支持调用HappyHorse1.0、Seedance2.0等顶级模型。LiblibAI已成长为国内最大多模态模型与创作社区,平台上线首日访问量突破10万。

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 从爆火到平淡,OpenClaw改变了什么

    OpenClaw激起的「养龙虾」热如今已经度过狂热期,进入冷静期。有的人跟风养虾,却发现体验远不及预期,重新开始使用DeepSeek、ChatGPT和Gemini;有的人已经开始将龙虾运用在自己的工作中,打造了更高效的工作流程;有的人不满足于OpenClaw的体验,开始尝试进化能力更强的Hermes Agent,从养虾切换到养马。 这个过程中,人们对AI能力边界的认知已然在发生改变。 首先,OpenClaw让人们

今日大家都在搜的词: