DeepSeek 已在开发者平台 Hugging Face 上发布他们 R1 推理 AI 模型的更新版本,这一消息最初是在周三早上通过其微信公众号宣布的。
根据 DeepSeek 的公告,这一更新版本的 R1 采用了非常宽松的 MIT 许可证,可用于商业用途,但此次更新仅为“小幅升级”。Hugging Face 上的模型库中没有详细描述,仅包含配置文件和权重(即模型运行的核心参数)。
更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。
今年早些时候,DeepSeek 因发布了 R1 模型而“一夜成名”,这款模型在性能上一度足以与 OpenAI 的产品相抗衡。
(举报)