首页 > 业界 > 关键词  > DeepSeek-v3最新资讯  > 正文

OpenAI科学家盛赞中国大模型:算法非常强,算力用到!

2024-12-30 08:50 · 稿源: ​ AIGC开放社区公众号

OpenAI创始团队成员、高级研究科学家Andrej Karpathy很罕见地,分享了一个来自中国的开源大模型——DeepSeek-v3。Karpathy表示,DeepSeek仅用了280万小时的GPU算力,就训练出了比Llama-3405B(使用3080万小时GPU)更强的前沿模型,整体成本节省了11倍左右,将算力发挥到了极致。这

......

本文由站长之家合作伙伴自媒体作者“​ AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 中国大模型公司提出新架构,解决Context无限长问题,开启Agent时代

    日月开新元,万象启新篇。1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。受益于LinearAttention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax以业内极具性价比的价格提供文本模型和多模态理解模型的API服务,标准定价是输入token1元/百万token,输出token8元/百万token。

  • Meta AI首席科学家杨立昆谈DeepSeek:不是中国AI超越美国 而是开源模型超越专有模型

    一夜间,DeepSeek在全世界科技界刷屏。图灵奖得主、主导MetaAI研究的首席科学家杨立昆认为,DeepSeek成功的最大收获并非中国竞争对其他国家带来更大威胁是AI开源的价值使任何人都能受益。DeepSeek-R1的发布极大震动了美国科技界,不仅因其性能上比肩OpenAIo1,且完全开源以极低的成本实现了这一突破。

  • DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

    爆火的国产大模型DeepSeek又放大招,今天凌晨突然发布Janus-Pro多模态大模型,进军文生图领域。在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3击败了StableDiffusion、Emu3-Gen等热门模型。作为多模态模型,Janus-Pro不仅能文生图能对图片进行描述,识别地标景点,识别图像中的文字,并能对图片中的知识进行介绍。

  • 中国AI双子星,在硅谷教OpenAI做事?

    国内大模型圈迎来神仙打架,OpenAI一觉醒来惊呼变了天?1月20日,DeepSeek没有任何预兆地发布了DeepSeek-R1模型。不到两个小时,Kimik1.5新模型随即发布。保持一定的领先之后,2025年新的目标是如何活得更好。

  • AI大模型时代,算力隐秘的角落 | 年终复盘

    想要AI大模型能够持续迭代升级,离不开底层算力基础设施的搭建。在实现AGI这条道路上,也充满着不确定性,这对于众多玩家来说,无疑充满着更多的机遇和挑战。

  • 刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性

    今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。同样模型在增加推理时间、算力情况下成功抵御攻击。

  • 马斯克收购OpenAI引热议 OpenAI董事会:尚未收到正式出价

    近日关于特斯拉首席执行官伊隆马斯克欲收购人工智能公司OpenAI的消息引发了广泛关注。尽管马斯克的法律顾问声称已发送收购提议,但截至目前,OpenAI董事会尚未收到由马斯克领衔的财团所提交的正式报价。但Altman也坦诚地表示,他并不能百分之百确定马斯克的真实意图,甚至认为很少有人能够完全洞悉马斯克的想法。

  • 我国科学家培育出单性生殖小鼠创纪录:成功活到成年

    快科技1月30日消息,据报道,中国科学院动物研究所周琪研究员、李伟研究员、李治琨副研究员以及中山大学骆观正教授等利用胚胎干细胞工程技术,成功让两个鼠爸一起生”出鼠宝宝,并且小鼠创纪录地活到了成年。研究中,科研人员成功构建了携带20个印记区段基因编辑的孤雄(没有妈妈的遗传信息)单倍体胚胎干细胞,并将其与精子共同注入去核卵细胞,成功转化为可存活的胎儿和功能完整的胎盘。通过这种方式构建的孤雄小鼠,与普通小鼠有着显著的不同。它们的体重增长迅速,当普通小鼠体重达到20克时,孤雄小鼠的体重大约已达30克。孤雄小鼠还?

  • OpenAI开启调查:GPT-4o及4o-mini模型性能下降

    据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的

  • SB OpenAI Japan正式成立!

    今日,软银集团宣布与OpenAI建立合作伙伴关系,共同开发和销售名为Cristalintelligence”的高级企业人工智能。软银将每年斥资30亿美元在其集团公司中部署OpenAI的解决方案。Stargate的初始股权投资者包括软银、OpenAI、Oracle和MGX,其中软银负责财务,OpenAI负责运营,Arm、微软、NVIDIA、Oracle和OpenAI是该项目的关键初始技术合作伙伴。

热文

  • 3 天
  • 7天