首页 > 业界 > 关键词  > DeepSeek-v3最新资讯  > 正文

OpenAI科学家盛赞中国大模型:算法非常强,算力用到!

2024-12-30 08:50 · 稿源: ​ AIGC开放社区公众号

OpenAI创始团队成员、高级研究科学家Andrej Karpathy很罕见地,分享了一个来自中国的开源大模型——DeepSeek-v3。Karpathy表示,DeepSeek仅用了280万小时的GPU算力,就训练出了比Llama-3405B(使用3080万小时GPU)更强的前沿模型,整体成本节省了11倍左右,将算力发挥到了极致。这

......

本文由站长之家合作伙伴自媒体作者“​ AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • Deepseek崩了上热搜 公告服务出现重大中断

    3月29日晚,DeepSeek服务出现大规模异常,相关话题冲上热搜。用户频繁遇到“服务繁忙”提示,核心功能如深度思考、长文本推理、代码生成等均受限或无法使用。截至30日,服务仍未完全恢复,官方尚未发布正式故障公告及补偿方案。

  • DeepSeek专家模式上线 此前V4版本已开启灰度测试

    近日,智能交互平台DeepSeek迎来重要更新,正式上线专家模式,旨在为用户在处理复杂问题时提供更为卓越的体验。此次更新是DeepSeek自走红以来,首次在产品端引入模式分层设计,标志着其在功能优化与用户体验提升上迈出了重要一步。 在最新版本的DeepSeek中,用户在输入框上方即可清晰看到新增的“快速模式”与“专家模式”选项。其中,快速模式主要针对日常对话场景设

  • DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定

    DeepSeek正式上线专家模式,进一步提升用户在处理复杂问题时的体验。 最新版本中,DeepSeek输入框上方新增快速模式”与专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 快速模式侧重日常对话,即时响应速度快,还支持图片和文件文字识别。 专家模式则专注解决复杂问题,支持更深入的思考和智能搜索。尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 �

  • DeepSeek已恢复服务:此前公告服务出现重大中断

    AI大模型服务商DeepSeek经历了一场服务中断的风波后,现已全面恢复正常运行。据悉,3月29日夜间至30日上午,DeepSeek的网页端和手机App突然出现无法正常使用的情况,大量用户反馈无法发起新对话,现有对话也遭遇中断,相关功能近乎瘫痪。这一突发状况迅速引发了广泛关注,相关话题甚至冲上了热搜榜。

  • 品牌在 DeepSeek/豆包搜索结果中不显示怎么办?GEOBase 一站式诊断 AI 可见度

    2026年,AI搜索(AIGC Search)已成为主流流量入口,品牌面临的最大危机是“AI根本不知道你是谁”。文章分析了全球及中国GEO市场竞争格局,指出市场已形成“综合型大厂”与“技术型精锐”并行的局面,并列举了PureblueAI、蓝色光标等十家头部服务商的核心定位。同时,文章拆解了头部服务商的三种核心策略:RAG适配、引用率保证和语义舆情对冲。针对品牌在AI回答中“消失”的痛点,2026年的工具已从“搜排名”进化到“语义监测”,并介绍了GEO诊断系统、AI引用追踪器等工具如何解决具体问题。最后,文章以GEOBase为例,阐述了其基于“站长之家”背景的差异化竞争优势:权威性、工具化、平民化,以及极致的性价比。

  • DeepSeek V4又又灰度测试:全新界面、多模态重大升级没跑了

    快科技4月7日消息,DeepSeek V4预计本月发布,新模型可能包含快速版、深度版及多模态版三款,支持视觉功能。此前系统崩溃和灰度测试均暗示升级在即。程序员展示的新界面含快速、专家及视觉选项,与现有界面形成对比。此外,DeepSeek至少还有两款使用国产芯片的大模型在开发中。用户期待官方正式发布,并希望推出面向AI编程的特别版。

  • 字节跳动发布全双工语音大模型Seeduplex!豆包率先接入:打电话可边听边讲

    字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。 目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。 Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破: 精准抗干扰:

  • 聚焦大模型量化技术攻坚,魔乐“极限压缩 量化未来”GeekDay上海站圆满落幕

    近日,“极限压缩+量化未来”Modelers GeekDay上海站在模速空间成功举办。活动聚焦大模型量化技术,汇聚学界与产业界专家,探讨量化算法创新与工程化实践。量化技术是大模型从实验室走向产业的关键,但庞大算力需求构成现实瓶颈。模型量化作为核心压缩技术,是在有限算力下实现高效推理的关键路径。活动通过主题分享与实战挑战相结合,推动量化技术从“可用”向“极致好用”迈进。实战挑战赛全面考察开发者在量化工程化落地中的综合能力,来自小鹏汽车的开发者斩获冠军。本次活动不仅是技术比拼,更是国产算力生态与开发者深度互动的一次实践。

  • 小龙虾有更便宜的Token了 国产大模型MiniMax 2.7确认本周开源

    最近小龙虾OpenClaw大热,大部分人主要的消耗还是Token词元费用,这也导致国产大模型异军突起,MiniMax 2.7就长期占据调用量前列。 MiniMax 2.7大模型发布有段时间了,但是一直没有开源的消息,现在官方在Huggingface社区终于透露了具体的计划,对OOS开发者表示歉意,称他们低估了开源所需的工作量,目前还在执行一些基础设施的适配工作,预计本周末发布MiniMax 2.7开源。

今日大家都在搜的词: