首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好

2024-12-27 11:08 · 稿源: ​硅星人Pro公众号

像是迷雾中走出的一头怪兽,DeepSeek V3 在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又异常的好——“在预训练阶段,在每个万亿标记上训练 Dee

......

本文由站长之家合作伙伴自媒体作者“​硅星人Pro公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • AI日报:DeepSeek V3.1正式发布;企业微信5.0推出全新AI能力;快手 Klear-Reasoner 模型成功登顶

    AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布,大幅增强长文档分析和代码理解能力;企业微信5.0集成智能搜索、总结和机器人功能;快手Klear-Reasoner模型数学推理准确率超90%;谷歌Docs新增AI语音朗读功能;Firecrawl完成1450万美元融资并推出V2版本API;Meta上线AI语音翻译功能;微软Excel集成Copilot实现一键数据分析;Claude桌面客户端推动AI编程可视化;苹果Xcode将原生集成Cl

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

  • DeepSeek崩了引热议 官方深夜回应:网页/API已恢复

    8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。 许多网友也通过微博话题#DeepSeek崩了#反馈服务异常。

  • 狂飙的算力,炽热的难题:戴尔如何冷静破局

    随着人工智能、云计算和大数据驱动的新一代信息技术革命重塑全球产业格局,算力需求呈现爆发式增长。中国算力规模位居全球第二,但数据中心面临高能耗、高碳排放及成本攀升的多重挑战。戴尔科技通过软硬件协同创新,推出覆盖风冷、液冷等多场景的智能冷却方案,构建全方位能效管理体系,显著降低运营成本与碳排放,助力构建绿色低碳的数据中心底座,为未来数字经济发展提供坚实支撑。

  • 雷蛇发布北海巨妖萌猫版V3系列:现支持多平台连接

    雷蛇发布北海巨妖萌猫系列耳机新品,包括专业版V3 Pro和V3X。专业版V3支持无线、蓝牙和有线三种连接模式,配备Chroma RGB灯效、可伸缩麦克风、TriForce驱动单元和THX空间音效,专为玩家和创作者设计。V3X采用轻量化有线设计,兼容多设备,提供清晰音质。两款产品融合高性能音频与个性化设计,满足游戏、直播和移动创作需求。

  • 华为云张平安:坚持打造“算力黑土地”,加速行业智能跃迁

    8月28日,中国国际大数据产业博览会在贵阳开幕。华为云CEO张平安表示,未来十年算力需求将增长数万倍,华为云坚定打造“算力黑土地”,通过昇腾AI云服务和Tokens服务,以高性能、低成本满足客户需求。华为云算力规模同比增长近250%,昇腾AI云服务客户从321家增至1714家。在贵安部署最大规模CloudMatrix384超节点,打造东数西算标杆。张平安强调,需以AI原生思维重构应用、数据和流程,抓住智能时代机遇。

今日大家都在搜的词: