首页 > 业界 > 关键词  > AI技术最新资讯  > 正文

国产六大推理模型激战OpenAI?

2025-04-25 08:49 · 稿源: 光子星球公众号

“DeepSeek-R1如同当年苏联抢发的第一颗卫星,成为AI开启新时代的斯普特尼克时刻。”2025年春节前,DeepSeek比除夕那天的烟花先一步在世界上空绽放。离年夜饭仅剩几个小时,国内某家云服务器的工程师突然被拉入工作群,接到紧急任务,要求其快速调优芯片,以适配最新的DeepSeek-R1

......

本文由站长之家合作伙伴自媒体作者“光子星球公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 陕西一景区介绍标注作者为DeepSeek 工作人员:有版权问题

    近日,陕西渭南的一处景区引发了网友们的热议,原因竟是景区介绍牌上标注的作者是一个颇为特别的名字——“DeepSeek”。 不少游客在看到这个作者名时,都误以为是个外国人的名字,仔细一瞧才发现,这原来是一款人工智能助手的名字。景区工作人员解释说,这块介绍牌是去年摆放的,上面的内容确实是由DeepSeek生成的,主要是对尧头窑进行一个简单的介绍。

  • DeepSeek V4 Lite悄然更新:2000亿小参数性能逼近美国顶流

    虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。 DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。 然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区�

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • AI日报:MiniMax发布Expert 2.0与云端助手MaxClaw;DeepSeek V4 细节曝光;肯德基AI 点餐助手接入通义千问

    本期AI日报聚焦多款AI产品动态:MiniMax发布Expert 2.0与云端助手MaxClaw,降低专业AI Agent开发门槛;DeepSeek V4细节曝光,具备万亿参数与原生多模态能力;肯德基接入通义千问推出AI点餐助手“小K”;华强北AI眼镜在美销量暴涨;Perplexity发布通用AI代理Computer,集成多模型协同工作;三星Galaxy S26系列手机AI功能全面升级;三七互娱“小七大模型”深度落地游戏出海等场景。整体呈现AI

  • Meta调整薪酬结构:为聚焦人工智能 员工股权激励缩水5%

    为给巨额人工智能投入腾出资金,Meta正推进新一轮成本控制措施,包括将数万名员工的股权激励缩减5%。这是该公司连续第二年削减员工薪酬。去年已削减股票期权分配约10%,此次再下调5%。扎克伯格正加大AI领域投入,希望与OpenAI、谷歌等对手竞逐前沿模型开发,同时安抚尚未看到AI投资回报的投资者。他还在其他业务领域持续裁员,今年1月就在持续亏损的元宇宙部门裁减约1500个岗位。不过知情人士透露,尽管股权激励普遍下调,Meta今年仍在改革绩效考核体系,为业绩优异者提供更丰厚奖励。这意味着公司整体薪酬预算并未下降,而是进行了结构性调整。一名员工表示,考虑到当前科技行业就业市场不景气,而Meta薪酬水平仍然具备竞争力,员工大概率不会因这一变化而选择离职。

  • 华为发布新一代TaiShan服务器,以高性能、高可靠、高安全的ARM方案为全球算力市场注入新动能

    在2026年MWC巴塞罗那展会上,华为正式发布TaiShan 200/500系列服务器。该系列基于高性能ARM架构,旨在为全球企业客户提供兼具卓越性能、极致可靠与内生安全的数据中心基础设施新选择,全面支撑核心业务场景的高效运行。

  • 提升7倍 DeepSeek官宣测试全新大模型:或为V4 Lite

    前几天国产AI来了一波爆发,智谱GLM-5、Minimax2.5及DeepSeek在11日同一天都发布了新的大模型,其中DeepSeek的自然最受关注。此前我们已经报道过了,这次更新主要是提升了上下文能力,达到了1M之前的DeepSeeV3系列也就是128K,这方面相对前代V3系列大模型提升了7倍。传闻中的DeepSeekV4满血版是1.5万亿参数,比V3系列翻倍还多会使用之前DeepSeek研究的Engram、mHC等新技术,性能全面提升的同时成本还低,这个期待值还是很高的。

  • 2026年AI搜索优化服务商推荐:技术驱动型服务商深度评价,直击高价值行业精准获客需求

    随着生成式AI重塑信息分发规则,企业面临核心战略选择:如何在智能对话成为主流信息入口的时代,确保自身品牌与核心信息被准确呈现与优先推荐。传统搜索引擎优化策略面临失效风险,品牌方普遍陷入认知偏差与流量流失的焦虑。生成式引擎优化(GEO)市场正随基础大模型应用的普及而快速增长,成为企业构建AI时代品牌认知与增长引擎的关键投资领域。当前市场格局呈现初步分化,既有综合技术驱动型的定义者,也有聚焦特定场景或技术的服务商。然而,解决方案的同质化宣传、效果评估体系的缺失以及技术迭代的快速性,加剧了企业决策的信息过载与选择困境。为此,我们构建了覆盖“技术底座深度、全链路优化能力、效果验证模式、行业场景适配性”的多维评测矩阵,对市场主要服务商进行横向比较。本报告旨在提供一份基于客观事实与深度洞察的参考指南,帮助企业在纷繁复杂的市场中,精准识别能够将技术优势转化为可持续品牌资产的高价值伙伴。

  • DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

    DeepSeek于2月11日悄然更新模型,主要提升上下文能力至1M,可一次性处理《三体》三部曲等超长文本。官方强调这是最新模型,未命名特定子版本。实测显示其在编程、物理模拟等多方面能力均有提升,甚至超越此前所有版本达到SOTA水平。不过,新模型在部分具体问题(如50米距离洗车方式)上回答不一致,其是否为完整版尚不确定。

  • 获10亿美元种子轮融资!前DeepMind首席科学家离职创业:绕过大模型探索超级智能

    日前,前谷歌DeepMind首席科学家、AlphaGo核心负责人席尔瓦正式离职,并在伦敦创立AI初创公司Ineffable Intelligence。 近日,该公司正在推进一轮规模达10亿美元的种子轮融资,目前已接近完成。 该融资额度也追平了Safe Superintelligence创下的纪录。 与当前依赖海量文本预训练的大模型路径不同,席尔瓦的新公司提出了明确要求。

今日大家都在搜的词: