3月3日消息,尽管在春节档期间未见新版本发布,但DeepSeek于2月11日推出了一款名为“DeepSeek V4 Lite”的模型。该模型参数量为2000亿,相较于主流大模型规模较小。
该模型的主要特点是支持长达100万字的上下文处理能力。此前有用户反馈,除了超长上下文这一优势外,其整体表现并未引起广泛关注,部分原因在于其参数规模与主流模型存在差距。
然而,自发布以来,该模型持续进行迭代优化。2月27日,已有技术社区用户注意到其性能显著提升。近日再次更新后,来自Linux Do社区的资深开发者HCPTangHY在测试后表示,其表现“相当出色”,在其进行的多项基准测试中已达到国内同类模型的领先水平。
有观点认为,若持续投入研发,此类开源模型有望对闭源生态形成竞争压力。
DeepSeek V4 Lite模型近期性能提升引发关注
根据测试数据显示,3月2日更新后的版本,其综合评分较2月27日版本有进一步提升,性能已接近国际顶尖模型Sonnet 4.6的水平。在包括“天气卡片”生成在内的多项前端应用与交互测试中,新版模型在功能实现与视觉呈现方面均表现稳定。
回顾过去一年的技术发展,国内大模型在对话交互领域已与闭源模型差距缩小,但在多模态理解、复杂编程、数学推理及智能体构建等方面仍存在追赶空间。近期国内多家机构虽发布了升级版本,但同期国际厂商也推出了新一代产品,技术竞争持续激烈。
行业分析指出,国内研发机构在追赶过程中面临多重挑战,包括研发投入规模、计算资源储备以及数据积累等方面与国际领先企业存在客观差距。后者往往拥有更长时间的技术沉淀或更庞大的用户数据基础。
值得注意的是,国际同行在数据获取与研发投入上力度极大,此前甚至出现过因数据收集方式引发法律纠纷的案例,侧面反映出该领域竞争的激烈程度。
作为国内技术探索的代表之一,DeepSeek的进展受到业界关注。分析人士认为,若当前2000亿参数的“轻量版”模型已展现出接近顶尖水平的潜力,其完整版本的技术表现更值得期待,或将进一步影响全球该领域的技术竞争格局。
(举报)
- 相关推荐
-
荐AI日报:Claude推出Claude Design;DeepSeek开启首轮外部融资;蚂蚁灵光App闪应用突破3000万个
本期AI日报聚焦多项AI领域动态:Anthropic推出Claude Design,通过文字描述生成专业设计稿,降低非设计师创作门槛;国产大模型DeepSeek开启首轮外部融资,估值超百亿美元;蚂蚁灵光App闪应用突破3000万个,投入1亿元激励创作者。此外,Moonshot AI与清华大学发布PrfaaS架构提升大模型推理效率,NVIDIA开源Lyra 2.0支持单图生成可探索3D场景,德国法院裁定AI二次创作漫画不一定侵权。同时,Anthropic的MCP协议被曝存在重大安全漏洞,而其推出的桌面宠物Claude Buddy硬件由深圳制造,展现了AI与硬件的创新结合。
-
GLM-5.1之后Minimax 2.7正式开源:顶级国产AI就等DeepSeek V4了
稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。
-
元戎启行冲刺百万级交付,前DeepSeek核心成员阮翀将亮相北京车展
元戎启行CEO周光透在智能电动汽车发展高层论坛上表示,公司正通过基座模型推动辅助驾驶系统规模化落地,计划2026年实现百万辆量产目标。基座模型能显著降低系统开发与部署成本,使辅助驾驶能力在更大规模车型中落地。随着量产规模扩大,系统将获得更多真实数据,形成“规模-数据-模型”的正向循环,持续提升系统稳定性与安全性。目前搭载其城市NOA方案的量产车辆已超30万辆,累计运行里程超13亿公里。业内分析认为,规模化将成为自动驾驶公司竞争的重要壁垒。
-
DeepSeek专家模式上线 此前V4版本已开启灰度测试
近日,智能交互平台DeepSeek迎来重要更新,正式上线专家模式,旨在为用户在处理复杂问题时提供更为卓越的体验。此次更新是DeepSeek自走红以来,首次在产品端引入模式分层设计,标志着其在功能优化与用户体验提升上迈出了重要一步。 在最新版本的DeepSeek中,用户在输入框上方即可清晰看到新增的“快速模式”与“专家模式”选项。其中,快速模式主要针对日常对话场景设
-
DeepSeek V4又又灰度测试:全新界面、多模态重大升级没跑了
快科技4月7日消息,DeepSeek V4预计本月发布,新模型可能包含快速版、深度版及多模态版三款,支持视觉功能。此前系统崩溃和灰度测试均暗示升级在即。程序员展示的新界面含快速、专家及视觉选项,与现有界面形成对比。此外,DeepSeek至少还有两款使用国产芯片的大模型在开发中。用户期待官方正式发布,并希望推出面向AI编程的特别版。
-
DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定
DeepSeek正式上线专家模式,进一步提升用户在处理复杂问题时的体验。 最新版本中,DeepSeek输入框上方新增快速模式”与专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 快速模式侧重日常对话,即时响应速度快,还支持图片和文件文字识别。 专家模式则专注解决复杂问题,支持更深入的思考和智能搜索。尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 �
-
品牌在 DeepSeek/豆包搜索结果中不显示怎么办?GEOBase 一站式诊断 AI 可见度
2026年,AI搜索(AIGC Search)已成为主流流量入口,品牌面临的最大危机是“AI根本不知道你是谁”。文章分析了全球及中国GEO市场竞争格局,指出市场已形成“综合型大厂”与“技术型精锐”并行的局面,并列举了PureblueAI、蓝色光标等十家头部服务商的核心定位。同时,文章拆解了头部服务商的三种核心策略:RAG适配、引用率保证和语义舆情对冲。针对品牌在AI回答中“消失”的痛点,2026年的工具已从“搜排名”进化到“语义监测”,并介绍了GEO诊断系统、AI引用追踪器等工具如何解决具体问题。最后,文章以GEOBase为例,阐述了其基于“站长之家”背景的差异化竞争优势:权威性、工具化、平民化,以及极致的性价比。
-
仅需1/10 Token消耗!百灵Ling-2.6-flash正式发布:104B参数实现SOTA级Agent
今日,蚂蚁百灵正式推出 Ling-2.6-flash一款总参数量 104B、激活参数 7.4B 的 Instruct 模型。该模型主打Token 效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 据权威三方评测Artificial Analysis 数据,Ling-2.6-flash 展现了突出的 Token Efficiency 优势,以 15M output tokens 实现了 26 分 的 Intelligence Index,在保持较强智能水平的同时,将输出消耗控�
-
荐传送带热度不消,又一款新产品拿到2000万月流水
在「Pixel Flow」把混休游戏的月流水天花板干到1000万美元+之后,传送带玩法大火,包括国内厂商在内不少跟风入局者,也有2-3款产品做到了几百万美元的月流水,但基本还是“换皮思路”,在题材锚定不同受众解决获客问题之外,依然面临玩法疲劳的问题。 而 Voodoo 的这款新品,却在给到了另外“解法”的同时,实现高流水。
-
Deepseek崩了上热搜 公告服务出现重大中断
3月29日晚,DeepSeek服务出现大规模异常,相关话题冲上热搜。用户频繁遇到“服务繁忙”提示,核心功能如深度思考、长文本推理、代码生成等均受限或无法使用。截至30日,服务仍未完全恢复,官方尚未发布正式故障公告及补偿方案。
