11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。
3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能
4月8日,智谱开源新一代大模型GLM-5.1,整体能力全面提升。在代码能力上,GLM-5.1在SWE-bench Pro基准测试中超越GPT-4o、Claude 3 Opus,刷新全球最佳成绩。此外,GLM-5.1在长程任务处理能力上实现显著突破,可在单次任务中持续、自主工作长达8小时,交付完整的工程级成果。百度百舸基于昆仑芯硬件平台第一时间完成GLM-5.1的模型适配与集群部署,助力最新开源大模型快速投入生产环境的大规模应用。
智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推
本期AI日报聚焦多领域进展:智谱发布GLM-5V-Turbo多模态编程模型,实现视觉与编程深度融合;字节跳动火山引擎开放Seedance 2.0视频生成API;美团开源LongCat-AudioDiT,刷新语音克隆SOTA;字节豆包大模型日消耗Token破120万亿,国产模型调用量持续增长;蚂蚁数科推出专业级AI智能体DTClaw;Anthropic测试常驻代理Conway,支持独立UI与Webhook;谷歌即将开源120B参数Gemma 4模型;通义实验室发布Qwen3.6-Plus,提升编程智能体稳定性。
智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。
近期OpenClaw小龙虾火爆全球,智谱不仅推出了自己的AutoCalw澳龙软件,还发了一个适配龙虾的大模型Pony-Alpha-2,现在它正式以GLM-5-Turbo的名称问世。 GLM-5-Turbo号称全球首个专为龙虾场景深度优化的通用大模型,从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力。 具体表现方面,智谱也针对龙虾使用环�
GLM-5技术论文公开,揭示其三大核心技术:引入动态稀疏注意力机制(DSA)大幅降低推理成本,长文本能力几乎无损;构建异步强化学习基础设施,提升训练效率;构建大规模真实世界环境数据,支持复杂工程任务。评测显示,GLM-5在多项基准测试中达到开源模型SOTA,性能媲美顶级闭源模型,标志着开源AI进入长任务时代。
全球爆火、单日股价狂涨42%、被称作全球大模型第一股”的智谱日前发布GLM-5技术报告,公开了全部技术细节,正面回应套壳”蒸馏海外模型”等行业质疑。智谱在报告中指出,GLM-5是一款旨在推动编程范式从VibeCoding”转向AgenticEngineering”的下一代基础模型。在内部ClaudeCode评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7,能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus4.5。
春节期间国产AI大模型轮番登场,除了DeepSeekV4还在低调之外,几家热门模型都来了,其中智谱的GLM-5是其中热度最高的之一。从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,性能提升很明显。GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群,不仅如此,在长序列处理场景下,其部署成本更是大幅降低了50%。