高考测试成绩接近满分！夸克自研大模型通过备案

2023-12-08 14:30 · 稿源：快科技

快科技12月8日消息，据国内媒体报道，日前，阿里智能信息事业群自研的夸克大模型已通过备案，将陆续在通识、健康、创作等领域升级内容产品与智能工具，落地一系列 AIGC 应用。

夸克相关负责人表示，夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。

在搜索应用中，将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景，提升用户体验。

据悉，阿里巴巴全栈自研、千亿级参数夸克大模型于11月14日发布，在CMMLU权威大模型性能评测中，夸克大模型成绩位列榜首。

根据评测显示，夸克大模型整体能力已经超过GPT-3.5，在写作、考试等部分场景中优于GPT-4。

官方披露，在国内专业考试测试中，夸克大模型高考成绩接近满分，并以 486 分通过临床执业医师资格考试，还具备对不良、虚假信息识别、回答和指引的出色能力。

凭借在搜索业务和智能技术上的长期积累，夸克大模型利用数据、平台、知识增强等优势，可以大幅提升知识正确性。

另外，在最新的百亿参数测试集中，夸克同样在法律、医疗、问答等多个领域中排名第一，夸克大模型在不同参数量级的对比中均表现优秀。

（举报）

相关推荐

关键词：

想象力智能中高考等教育品牌分析

文章聚焦高考冲刺阶段家长如何选择提分产品。市面教育产品良莠不齐，存在师资模糊、错题多、服务差等问题。想象力智能中高考通过三大优势脱颖而出：1.名师团队与智能系统深度融合，精准定位薄弱点；2.动态迭代课程内容，紧跟考情变化；3.构建“测-学-练-固-汇”闭环服务体系，配备专属学管师。与速学霸、考试大师等产品形成鲜明对比，为考生提供真正高效可靠的提分方案。

中高考冲刺提分产品教育产品
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈，而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试，可提升测试效率300%、降低成本30%，并将产品发布周期从"月"压缩至"周"。这不仅是技术升级，更是重构IT成本结构、实现降本增效的战略支点，助力IT部门从成本中心转型为价值创造中心。

IT预算规划数字化战略 AI大模型
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
寒武纪：构建大模型开发到部署的全流程开放服务能力

华鑫证券研报显示，寒武纪2025年上半年业绩亮眼，营收28.81亿元，同比增长4347.82%；归母净利润10.38亿元，增长295.82%。公司募资39.85亿元，重点投向大模型芯片及软件平台建设，以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势，其产品已获多领域客户认可，覆盖金融、互联网等行业。未来随着技术迭代与生态完善，业绩有望持续提升。

寒武纪 AI算力芯片大模型芯片

今日大家都在搜的词：

热文

3 天
7天

高考测试成绩接近满分！夸克自研大模型通过备案

想象力智能中高考等教育品牌分析

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

易鑫正式发布汽车金融行业首个Agentic大模型

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

寒武纪：构建大模型开发到部署的全流程开放服务能力

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

雷军回应小米双11战绩：谢谢大家支持

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

站长商机