首页 > 业界 > 关键词  > 正文

高考测试成绩接近满分!夸克自研大模型通过备案

2023-12-08 14:30 · 稿源: 快科技

快科技12月8日消息,据国内媒体报道,日前,阿里智能信息事业群自研的夸克大模型已通过备案,将陆续在通识、健康、创作等领域升级内容产品与智能工具,落地一系列 AIGC 应用。

夸克相关负责人表示,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。

在搜索应用中,将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。

据悉,阿里巴巴全栈自研、千亿级参数夸克大模型于11月14日发布,在CMMLU权威大模型性能评测中,夸克大模型成绩位列榜首。

根据评测显示,夸克大模型整体能力已经超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。

官方披露,在国内专业考试测试中,夸克大模型高考成绩接近满分,并以 486 分通过临床执业医师资格考试,还具备对不良、虚假信息识别、回答和指引的出色能力。

凭借在搜索业务和智能技术上的长期积累,夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。

另外,在最新的百亿参数测试集中,夸克同样在法律、医疗、问答等多个领域中排名第一,夸克大模型在不同参数量级的对比中均表现优秀。

举报

  • 相关推荐
  • 合肥60后高考大叔已到校报到:挑战自己 不丢人

    近日,备受关注的“合肥60后高考大叔”王文生正式踏入大学校园,开启了他的求学新旅程。9月15日,王文生来到合肥一所公办职业学院完成报到手续,成为该校网络营销与直播电商专业的一名新生。 据王文生介绍,他去年10月才决定参加高考,期间付出了诸多努力。备考的日子里,他日夜与公式单词为伴,复习资料上密密麻麻的笔记记录着他的坚持。今年高考期间,他因早�

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 易鑫亮相2025数字价值年会,自研AI大模型引领汽车金融智能化变革

    易鑫入选钛媒体“2025创新场景年度AI应用TOP榜”,是汽车金融科技领域唯一登榜企业。公司坚持自研大模型路线,依托11年行业数据积累,打造自主可控的AI风控与业务决策系统。其“智鑫多维”大模型成为行业首家获生成式AI备案企业,实现全场景规模化应用。业务覆盖4.2万家经销商及上百家金融机构,科技赋能服务内蒙古牧民、新加坡企业员工等群体。未来将持续深化自研大模型+全场景应用,强化普惠金融服务与国际技术输出。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 想象力智能中高考到底有没有效果?

    2025年高考报名人数突破1335万,中考人数飙升至1540万,升学竞争激烈。在分数决定升学的压力下,“智能教育技巧提分”成为家长和考生眼中的“救命稻草”,催生了鱼龙混杂的中高考提分市场。想象力智能中高考凭借系统化提分逻辑、适配性教学设计与实战化效果验证,在众多品牌中脱颖而出,堪称提分领域的“真正王者”。其品牌实力可溯可查,师资信息全透明,课程质量更显可靠,提分数据真实可查,产品效果显著。建议家长和学生在选择提分品牌时关注近三年提分数据、师资团队真实背景及课程体系个性化,避免“一刀切”。

  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

  • 雷军谈自研手机SoC:只有做最高端才有一线生机

    今晚,小米CEO雷军举办第6次年度演讲,主题是《改变》,首先和大家聊的是小米玄戒芯片。 回忆小米造芯之路时,雷军表示,小米造芯始于2014年的松果电子,但在经历了澎湃S1”的正式发布后,雷军艰难地做出停掉SoC芯片的研发的决定。 雷军复盘得出经验:自研手机SoC,只有做最高端,才有一线生机。 雷军还称,芯片是小米走向成功的必由之路,自研手机SoC,至少要坚持�

  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

今日大家都在搜的词: