首页 > 业界 > 关键词  > 正文

通义千问72B模型荣登大模型评测平台OpenCompass榜首

2023-12-13 11:36 · 稿源:站长之家

站长之家(ChinaZ.com)12月13日 消息:中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。

OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。

在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。

微信截图_20231213113631.png

在12月初,阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩,从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型,适合于企业级和科研级的高性能应用。

据了解,通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。

举报

  • 相关推荐
  • PCEVA权威评测:忆联UH812a登顶PCIe 5.0企业级SSD巅峰

    PCEVA对忆联PCIe 5.0企业级固态硬盘UH812a进行全面评测,该产品顺序读取速度达14.9GB/s,4K随机读取性能达3569K IOPS,延迟低至55μs,在Oracle数据库、虚拟化等企业级场景中表现出卓越的稳定性和兼容性。通过SNIA SSS PTS测试,其性能超出标称值,同时通过了英特尔BKC认证及中子辐照测试,展现出高可靠性与抗辐射能力。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • Anthropic天价赔款?大模型“盗版”的100000种花样

    ​AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。 这几乎是行业内公开的秘密。2023年,《纽约时报》一纸诉状将OpenAI和微软告上法庭,正式拉开了这场战争的序幕。很快,战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告,一时间,几乎所有头部玩家都被推上了被告席。 这场大模型与版权�

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 九四智能大模型联络中心:重塑教育行业运营逻辑

    文章分析了教培行业面临的获客成本高、人工客服效率低、用户画像不清晰等痛点,指出九四智能通过AI交互引擎提供全场景智能运营服务,覆盖获客、用户运营、业务通知等环节,结合语音识别、大数据分析等技术实现降本增效,并通过典型案例展示了实际应用效果。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • 飞渡科技以25.1%的市场份额蝉联数字孪生平台榜首 引领空间智能新浪潮

    IDC最新报告显示,飞渡科技凭借25.1%的市场份额蝉联中国数字孪生平台首位。其自主研发的DTS平台融合空间智能技术,突破行业瓶颈,在智慧城市、工业制造、水利水务等领域实现深度应用。报告指出,数字孪生市场正经历技术融合创新,飞渡科技通过垂直深耕战略,推动产业数字化升级。未来将持续加大AI融合研发,助力千行百业实现数字化转型。

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

今日大家都在搜的词: