首页 > 业界 > 关键词  > 正文

国内首个官方大模型评测结果出炉!阿里云通义千问首批通过评测

2023-12-22 21:16 · 稿源: 快科技

快科技12月22日消息,国内首个官方大模型标准符合性评测”结果公布。

阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。

据悉,本次通过评测的首批大模型中,通义千问是唯一的开源模型,在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。

12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜。

此后又登上国内上海人工智能实验室OpenCompass榜首,成为业界公认的性能最强开源大模型。

目前,通义千问APP可在苹果和安卓各大应用商店中下载体验,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。

据了解,大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。

该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。

举报

  • 相关推荐
  • AI日报:阿里通义千问登顶全球开源模型榜首;MiniMax推Speech-02语音模型;​ChatGPT付费用户激增至2000万

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单2024年4月2日,HuggingFace发布了最新的大模型榜单,阿里巴巴的Qwen2.5-Omni凭借其卓越的性能和多模态能力,成功登顶,成为全球开源模�

  • 国家天文台、阿里云联合发布全球首个太阳AI大模型:耀斑预报准确率超91%

    中科院国家天文台联合阿里云,发布了全球首个太阳AI大模型金乌”,基于阿里通义千问系列开源模型,目前在M5级太阳耀斑预报上准确率超91%,这也是该级别太阳耀斑预报的最高水平。太阳耀斑是太阳表面发生的剧烈能量释放事件,会辐射出大量带电高能粒子,影响地球电磁环境,严重时可造成大范围停电,威胁在轨卫星、空间站的安全。值得一提的是,中科院国家天文台的星语”大模型、中科院青藏高原研究所的全球首个水能粮大模型洛书”、中科院南海所的珊瑚礁多模态大模型瑶华”,都是基于阿里通义千问系列模型打造的。

  • AI更有感情色彩!星纪魅族宣布:深度接入阿里云全模态大模型Qwen2.5-Omni

    星纪魅族首席运营官廖清红宣布,公司将深度接入阿里云首个端到端全模态大模型Qwen2.5-Omni,这一举措将显著提升星纪魅族产品的AI情感理解能力。通过此次合作,星纪魅族能够在复杂任务中提供更智能、更自然的反馈与决策,标志着公司在AI领域的进一步发展。今年星纪魅族的新品计划还包括眼镜、AIDevice、车上的产品以及手机,并将推出车机FlymeAuto和手机Flyme的大版本更新。

  • 阿里开源通义模型:指定首尾图片生成视频

    快科技4月18日消息,据报道,阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面,智能生成720p高清过渡视频,为视频创作带来全新可能。该模型通过先进的深度学习算法,能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后,模型会智能分析画面中的视觉元素,包括物体形�

  • 阿里云百炼MCP服务上线:高德、无影等首批接入

    据报道,阿里云百炼平台正式推出全生命周期MCP服务,将大模型应用开发门槛降至新低。该服务实现了从资源管理到部署运维的全流程自动化,用户仅需5分钟即可快速创建连接MCP服务的智能体,让大模型技术真正转化为生产力工具。这一创新服务标志着大模型技术正从实验室走向产业化应用的新阶段。

  • 阿里云,一场对阿里关注度的无声转移

    随着DeepSeek的出圈,通义大模型团队也有了更多大的压力,一位通义的员工称,他们的模型现在最大的困扰是“叫好不叫座”;虽然阿里云作为开放平台,可以部署其他家模型,但是保持住自研大模型的领先性,“守住开源的地位”成了高层对他们的新要求。‍‍‍‍‍‍‍‍‍‍‍‍‍‍阿里云,对于阿里,很重要。阿里云在长期基础设施的大投资下,是负重前行;加上与华为�

  • 何小鹏“剧透”:小鹏训练的一个物理大模型国内车企“独一份”

    快科技4月14日消息,今日早间,小鹏汽车创始人何小鹏在社交平台发帖称:作为最早把「智能化」作为核心的车企,小鹏的本质是「AI汽车公司」,我认为AI 最大的价值在于改变物理世界,而不仅是数字世界,我们要做一家面向全球的AI汽车公司,我更想通过 AI 来改变物理世界,这是很有意义的,但难度也更大。小鹏坚持全栈自研,去年率先在自动驾驶领域引入强化学习、模型

  • 通义+夸克,阿里AI要ToC

    AI世界忙得不可开交。先是DeepSeek发布最新版本,V3-0324;然后阿里云通义千问开源更小尺寸的视觉理解模型Qwen2.5-VL-32B-Instruct。只是那个APP是通义?还是夸克?还需要等待一个“DeepSeek时刻”。

  • 九为健康联合华为发布神农中医大模型智能体,解码如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • 易鑫宣布年内推出汽车金融行业首个Agentic大模型

    4 月15日,易鑫(02858.HK)在香港举行的“2 025 世界互联网大会亚太峰会”上宣布,将于年内推出汽车金融行业首个Agentic大模型。该模型通过自主决策智能体深度结合汽车金融场景需求,有望从根本上解决行业中长期存在的效率瓶颈和痛点。易鑫首席AI科学家、高级副总裁张磊现场演讲易鑫首席AI科学家、高级副总裁张磊在大会“人工智能大模型论坛”做主题演讲时,发布了这�