首页 > 业界 > 关键词  > 模型能力最新资讯  > 正文

中国信通院“可信 AI”大模型评测完成 近期启动编制工作

2023-04-11 19:30 · 稿源: 凤凰网科技

凤凰网科技讯 日前,中国信通院宣布,“可信 AI”大模型评测工作完成,近期将启动编制工作。

中国科学院自动化研究所、武汉人工智能研究院研发的“紫东太初”大模型参与了中国信通院组织的可信AI评测工作,顺利完成模型开发模型能力两部分评测并最终获得4 级评分,成为国内首家通过该项评测的学术机构。

参与本次评测的“紫东太初”大模型在模型开发和模型能力两个方面均表现优异。在模型开发方面,模型开发流程及工具链较为完备,从数据管理、模型训练、模型管理到模型部署,全方位支撑大模型开发工作,助力实现研发运营一体化。

在模型能力方面,该大模型支持智能语义、智能视觉、智能语音和跨模态四个任务领域。

目前,大模型工作组已吸纳成员单位60余家,覆盖大模型头部企业、互联网企业、科研院所、电信运营商、金融机构等,围绕技术研讨、产业交流、标准研制、评估测试、案例征集等方面开展多项工作,并初步取得成效。

举报

  • 相关推荐
  • 三六零首批入选信通院“智能体产业图谱1.0”

    中国信通院发布《智能体产业图谱1.0》,收录近200家智能体技术创新企业,360集团与华为、阿里、腾讯等首批入选基础支撑开发平台。图谱分为基础支撑层、通用场景层和专用场景层,其中基础层提供大模型服务、开发工具等能力。360创始人周鸿祎表示,智能体将弥补大模型"不会用工具"的短板,未来可能比SaaS大10倍。360已推出纳米AI超级搜索智能体,可跨平台获取信息并调用复杂工具,开启搜索3.0时代。4月还发布"MCP万能工具箱",接入超110款工具,推动AI应用普惠。

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 思必驰RTOS大模型解决方案丨当玩具遇上AI,陪伴更有温度

    文章介绍了多款AI陪伴机器人产品,如LOVOT、Moflin、FoloToy等,它们通过创新交互方式引领消费新潮流。针对不同场景需求,思必驰推出RTOS大模型解决方案,融合智能对话技术与DFM-2大模型,整合第三方内容资源,赋予产品情感陪伴与寓教于乐功能。该方案具备智能打断、上下文记忆、多轮对话等能力,实现自然流畅的人机交互。在儿童教育领域,AI玩具可成为智慧伙伴,提供个性化学习支持。未来,AI赋能玩具将解锁更多应用场景,持续优化用户体验。

  • 一句话搞定金融复杂工作,容联云大模型知识助理全新升级!

    容联云大模型知识助手全新升级,聚焦"更高效率、更懂金融、更好体验",推出实时语音问答与语音检索两大核心功能。升级亮点包括:1)秒级响应的实时语音问答,支持复杂金融政策解读和理财产品对比分析;2)语义穿透的实时语音检索,可精准定位海量金融文档关键信息,检索效率提升40%;3)深耕金融领域知识,深入理解业务逻辑,提供专业可靠支持;4)支持多音色切换,满足个性化需求。该助手已应用于内部管理、统数运营、营销增长和客户服务四大场景,显著提升业务效率,如客户咨询转化率提升30%、业务办理效率提升60%。

  • 宜人智科“智语大模型”备案完成,旗下宜享花开启AI+多元场景

    宜人智科自主研发的"智语大模型"成功通过国家备案,标志着公司在AI领域取得重要突破。该大模型具备文本生成、智能解析、合同审核及多语言翻译等核心功能,已应用于金融科技、智能客服等业务场景。公司将通过该技术升级核心产品"宜享花"的智能化服务,优化风控评估和智能决策支持,提升数字化服务体验。未来还将深化智能风控、自动化审批等金融场景应用,打造行业标杆级智能服务平台。公司将持续加大AI研发投入,推动"AI+金融"深度融合,加速向AI企业转型。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 华为云发布盘古大模型5.5,宣布新一代昇腾AI云服务上线,成就行业AI先锋

    华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱