首页 > 热点 > 关键词  > 正文

元象开源高性能大模型XVERSE-65B-2底座版 提升代码和数学能力

2023-12-19 08:31 · 稿源:站长之家

站长之家(ChinaZ.com)12月19日 消息:元象宣布开源高性能大模型 XVERSE-65B-2底座版,专项提升其代码和数学能力,并保持了上一代强大的生成创作、角色扮演与工具使用等能力,为生态献上了一个 “文理兼修、大有可为” 的大模型。

XVERSE-65B-2在上一代基础上通过综合优化器状态、学习率调节策略和采样比进行了 Continual Pre-Training,训练 token 总量达3.2万亿;模型支持中、英、俄、法等40多种语言,上下文窗口为16K。

元象大模型系列坚持 “高性能” 定位,在研究人员参考一系列权威学术测评制定的六个维度、11项主流测评标准中,XVERSE-65B-2在八成测评中超越了 GPT3.5,并全面超越开源标杆 Llama2-70B 和 Falcon-180B;与 GPT4仍有差距。

最新发布的 SuperCLUE 中文通用大模型综合测评,在1052道多轮简答题和3213道客观选择题测试中,XVERSE-65B 在国内开源模型中总分第一,展现了出众实力。

微信截图_20231219083140.png

与7B、13B 相比,65B 显著提升大模型的理解、生成、逻辑和记忆等能力,可处理更多样、更困难的任务,如构建智能体(AI Agent),也通过高质量数据与搜索增强,极大降低了模型幻觉问题。

至此,元象共开源70亿、130亿、650亿参数的3款大模型,其中 XVERSE-65B 为国内最早开源、最大参数的免费商用模型。

项目地址:

  • Github:https://github.com/xverse-ai/XVERSE-65B

  • Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2

  • ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2

举报

  • 相关推荐
  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

    今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向全栈工程”的评测基准。相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

  • 酒仙桥论坛 | 大模型 “燃料荒” 如何破?可信数据打造智能时代新底座

    · 首届酒仙桥论坛, 6 天 11 场分论坛“AI 马拉松”持续热跑中,聚焦人工智能“产业创新应用、生态发展和数智未来”,政、产、学、研多方力量共议AI黄金发展期的机遇与挑战,搭建务实对话桥梁,加速科技创新和产业创新融合。4月17日上午,酒仙桥论坛可信数据服务专场顺利召开。在这场以“可信数据服务”为焦点的分论坛上,产学研专家从行业洞察与业务实践出发,围�

  • 九为健康联合华为云发布神农中医大模型智能体,解如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • 百度研发出广告推荐新系统:大模型加持、转化率提升3.6%

    近日,百度团队在arXiv上发表论文,介绍了一种名为COBRA的新算法框架,被应用于提升生成式模型在广告推荐系统中的使用效果。根据论文介绍,工程师将COBRA框架应用于真实环境中的A/B测试,结果显示转化率提升了3.6%,平均每用户收入增加了4.15%。实测效果表明,COBRA框架在利用公开数据集和工业数据集进行离线和在线评估后,均优于目前业内最先进的方法。

  • 理想自研车机系统“星环OS”公布开源代码

    理想汽车4月25日发布"理想星环OS技术白皮书",宣布启动车机操作系统开源计划。该项目将分三个阶段推进:4月23日已开源安全实时操作系统和通信总线模块;6月30日将开放完整智能车控系统及智能驾驶基础能力;7月后计划开源包含虚拟化引擎在内的完整智能驾驶系统。理想采用Apache License V2.0开源协议,已在Gitee平台创建开源组织。李想表示此次开源不设商业壁垒,预计可为汽车行业每年减少100-200亿元重复研发投入,推动行业技术共享与协作创新。

  • 理想自研星环OS正式开源!操作系统代码已开放下载

    理想汽车4月28日宣布自研"星环OS"操作系统正式开源,成为全球首个实现整车级操作系统全面开源的车企。该系统代码已通过Gitee平台开放下载,采用Apache License V2.0开源协议,覆盖智能车控、智能驾驶、通信中间件、信息安全四大核心模块。该系统不同于车载屏幕系统,而是整车全链路操作系统,包括车辆控制等核心功能。研发始于2021年,投入200名研发人员和10亿元人民币。系统采用资源集中与共享架构,支持英飞凌、地平线等主流车规芯片,芯片适配验证时间比传统闭源系统缩短80%。在性能方面,AI算力虚拟化损耗降低80%,传感器访问时延降低90%,存储资源占用减少30%,响应速度比AUTOSAR提升1倍。安全性能方面,120km/h高速状态下AEB刹停距离缩短7米。

  • 刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明

    【新智元导读】AI辅助人类,完成了首个非平凡研究数学证明,破解了50年未解的数学难题!在南大校友的研究中,这个难题中q=3的情况,由o3-mini-high给出了精确解。就在刚刚,AI完成了首个非平凡研究数学证明!完成这项研究的,是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。论文地址:https://arxiv.org/abs/2503.23758在这项研究中,作者在一维J_1-J

  • 合合信息发布“大模型加速器 2.0”,助力大模型跨越“幻觉”障碍

    近日,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,凭借其多维度升级,为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键,合合信息“大模型加速器 2.0”基于领先的智能文档处理技术,从数据源头入手,对复杂文档的版式、布局和元素进行精准解析及结构化处理,

  • 阿丘科技李嘉悦:大模型驱动的AI检测范式变革——大模型、小模型、智能体的协同进化

    3月28日,由机器视觉产业联盟主办、慕尼黑展览有限公司承办的VisionChina2025机器视觉展在上海新国际博览中心圆满落幕。阿丘科技产品总监李嘉悦在机器视觉及工业应用研讨会现场,围绕“大模型驱动的AI检测范式变革:大模型、小模型与智能体的协同进化”的主题,发表了精彩演讲。”今年,在这个快速变化的时代,我要补充一句:“AI工业视觉的格局正在加速变革,不会用大模型的将会被善用大模型的人淘汰。