首页 > 热点 > 关键词  > 正文

元象XVERSE开源650亿参数通用大模型XVERSE-65B

2023-11-06 10:17 · 稿源:站长之家

站长之家(ChinaZ.com) 11月6日 消息:元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。

XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。

模型通过训练了2.6万亿个令牌的高质量多样化数据,包含了40多种语言。XVERSE-65B 具有16K 的上下文长度,适用于多轮对话、知识问答和摘要等任务。模型已在多个标准数据集上进行了测试,并取得了良好的性能。

微信截图_20231106101724.png

主要特点如下:

模型结构:XVERSE-65B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持16K 的上下文长度(Context Length),能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。

训练数据:构建了2.6万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。

分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,534的分词器,能够同时支持多语言,而无需额外扩展词表。

训练框架:自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率位居业界前列。

项目地址:https://github.com/xverse-ai/XVERSE-65B

举报

  • 相关推荐
  • DocuVerse AI赋能:让企业文档“活”起来,开启智慧办公新体验

    飞天云DocuVerse通过AgentsCo AI智能体,将传统文档管理系统升级为“可对话”的知识资产。用户只需右键点击文件即可直接提问,AI能快速提炼技术专利、合同条款等核心信息,实现零门槛交互。系统支持封装高频文档集成为专属智能体(如HR政策助手、客服知识库),7×24小时响应咨询。在研发、销售等场景中,AI加速创新进程、精准匹配客户需求,推动办公模式从“人力驱动”向“智能驱动”升级。

  • 从工具到数智中枢:DocuVerse云办公的生态价值与企业数智化未来

    飞天云DocuVerse云办公系统通过"ECM+AI"双轮驱动,将数字化工具从效率工具升级为企业"数智中枢"。其核心价值在于沉淀分散的员工经验、项目流程等数字资产,构建可复用的知识库,实现个人经验向组织能力的转化。系统突破传统文档管理局限,连接数据、流程与人员,支持快速接入第三方工具并兼容现有设备。产品兼顾中小企业快速部署与大型企业个性化需求,已服务教育、制造等多行业客户,推动企业内容管理从效率提升向价值创造跨越,成为数字化转型的可靠伙伴。

  • 4199元起!华为Mate 70 Air一图看懂:6.6mm机身塞进6500mAh电池、立体双扬

    华为Mate 70 Air今天已经正式上架,以不止于薄”为核心卖点,定价4199元起。 机身厚度仅6.6mm,重量轻至208克,是华为Mate系列史上最薄直板机型,采用一体化超薄架构。 屏幕覆盖第一代钢化昆仑玻璃,支持IP68IP69防尘防水,应对日常跌落、泼溅、灰尘侵入无压力。 正面配备7英寸华为临境大屏,分辨率27601320,支持120Hz自适应刷新率、2160Hz高频PWM调光,动态峰值亮度4000尼特,支

  • 65元一个的「卡通煎饼」为何被年轻人抢疯了?

    一份卡通煎饼竟然卖到65元? 更离谱的是要排队4-5个小时才能买到,还是限量的。 海绵宝宝、玲娜贝儿、Labubu等可爱的卡通煎饼出现在成都抚琴的夜市上,这个普通的煎饼摊前被年轻人围得水泄不通,成了“网红打卡地”。 当煎饼到手后,许多年轻人却舍不得吃,像捧着珍宝一样的小心翼翼拍照。 社交平台上,卡通煎饼从传统的街头小吃爆火变身成“顶流”,引发了网友们

  • 美团“屏蔽恶意用户”功能正式上线:骑手365天内最多可屏蔽2名用户

    美团骑手App于11月2日全面上线“屏蔽恶意用户”功能,骑手在遭遇辱骂、骚扰等不当行为后,可上传录音、录像等凭证申请屏蔽该用户,屏蔽有效期一年。每名骑手最多屏蔽2名用户,期满自动解除。平台通过多种配送模式和补贴机制确保订单正常送达,同时兼顾用户体验。此举响应了骑手对公平与尊重的诉求,专家认为赋予劳动者更多选择权有助于保障各方权益。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • REDMI Turbo 5参数出炉:首发天玑8500

    REDMI Turbo 5采用6.5英寸LTPS中尺寸直屏,电池是7500mAh,支持100W有线闪充,配备金属中框、光学屏下指纹,支持IP68级防尘防水。 另外,REDMI Turbo 5将会首发搭载天玑8500处理器,这将是联发科最强悍的天玑8系芯片。 在去年12月,天玑8400正式亮相,由REDMI Turbo 4首发,这颗芯片采用了旗舰同款全大核架构设计,拥有8个主频至高达3.25GHz的Arm Cortex-A725大核,并且二级缓存翻倍,三级缓�

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • vivo Y500 Pro明天发布 旗舰级设计、同档首发2亿HP5主摄

    vivo Y500 Pro将于11月10日发布,定位国民小旗舰。新机采用旗舰级设计语言,配备1.37mm极窄边框和四款配色。首发三星HP5主摄,支持专业防抖和长焦增强算法,是全球首款商用0.5μm像素传感器。搭载天玑7400处理器、7000mAh电池,支持IP68/IP69防水和5年流畅系统。配备1.5K护眼屏,突破超视网膜PPI,支持《王者荣耀》120帧高清体验。

  • 63岁大爷头顶56斤石磨骑车 最远骑50公里已坚持24年 “为锻炼身体”

    近日,媒体报道了武汉一位63岁大爷的独特锻炼方式头顶重达56斤的石磨骑车。 这位大爷表示,自2000年起,他便开启了顶石磨运动的锻炼之旅,目的纯粹是为了强身健体。 笔者通过查阅过往报道发现,大爷的日常锻炼堪称重量级”。他每天都会头顶一块重达五六十斤的石磨,投身于各类运动项目之中,登山、跑步、骑行都不在话下。 据了解,大爷早在2000年,他便开启了徒�

今日大家都在搜的词: