首页 > 热点 > 关键词  > 正文

傅盛发布猎户星空大模型Orion-14B 拥有140亿参数规模

2024-01-23 09:22 · 稿源:站长之家

站长之家(ChinaZ.com)1月23日 消息:1月21日,猎户星空在傅盛2024开年 AI 大课暨猎户星空大模型发布会上发布了猎户星空大模型(Orion-14B)。这是一款由猎户星空研发的预训练多语言大语言模型,拥有140亿参数规模,覆盖了常见语言和专业术语,并在多个第三方测试集上取得了同级别模型的最佳效果。

猎户星空大模型的特点包括:支持超长文本,最长可达320K token;在千元级显卡上推理速度达到31token/s;多语言能力优秀,尤其在日语和韩语方面表现出色;模型大小经过量化技术处理后减少70%,性能几乎无损。

微信截图_20240123092223.png

为了满足企业的应用需求,猎户星空还推出了微调全家桶,包括 RAG(检索增强生成)和 Agent 两个方向的微调模型。RAG 套件可以快速整合企业自身知识库,构建定制化的应用;Agent 套件则可以根据用户问题调用最适配的工具,解决更复杂的问题。

除了推出大模型和微调模型,猎户星空还推出了聚言人力助手、聚言云资产助手和聚言创意助手等应用,帮助企业提升运营效率和决策能力。

在发布会上,傅盛还强调,企业需要的不仅仅是大模型,更需要结合业务流程解决痛点的大模型应用。猎户星空通过提供 AI 大模型咨询与服务一站式解决方案,帮助企业实现 AI 辅助决策。

猎户星空的大模型发布是其多年来不断追踪 AI 技术演进、投入巨资研发的成果之一。猎户星空拥有顶级算法科学家团队和全球20亿用户级应用经验,同时积累了大量的用户数据和 token 数据,为研发和优化模型提供了坚实的基础。

猎户星空目前正在基于 MoE 架构训练混合专家模型,下一个里程碑是百亿参数的智能模型。

开源地址:

https://github.com/OrionStarAI/Orion

https://huggingface.co/OrionStarAI

举报

  • 相关推荐
  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 美国女孩喂流浪犬遭40只狗围咬致死:14只被实施安乐死

    远离流浪狗!尤其是身材娇小的儿童和女性,因为更容易激发它们的狩猎本能。 海外媒体报道,近日在美国阿肯色州亚历山大市,15岁少女马凯拉佛特纳喂食流浪犬时,遭40只狗围攻致死。 有目击者称,警察刚靠近一处私人住宅围栏,就有一大群狗冲过来,直到他掏出配枪朝地面开了两枪才让狗群四散逃离,而死亡的女孩就躺在不远处地面上。 几个月来,邻居们一直抱怨这�

  • 714分考生妈妈查分前梦到考了714分 妈妈:挺神奇的

    6月25日,内蒙古赤峰传来喜讯,一名男生在高考中取得了714分的优异成绩。在成绩揭晓后接受采访时,男生分享了一个有趣的细节:妈妈在高考出分前一晚做梦,梦到他考了714分。男生妈妈在得知此事后也表示,觉得这件事挺神奇的。 随着高考成绩的陆续公布,各地不断涌现出高分考生,他们的成绩不仅牵动着自身和家庭的心,也引发了社会各界的广泛关注。这位内蒙古赤峰�

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • 1400万播放背后:AI如何重塑短视频内容生产

    在短视频赛道上,AI不只是加速器,也正在成为内容创作者的“第二大脑”。本文聚焦两个真实案例: 一个是治愈系图文短视频的爆款制造,团队用AI实现选题拆解、图像生成、配音剪辑等全流程提效,仅靠1人操作,即打造出播放量高达1400万的作品;另一个则是“包租婆”IP的虚拟形象再造,通过AI驱动的形象生成与语音合成,强化角色记忆点,轻量化制作节奏拉满。 这些案例�

  • 它曾濒临倒闭,遭百家风投拒绝,如今以 145 亿美元IPO了!

    从 “100个No” 到 Nasdaq 敲钟,Chime 的逆袭堪称创业神话……

  • 北大韦神开账号了:现身4秒 说了14个字 吸粉2.4万

    近日,据短视频平台抖音显示,北大韦神韦东奕开通了个人社交账号。 截至目前,该账号仅有一条4秒的出镜视频,韦东奕本人在视频中简单介绍了一下自己:大家好,我叫韦东奕,这是我的账号。截止6月6日11:30分,该账号吸粉2.4万。 据媒体从韦东奕堂哥处了解,该账号确为韦东奕本人账号,系家人协助申请,后续,将分享数学相关内容,使韦东奕与外界有更多接触。 北�

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • Soul App全双工语音大模型升级,让AI在交互中拥有“主动性”

    社交平台Soul App近日升级端到端全双工语音通话大模型,重新定义"全双工"交互模式。新模型突破传统语音交互依赖VAD机制与延迟控制逻辑的局限,赋予AI自主决策对话节奏的能力,实现主动打破沉默、适时打断用户、边听边说、时间语义感知等类人交互体验。同时具备多维度感知、口语化表达、音色复刻等功能,让AI更具"真人感"。该技术将应用于虚拟人实时通话、AI匹配1V1互动等场景,并探索多人互动场景应用。Soul CTO陶明表示,社交是情绪价值和信息价值的双向关系,平台将持续通过技术创新为用户提供更智能、沉浸的社交体验。数据显示,71.1%年轻人愿意和AI做朋友建立情感连接,AI社交正成为重要趋势。