首页 > 业界 > 关键词  > 正文

李开复带队创办!零一万物发布大模型Yi:号称世界

2023-11-06 13:30 · 稿源: 快科技

快科技11月6日消息,近日,创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布,正式发布首款研发的最强开源人工智能大模型系列Yi

李开复带队创办!零一万物发布首款大模型Yi:号称世界最强

此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B,其数据参数量分别为60亿和340亿,均支持开源

李开复表示:零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为世界第一的初衷和决心。”

我们组成了一支有潜力对标 OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。”

从效果上来看,Yi系列大模型确实也可以称得上是后发制人。

李开复带队创办!零一万物发布首款大模型Yi:号称世界最强

在Hugging Face英文测试公开单Pretrained预训练开源模型排名中,Yi-34B以70.72分数位列全球第一,超过了LLaMA-70B和Falcon-180B,而其参数量仅为后两者的1/2和1/5。

在中文能力上,Yi-34B在C-Eval中文能力排行榜上超越所有开源模型,同样开源的Yi-6B也超过了同规模所有开源模型。

在CMMLU、E-Eval、Gaokao三个主要中文指标上,明显领先于GPT-4;在BooIQ、OBQA两个问答指标上,和GPT-4水平相当

不过在发布中零一万物也表示,Yi系列模型在GSM8k、MBPP的数学和代码测评中表现还不及GPT模型,不过会在后期推出专长代码和数学的继续训练模型

此外,Yi-34B还将大模型上下文窗口长度刷新到了200K,可处理约40万汉字超长文本输入,而GPT-4仅支持32K、约2.5万汉字。

李开复还表示,在完成Yi-34B预训练的同时,零一万物已经启动下一个千亿参数模型的训练。

举报

  • 相关推荐
  • 从数字世界迈向物理世界!清华×生数发布最新成果Vidar,基于视频大模型实现机器人物理操作

    清华大学生数科技团队研发的Vidar模型实现具身智能重大突破,首次让通用视频大模型具备"手脚"功能。该模型通过三级数据架构(海量通用视频+中等规模具身视频+少量机器人特定数据),仅需20分钟机器人真机数据即可快速泛化到新机器人本体,数据量仅为行业领先方法的1/80-1/1200。Vidar创新性地将任务解构为上游视频预测和下游动作执行,结合逆动力学模型实现视觉-

  • AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

    本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估:1)核心能力对比,包括通用任务表现和特定领域专长;2)成本与效率,考量API调用成本和响应速度;3)本地化与数据安全,满足合规要求;4)生态与社区支持,关注开发者活跃度和文档完善度。为解决模型对比难题,推荐使用专业平台如AIbase模型广场,可一站式对比主流模型的多维参数和评测数据。通过系统化评估,开发者能更高效地选择契合业务需求的AI模型。

  • AI大模型对比完全指南:如何选择最适合你的大模型?

    文章探讨了当前AI大模型市场众多选择带来的选择困难问题。面对GPT-4、Claude、文心一言等各具特色的模型,普通用户和企业难以科学评估和选择。文章提出了一套完整的评估体系,包括基础能力、技术性能、应用场景和商业考量四个维度,并建议采用标准化测试和实际场景验证相结合的方法。同时介绍了2025年主流AI模型的特点:GPT-4o在多模态交互领先,Claude3在编程和逻辑分析突出,Gemini2.5擅长长文本处理,国产DeepSeek则以高性价比见长。最后强调选择AI模型应基于具体需求,而非简单追求性能排名,建议通过专业对比平台和实际测试来验证。

  • 哪个大模型性价比最高?用这个 AI 大模型费用计算器轻松比价

    AI大模型快速发展,但不同厂商的定价规则差异大,导致选择困难。AIbase推出的AI大模型费用计算器(https://model.aibase.com/zh/calculator)能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型,支持输入输出分开计费,实时更新官方定价,无需注册即可使用。用户只需输入文本,系统自动拆分token数并精准计算费用,结果清晰直观可排序。建议根据场景需求选择模型:平衡成本与性能可选GPT-4o、DeepSeek-V2;高精度需求选GPT-4 Turbo;中文场景优选国产模型。使用前通过计算器模拟成本,可避免项目超支风险。

  • AI大模型那么多,该如何科学对比选型?

    文章探讨了当前AI大模型选择的困境,指出随着国内外模型数量激增,用户面临选择难题。作者提出应从实际需求出发,考虑模型能力、成本、使用方式、中文支持等核心维度,避免只看参数规模或流行度的误区。特别推荐使用AIbase模型广场等对比工具,可快速比较多个模型的详细参数、调用方式和价格差异。文章以中文写作为例,对比了通义千问、月之暗面、文心一言和GPT-4�

  • 男子编造2岁女儿被抱走遭处罚:为博关注 由AI大模型生成

    近日,一则细节详尽的“2岁女儿王喵喵被抱走”的寻人启事在网络上疯狂传播,引发超百万次点击与大量转发,众多网友纷纷加入转发助力寻找的行列。 启事中描述走失者王喵喵为2岁女性,眼睛大大的,笑时会露出两颗小虎牙,在嘉兴市南湖区新丰镇乌桥超市被一大妈抱走,还附上了“父亲”与“母亲”的联系电话,字里行间满是焦灼,让人感觉是心急如焚的家长发出的求�

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 如何科学比价AI大模型?一文教你用好这个AI大模型比价免费计算工具

    本文探讨了当前AI大模型调用成本计算的重要性,介绍了AIbase费用计算器的实用功能。主要内容包括:1)不同厂商计费方式差异大,存在token/字符/调用次数等不同标准;2)AIbase工具支持主流模型费用对比,实时更新官方价格;3)提供输入输出分开计费模拟,支持自定义参数和结果排序;4)完全免费无需登录,适合快速查询。文章还给出选型建议:轻量任务选Claude Instant等低成本模�

  • 2025年国内AI大模型哪家强?上AI大模型选型对比工具,用数据说话!

    文章分析了国内AI大模型市场竞争格局,指出百度、阿里、腾讯、字节等科技巨头与初创公司纷纷布局,呈现繁荣景象。针对用户选型难题,提出需综合考虑参数规模、场景适配、成本效益等关键因素,并介绍了AIbase推出的AI大模型选型对比工具。该工具汇集主流模型最新数据,支持多维度能力对比和场景化筛选,帮助用户快速定位最适合自身需求的模型。最后强调没有"最强"的通用模型,只有最匹配特定场景的解决方案。

  • AI模型怎么计费?大模型费用计算器助你精准预算,告别复杂参数困扰

    随着AI大模型普及应用,企业开发者面临复杂的计费挑战:主流模型采用Token计费,但不同模型Token换算差异大(如1Token=1.8汉字或1汉字),输入输出Token分开计价且输出更贵,隐藏成本包括上下文累积、重复调用等。定价模式多样(按量/包月),模型间价差显著(如DeepSeek V3成本仅为GLM-4Plus的1/3)。专业工具AIbase费用计算器(https://model.aibase.com/zh/calculator)可精准预估成本,覆盖GPT-4、文心一言等主流模型,智能处理Token换算和隐藏成本,提供多模型对比分析。实际案例显示,处理10万次咨询时文心一言成本(800元)显著低于GPT-4(2000+元)。未来趋势包括价格战推动成本下降、计费模式多元化(任务分级/套餐组合),建议企业建立成本监控体系,通过场景化分析和动态模型调整实现性价比最优。AI时代,专业计费工具将成为精准控制成本的关键。

热文