首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

李开复官宣全球开源大模型Yi-34B 一次可处理40万汉字

2023-11-06 13:59 · 稿源:站长之家

要点:

1. 零一万物发布「Yi」系列开源大模型,其中Yi-34B成为全球开源大模型的双料冠军,击败竞品,包括LLaMA2和Falcon,表现出色,特别在中文指标上表现突出。

2. Yi-34B的上下文窗口大小为全球最长,支持200K字符,相比OpenAI的GPT-4的32K上下文窗口大幅增加,提供更丰富的语义信息。

3. 零一万物采用了科学训模方法和AI Infra团队的支持,成功降低了训练成本,提高了模型的性能,未来计划推出更多大模型。

站长之家(ChinaZ.com)11月6日 消息:零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。

QQ截图20231106135837.jpg

https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

与此同时,Yi-34B还提供了全球最长的上下文窗口,支持200K字符,相比OpenAI的GPT-4的32K上下文窗口,具有更大的处理能力。

这一成就得益于零一万物的科学训模方法和AI Infra团队的支持。他们采用了一系列优化措施,包括计算通信重叠、序列并行、通信压缩等,使大规模模型训练的能力提升了近100倍。

与传统的「炼丹」方法不同,零一万物通过规模化训练实验平台进行数据配比、超参搜索和模型结构实验,使模型的预测能力更强,减少了资源浪费。这使得Yi-34B具有卓越的性能,同时降低了训练成本。

QQ截图20231106135852.jpg

Yi-34B的开源属性也是一个亮点,它允许开发者直接使用200K上下文窗口,提供更丰富的语义信息,有助于理解超过1000页的PDF文档,以及其他依赖于向量数据库构建知识库的应用场景。

此外,零一万物计划继续训练更大规模的模型,以进一步提高性能和降低成本。未来几个月,预计会有更多的Yi系列大模型推出。

这一成就是零一万物科学训模方法和AI Infra团队的结晶,通过科学方法和技术优化,他们实现了超越行业水平的训练效果,降低了模型训练成本,提高了性能。Yi-34B的发布标志着中国在大模型领域的取得重大突破,为全球开源大模型社区带来了新的竞争力。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: