首页 > 业界 > 关键词  > LLM最新资讯  > 正文

李开复估值10亿美元的LLM创业公司推出开源模型Yi-34B

2023-11-06 11:44 · 稿源:站长之家

要点:

  • 中国计算机科学家李开复创办了01.AI,旨在为中国市场开发本土大型语言模型,以满足中国对开放AI的需求。

  • 01.AI在成立七个月后发布了其首个开源语言模型Yi-34B,拥有340亿参数,表现卓越,引起了广泛关注。

  • 01.AI计划建立商业模型,同时继续开源部分模型,以满足其高昂的AI模型开发成本,以及通过应用开发生态系统为外部开发者提供易于使用的平台。

站长之家(ChinaZ.com) 11月6日 消息:李开复是一位著名的计算机科学家,他以西方畅销书《AI Superpowers》和在中国对人工智能独角兽的投注而闻名。他最近创办了一家名为01.AI的新公司,旨在满足中国市场对大型语言模型的需求。与其他中国科技领袖,如搜狗创始人王小川等一起,李开复希望建立中国版的OpenAI。他表示,中国对开放AI的需求迫切,因为与其他国家不同,中国无法使用OpenAI和Google的产品。因此,很多人正在努力为中国市场提供解决方案。

01.AI的成长速度反映了生成式人工智能领域的迅猛发展。公司成立七个月后,发布了首个开源语言模型Yi-34B,该模型表现出色,拥有340亿参数,在Hugging Face的排名中位居首位。李开复表示,他们坚信更大的模型在得到充分培训后,将始终优于质量和技术相当的较小模型。因此,01.AI计划在未来一年到一年半内发布340亿至400亿参数的模型,这些模型将比今天的模型有显著提高。

LLM 羊驼 数学大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

要实现这种模型的快速训练,01.AI需要充足的资金支持,这对于吸引一流的人才和AI处理器至关重要。尽管李开复没有透露01.AI筹集了多少资金,但他表示,公司估值已经达到10亿美元,获得了来自创新工场、阿里巴巴云和其他未披露的投资者的融资支持。此外,01.AI已经拥有超过100名员工,其中一半以上来自跨国公司和中国科技公司的语言模型专家。他们的技术副总裁是Google Bard的早期成员,首席架构师曾是TensorFlow的创始成员,并与Google Brain的杰夫·迪恩和Samy Bengio等著名研究人员共事。

李开复强调,01.AI的最终目标是建立一个生态系统,让外部开发者能够轻松地构建应用程序。他认为,不仅要发布优秀的研究模型,更重要的是要使应用程序开发变得简单,以便有吸引力的应用程序得以诞生。他相信,这是一个生态系统的发展。至于服务的细节,虽然没有透露,但他暗示公司正在尝试在生产力和社交方向上的概念,并表示如果01.AI在今年内没有发布应用程序,他将感到失望。

总的来说,李开复的01.AI计划在中国市场满足对大型语言模型的需求,同时开源部分模型,以支持研究和开发。公司计划通过建立商业模型来弥补高昂的AI模型开发成本,并努力成为一个应用开发的生态系统,以支持外部开发者。尽管中国在大型语言模型领域不如美国领先,但李开复相信,由于中国在过去12年中建立的出色移动互联网生态系统,中国可以构建比美国开发者更好的应用程序。李开复的01.AI计划有望在未来获得成功,为中国市场带来创新和解决方案。

举报

  • 相关推荐
  • 活字格通过信通院智能体专项测试,以All-in-One能力加速企业AI落地

    葡萄城自主研发的活字格低代码开发平台近日通过中国信息通信研究院“智能体平台”能力专项测试,成为首批完成测试的企业。该平台凭借All-in-One智能体开发架构,覆盖数据管理、模型接入、插件开发等八大能力域,具备强集成、高安全、易扩展特性。测试结果显示其AI开发能力达行业认可水平,可为企业提供低门槛智能体落地解决方案,已在制造、政务、医疗等领域深度应用,助力企业数字化转型。

  • AI日报:Google Skills平台向公众免费开放内部AI知识;LiblibAI 完成1.3亿美元融资;Sora更新推出“角色客串”功能

    本期AI日报聚焦视频生成领域重大进展:昆仑万维SkyReels将于11月上线新版AI视频工具;LiblibAI完成1.3亿美元融资;阿里推出夸克对话助手;豆包视频模型Seedance1.0pro实现首尾帧一致性突破;Vidu Q2全面开放API;Sora新增角色客串功能并即将推出安卓版;MiniMax海螺2.3在真实感方面超越Veo;谷歌推出免费AI学习平台"Google Skills";字节跳动Seed团队发布3D生成模型Seed3D1.0,支持单图生成高质量3D资产。

  • Ballmer:微软不会给苹果留任何余地

    冰冻三尺非一日之寒,微软与苹果之间的恩怨要追溯到上世纪90年代PC与Mac的激烈对阵,而两家的竞争直至现在也从未停止过。微软现任CEO Steve Ballmer也已经向软件商们许诺,微软将与苹果斗争到底。 在本周微软全球合作者大会上,Ballmer称:“微软的目标很明确 — 不给苹果留下任何余地。”目前,微软即将发布的新产品有Windows Phone 8、Windows 8以及新一代Xbox。Ballmer则表示:

  • 菲洛嘉医学科学升级,菲欧曼FILLMED让你逆转时光,定格青春

    在岁月面前,我们总是感叹自己的无能为力,因为每个人都要经历身体从充满力量到步履蹒跚,肌肤从光滑水嫩到布满皱纹,因此延缓衰老、永驻青春,成为了女人们永恒的梦想,这份遐想从人参果、不老丹等历史传说中就充分体现出来了。对此,为了守护广大爱美人士的肌肤状态,让每个人相遇最好状态的自己, 1978 年由法国医学美容专家、细胞生物学家Dr。 Michel Tordjman 创建了菲洛嘉实验室。 自创立以来,菲洛嘉医学便始终致力于抗衰老

  • Richard Stallman发布GNU C语言参考手册

    GNU创始人RichardStallman最近一直致力于精心编写GNUC语言介绍和参考手册,今天他宣布了GNUC语言介绍和参考手册,以涵盖GNU对C编程语言的扩展...如果你了解编程的基本概念,但对C语言一无所知,你可以从头开始按顺序阅读本手册,也可以用来学习C语言...如果你是编程的初学者,建议你首先学习一种具有自动垃圾收集和无显式指针的语言,而不是从C语言开始,其中一些好的选择包括Lisp、Scheme、Python和Java...有兴趣的计算机爱好者可以先阅读Stallman的公告:......

  • 安生乔恩整形医师余斌为FILLMED交流会带来三节大师课

    余斌作为FILLMED艺术填充臻选注射医师、美国舒铂面部假体指定临床手术专家、诺鼻尔美鼻整形大赛金奖获得者, 在为期 3 天的学术盛宴中,先后带来了关于艺术填充、鼻整形、面部假体手术三节大师课,受到现场嘉宾的们的一致好评...2019 年,以色列医疗整形发展组织对余斌的技术能力和成果案例给予高度评价,特邀余斌医生成为以色列整形美容推广大使,希望共同推动整形美容在中国乃至世界的发展......

  • LLM Guard:增强LLM安全性的开源工具包 安全使用各种等模型

    LLMGuard是一个旨在增强大型语言模型安全性的开源工具包,旨在简化LLMs在企业中的安全采用。它的设计目的是为了轻松集成和部署在生产环境中,为LLMs的输入和输出提供广泛的评估,包括清理、检测有害语言和数据泄漏,以及防止注入和越狱攻击。这一工具包的推出将有望促进大型语言模型在企业中的更广泛应用,为企业提供了更好的安全保障和可控性,从更加自信地采用这一新兴技术。

  • AutoLLM:在几秒钟内创建基于 RAG 的 LLM Web 应用程序!

    AutoLLM是一个强大的工具,能够让您在几秒钟内部署基于Retrieval-AugmentedGeneration的大型语言模型Web应用。它为开发人员提供了一种简化、统一和增强LLM应用程序的方式,具备多项核心功能,包括支持100多种LLM模型、统一API、20多种向量数据库、成本计算、以及一键将LLM引擎转换为FastAPI应用的能力。5.快速部署:通过AutoLLM,您可以轻松将LLM引擎转换为FastAPI应用,以便快速部署Web应用程序。

  • Mistral、AI2 发布新的开源 LLMs:更小,更便宜

    站长之家1月31日消息:MistralAI和Allen人工智能研究所今天发布了新的大型语言模型,它们声称这些模型在各自类别中属于最先进的。Mistral的模型被称为MistralSmall3Allen人工智能研究所发布的则是Tülu3405B。「通过这一发布,我们展示了我们在405B参数规模上应用后训练方法的可扩展性和有效性。

  • Character-LLM: 一款可训练的角色扮演智能代理 可通过LLM模拟贝多芬

    GitHub上发布了一个名为Character-LLM的项目。该项目旨在通过对大型语言模型进行训练,以模仿历史上的杰出人物,如贝多芬和凯撒大帝,通过提供特定的人物信息来捕捉他们的语言风格和思维特征。Character-LLM是角色扮演爱好者和自然语言处理领域的研究者的强大工具。

今日大家都在搜的词: