首页 > 业界 > 关键词  > MosaicML最新资讯  > 正文

Databricks 以 13 亿美元收购 OpenAI 竞争对手 MosaicML:打造企业定制化生成式 AI 模型的未来

2023-06-27 10:22 · 稿源:站长之家

站长之家(ChinaZ.com) 6月27日消息:Databricks 同意以约 13 亿美元的估值收购生成式人工智能初创公司 MosaicML,此举旨在满足企业构建类似 ChatGPT 的工具的快速增长需求。

OpenAI ChatGPT,人工智能,AI

总部位于旧金山的数据存储和管理初创公司 Databricks 表示,此次交易将其支持人工智能的数据管理技术与 MosaicML 的语言模型平台相结合,使企业能够利用专有数据自行构建低成本的语言模型。目前,大多数企业依赖于在网络上公开数据中训练的第三方语言模型。

同样总部位于旧金山的 MosaicML 成立于 2021 年,将成为 Databricks 的一个独立服务。据 MosaicML 的联合创始人兼首席执行官 Naveen Rao 称,该公司专注于将使用生成式人工智能的成本从数千万美元降低到每个模型数十万美元。MosaicML 目前拥有 62 名员工,并已筹集了 6400 万美元的资金。

预计该交易将在 Databricks 截至于 7 月 31 日的第二季度结束时完成。

生成式人工智能应用程序旨在根据用户的自然语言提示生成原创文本、图像和计算机代码。自从 AI 初创公司 OpenAI 在去年 11 月推出 ChatGPT 在线生成式 AI 聊天机器人以来,企业对该技术的兴趣大幅增长。

像 Anthropic 和 OpenAI 这样的公司会向企业授权现成的语言模型,然后企业在其基础上构建生成式 AI 应用程序。由于这些模型的强劲商业需求,生成式 AI 市场迅速扩大,为像 MosaicML 这样的初创公司创造了机会,他们声称可以以更低的成本提供类似的 AI 模型,并根据公司的数据进行定制。

Databricks 首席执行官 Ali Ghodsi 表示:「如果你从零开始构建一个模型,就知道要为其提供什么内容。」Ghodsi 说,现成的模型因已在互联网数据上进行了训练,其中充斥着可能会扭曲结果的无关信息。他说,许多公司也担心与外部供应商共享其数据所涉及的隐私和安全问题。

一些机器学习专家和 AI 供应商表示,像 ChatGPT 这样的大型语言模型的计算和综合能力超过了小型模型,但后者在特定领域具有有限但强大的功能。毕马威美国人工智能负责人 Sreekar Krishna 表示,数据管理和确定哪些模型最适合特定的用途仍然面临持续的挑战。

「数据一直是成功的关键因素,」Krishna 说,随着大型语言模型的出现,对数据的需求只会增加。

企业技术领导者正面临着准备他们的数据,以用于 AI 模型的压力。数据是所有算法的基础,因为它们用于教授算法从中提取模式并做出预测。像 Replit 这样的公司,提供编程工具,已经在使用 Databricks 作为数据管道,并将这些信息传输到 MosaicML 来训练代码生成模型。

Databricks 技术被称为 Lakehouse,旨在为 AI 应用准备和管理企业数据,统一数据、分析和 AI 编程工具到一个系统中。Databricks 通过出租分析、AI 及其他基于云的软件,以利用 AI-ready 数据为构建企业技术系统提供「镐和铲子」,从中赚取收入。去年,Databricks 报告了超过 10 亿美元的年收入。

据 PitchBook 数据这家市场分析公司称,全球生成性 AI 市场的支出预计将在今年年底达到 426 亿美元,并以每年 32% 的复合年增长率增长到 2026 年的 981 亿美元。它表示,生成式 AI 初创企业获得的风险投资从 2022 年总额 48 亿美元增长到了 2023 年前 5 个月的 127 亿美元。

Databricks 成立于十年前,由加州伯克利的一组数据科学家创建,经过 2021 年 8 月的 16 亿美元筹资轮后,私募市场估值为 380 亿美元。它的投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德、UC 投资以及 ClearBridge 投资。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,专门的医疗数据训练模型的当前成本估计为 100 万至 200 万美元。分析人士说,那些「特定领域」的模型对公司来说比 ChatGPT 更有用,因为它们拥有更多行业术语和专业知识。

但 Pickett 期望 Syneos HeAlth 可以通过使用较小的预训练模型,而不是基于 OpenAI 完整数据语料库来构建的模型,花费显著的较少资金。「并非每个人、每个应用都需要 GPT-4,」Krishna 说,他指的是 OpenAI 的大型语言模型。大型语言模型正在变得精细,用于非常特定的应用,他说,「到了那个时候,它非常小,可以嵌入任何手机中」。

举报

  • 相关推荐
  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • AI日报:微信开放平台发布AI生态接入指引;月之暗面再融资20亿美元;ChatGPT紧急上线封锁模式

    【AI日报】今日要点:微信开放平台发布AI生态接入指引,小程序可调用微信AI能力;高德发布全球首个3D原生城市世界模型ABot-Earth0.5,覆盖190多个国家和地区;OpenAI推出ChatGPT“锁定模式”防数据泄露;中国AI大模型周调用量达14.19万亿Token,连续六周超越美国;腾讯发布首个智能体行业应用LearnBuddy;顾全全确认离职字节跳动Seed团队;月之暗面再融资20亿美元,估值达300亿;苹果计划在WWDC2026推出全新AI战略,升级Siri并引入Google Gemini。

  • 火山引擎 “Data + AI” 双轮驱动,打造面向 Agent 的企业数据新基建

    AI正从“可用”迈向“好用”,企业大数据期待被重新定义。IDC预测,到2029年全球非结构化数据占比将超80%,Agent也正从工具演变为主动消费数据的角色。近日,火山引擎与NVIDIA联合举办行业沙龙,探讨Agentic时代的数据底座、多模态数据湖等议题。Data Agent成为热点,火山引擎提出“80%准确+快速迭代”路径,推动数据应用从BI向Data Agent演进。其多模态数据湖方案通过Lance格式、Daft引擎和开源Gravitino等技术,构建AI时代新基建,强调场景牵引、数据筑基、模型升级、智能落地,持续为垂类业务提供高质量数据供给。

  • 混合云+Data+AI,华为云Stack新战略定义政企数智跃升新范式

    华为云INSPIRE大会在上海举办,以“全新混合云,Data+AI定义政企数智跃升新范式”为主题。论坛汇聚政务、金融等行业客户,探讨政企如何基于混合云融合数据与AI技术,实现核心生产力跃升。华为发布“混合云+Data+AI”战略,升级Agentic Infra、AI-Ready数据平台等三大能力,并发布白皮书。行业标杆客户分享实践,如浦发银行构建韧性云底座、京能集团推出“擎睿”大模型、宝钢用AI炼钢等。华为云Stack已服务全球超5500家政企客户。

  • 腾讯云面向Agent升级数据平台:DataBuddy、WeData与AI原生数据底座亮相

    腾讯云宣布面向Agent升级全栈数据平台,通过DataBuddy、WeData和AI原生数据底座三层架构,构建人机协同的智能入口、统一控制面和数据底座。DataBuddy作为生产级数据智能体,可自动完成数据建模、ETL开发等复杂任务,将重复开发工作量降低80%,研发效率提升5-10倍。WeData通过统一语义层将自然语言转SQL准确率提升至90%以上。AI原生数据底座从存储、计算、系统到数据分析四层面智能化升级,支持多模态数据处理和Agent协同工作。同时,面向政务、金融等行业升级TBDS私有化平台,加速Agent规模化落地。

  • DAU已死,Token无用:李彦宏用DAA终结了AI的度量衡之争

    ​今年4月,AI行业出现了一组让投资人坐立难安的数据:Anthropic年化营收突破300亿美元,正式超过OpenAI的约250亿美元。 但反常的是,据第三方机构估算,Claude的月活用户仅约为ChatGPT的2.44%。以及,Anthropic的模型训练投入只有OpenAI的四分之一。 更低的投入、更少的月活,却做到了更高的收入。 按移动互联网的DAU(日活用户数)铁律:用户规模越大、网络效应越强、商业化效率越

  • 美团Tabbit的百日狂飙

    过去,医疗卫生条件差,新生儿很容易在百日内夭折,过了百日后夭折风险便会显著下降,民间逐渐形成了“百日宴”的传统。 人如此,产品亦然。 3月2日,美团旗下光年之外团队推出的AI Native浏览Tabbit开启公测,经过100天、12次版本迭代后,于6月9日,踩在高考周期内,交出了1.0的答卷。 一位内部人士此前告诉光子星球,团队有很多想法,但不确定哪些是用户真正愿意买�

  • 纽约大学阿布扎比分校成功研发实时手语翻译系统ChatSign

    纽约大学阿布扎比分校推出ChatSign商业化AI系统,可实时将口语翻译成手语,帮助全球数百万听障人士实现顺畅沟通。该系统由教授Yi Fang领衔研发,已支持阿拉伯语和英语翻译为美式手语和阿联酋手语,并计划扩展双向翻译功能。自2024年创立以来,ChatSign快速从科研概念发展为功能性原型,已获专利保护,并在多项国家级活动中亮相。未来10年内,团队计划将设备推广至全球,推动无障碍沟通和社会共融。

  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • 销售易亮相香港Tencent Cloud Day,用AI CRM助港澳企业链接全球

    5月28日,销售易在TENCENT CLOUD DAY HONG KONG 2026上展示了AI CRM的国际化与本地化能力,作为腾讯旗下连续九年入选Gartner SFA魔力象限的中国CRM厂商,其针对港澳企业面临“向内”连接内地市场与“向外”拓展全球业务的双重挑战,推出支持多语言、多币种、多时区及跨境合规的解决方案。通过AI原生CRM NeoAgent 2.0,整合微信私域与WhatsApp,实现“左手大陆,右手国际,香港做桥”的无界生意。销售易已在全球50余国部署近1500个网络加速节点,并建立本地化团队提供全流程支持,助力港澳企业稳定增长。

今日大家都在搜的词: