首页 > 业界 > 关键词  > kimi最新资讯  > 正文

月之暗面撞上算力墙?

2024-05-07 16:33 · 稿源: 字母榜公众号

声明:本文来自微信公众号“字母榜”(ID:wujicaijing),作者:赵晋杰,,授权站长之家转载发布。

“不好意思,刚刚和Kimi聊的人太多了。Kimi有点累了,可以晚点再问我一遍。”近期正在赶毕业论文的娄晓彤,时不时仍会收到AI助手Kimi无法使用的提示。

作为大模型初创公司月之暗面旗下的To C应用,自3月份更新成为国内首个支持200万字上下文的大模型产品后,Kimi爆火出圈,QuestMobile数据显示,Kimi 应用月活用户量在3月份飙升至589.7万,但算力焦虑也随之而来。即便距产品更新已经过去一个多月,娄晓彤的遭遇仍在部分用户身上逐一上演。

图片

月之暗面向字母榜解释称,“其实是因为每天都有相对的高峰期和低谷期,高峰期可能会遇到(类似娄晓彤的)情况。”

每次产品更新,对大模型公司而言都是一次流量和算力的双重考验。在3月18日宣布支持200万字上下文后,彼时Kimi便遭遇一次大规模宕机:从3月21日开始,Kimi APP和小程序被爆均无法正常使用。月之暗面随后发布情况说明,“观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。”

理论上,Kimi等AI助手可以支持的用户量几乎没有上限,只要大模型公司能够提供源源不断的算力供给,但这背后涉及的却是一个现实的效率平衡问题,在商业化尚未走向闭环的当下,这也是一众大模型产品的共同难题:配置冗余算力,难免带来部分时间段内的资源浪费;配置紧张算力,则不可避免会在高峰期内影响用户体验。

尚需投资储备算力资源的月之暗面,在近期被爆出创始人杨植麟通过售出个人持股已套现数千万美元消息后,更是一时间引发诸多猜测。

图片

同样困在商业变现中的OpenAI,为了尽可能追求效率平衡,在免费版ChatGPT之外,特意设计出了付费版ChatGPT Plus。高峰时段,ChatGPT Plus用户将享有优先使用权,可以获得更迅速的服务响应。

但随着用户规模暴涨,自去年2月推出付费版以来,OpenAI曾几度暂停ChatGPT Plus新用户注册,给出的理由是“需求量过大”,导致算力资源出现缺口。

大模型产品的规模效应和网络效应仍处在市场潜伏期。这也使得部分投资人开始对大模型产品去魅,典型代表如金沙江创投主管合伙人朱啸虎,其在接受腾讯科技采访中表示,从2023年下半年开始,自己便决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化,“打了半年我不打了,没有意义。”相比期待大模型产品在未来某一时刻迎来“iPhone时刻”,朱啸虎更在意当下能马上变现的To B应用。

资本市场对大模型商业化的担忧更是进一步体现在刚刚发布财报的Meta身上。“即使将我们的许多现有资源转移到人工智能上,在我们从这些新产品中获得大量收入之前,我们仍然需要扩大我们的投资范围……这将是一个持续多年的投资周期。”扎克伯格宣告扩大对AI投资话音落地,当地时间4月25日,Meta股价盘后应声下跌超10%。

对于Kimi这类缺乏自身造血能力的大模型创业公司而言,相比Meta,其面临的挑战只多不少:在这场效率平衡游戏中,它们宛如行走在悬于空中的钢丝绳上的杂技演员,投资款便是平衡木,到达对岸的唯一路径,便是在投资款耗尽之前,找到能够自我造血的商业模式。

A

春节期间,娄晓彤被身边同学安利了Kimi,当时Kimi支持的上下文长度只有20万字。加上彼时还未出圈,在日常使用中,娄晓彤基本没遇过无法使用情况。

随着Kimi将上下文长度扩展到200万字,并通过在资本市场上衍生出Kimi概念股火速出圈,从3月中旬开始,娄晓彤遭遇Kimi提示“有点累了”的情况,逐渐多了起来。

娄晓彤正在遭遇的算力紧张,从Kimi诞生后便已是注定的局面。去年3月创立月之暗面后,杨植麟便定下了做产品的两大思路:只做To C,且坚持长文本路线。

图片

图源:月之暗面官网截图

文本长度和算力成本之间不可调和的矛盾,以及To C和高额营销成本之间的取舍,成为摆在杨植麟面前的两重平衡难题。

3月份Kimi借助支持200万字上下文出圈后,新浪科技曾报道称,Kimi用户获客成本达到12元-13元,其每天获客成本超过20万元。

大模型耗钱也早在杨植麟预料之中。“它需要人才聚集、资本聚集。”杨植麟形容道。

短短一年多时间内,月之暗面已经拿下近百亿人民币投资:2023年,月之暗面完成两轮总计近20亿人民币投资;今年2月份,月之暗面完成新一轮10亿美元融资,由阿里巴巴领投,红杉中国、小红书、美团等机构跟投,投后估值超过25亿美元。

近百亿融资款,更多都被用以支付算力资源。据市界报道,新一轮10亿美元融资款中,领投方阿里出资的8亿美元并非全是现金,其中部分将以阿里云提供的算力结算。

这方面行业早有惯例。更早之前微软百亿美元投资OpenAI,其中大部分投资款便是以微软云服务提供的算力资源结算。在微软参投之前,OpenAI其实是从谷歌云服务采购算力资源。如此一来,微软投出去的钱,大部分又以云服务的方式流了回来。

更重要的是,微软还借此完成了股价飙升,总市值不仅突破3万亿美元,更是超越苹果,成为全球市值最高上市公司。

亚马逊随后便来了个有样学样。今年3月底,亚马逊正式完成对OpenAI最强对手Anthropic40亿美元的投资。与OpenAI一样,Anthropic也需要选择亚马逊作为其主要云服务商。

B

因算力资源而导致服务中断的现象,不只发生在Kimi一家身上,包括文心一言、ChatGPT等,都曾出现过无法正常使用的情况。

据字母榜不完全统计,每次产品更新升级的节点,便是大模型产品可能迎接“崩盘”命运的开始。

去年4月份,ChatGPT付费版本推出2个月后,ChatGPT Plus被爆暂停新用户注册,OpenAI给出的理由是“需求量过大”,导致算力资源出现缺口。付费通道恢复正常后,OpenAI再次收紧GPT-4的互动次数,从每4小时100条消息降为每3小时25条消息。

7个月后的2023年11月,OpenAI在首届开发者大会上带来一系列产品更新:全新GPT-4Turbo、自定义GPT以及上线GPT商店。在大会结束后的短短两天内,ChatGPT服务器再次崩溃:用户数量的激增又一次超过了OpenAI的算力容量。

作为OpenAI CEO的山姆·奥特曼都不得不亲自下场致歉,称新功能的热度远远超出了公司预期。“由于负载的原因,短期内可能会出现服务不稳定的情况,对不起。”

最近一次“崩盘”发生在4月份。为了再次降低使用门槛,扩大用户量,在全球185个国家/地区累积超1亿每周用户量后,OpenAI宣布用户无需注册账户就可以使用ChatGPT,“我们正在逐步推出这一功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。”

在OpenAI还没来得及将上述新功能扩散到全球所有地区时,社交媒体上已经陆续有用户反馈,自己在与ChatGPT互动时又被提示“系统错误”了。

除了采购更多算力资源来提升用户体验之外,一众大模型公司也在想方设法通过降低算力成本来满足更多用户需求。

截至4月份,国内文心大模型推理性能被爆提升了105倍,推理成本降到了原来的1%。这意味着,客户原来一天调用1万次,同样成本现在可以调用100万次。

国外OpenAI的奥特曼,更是在近期接受采访时预言,“我们(OpenAI)可以将非常高质量的AI技术成本降至接近零……如果我们没有制造足够的计算资源、供应和需求失衡,或计算成本攀升,这将导致AI成本非常高。”在奥特曼看来,未来AI技术成本将会变得越来越便宜。

C

使用更高效的硬件,便是推动AI技术成本降低的直接手段。

几乎在奥特曼预测AI技术成本将变得越来越便宜的同一时期,英伟达创始人黄仁勋又来给OpenAI送芯片,这次是量产最强一代的全球第一台Nvidia DGX H200超级计算机。OpenAI总裁格雷格·布罗克曼还特意晒出了自己、奥特曼与黄仁勋的三人大合照。

但对于已经无法获得英伟达最强芯片的中国大模型公司而言,借助人才优化算法以减少算力需求,则是另一条降低AI技术成本的路径。

4月23日,界面新闻爆出杨植麟通过售出个人持股已套现数千万美元消息后,月之暗面随即对外回应称“消息不实”,并向媒体发来了一则招聘文章说明,里面重点提到,为了吸引并留住最优秀的人才,月之暗面推出全新员工激励计划,为优秀人才提供匹配其贡献的丰厚回报。“从今年开始,我们将在公司取得重要进展时发起员工期权回购计划,确保团队成员能够分享公司发展的果实(2024年底启动首次期权回购计划)。每年定期根据工作表现进行调薪和期权增发,确保薪酬和期权充分反映出员工个人的成长和贡献。”

由此,外界也猜测杨植麟团队此次套现,其中或许便包括对重要人才的贡献奖励。

在公司创立伊始,杨植麟给出的早期招人画像便是专注找对口的genius(天才)。“公司上限是由人的上限决定的……之前有对模型动手术的能力,有训练超大规模模型直接的经验,就可以很快做出来。包括Kimi发布,资本效率和组织效率其实很高。”

与国内相比,硅谷AI人才之争,更为疯狂。马斯克本人都不得不感慨:“这是我见过最疯狂的人才大战。”为了避免特斯拉人才外流,马斯克旗下的大模型公司xAI开出了不少offer。

扎克伯格更是亲力亲为,通过个人电子邮件给谷歌DeepMind团队成员发去邀请,希望他们能加入Meta与他共事。谷歌创始人谢尔盖·布林,为了挽留即将离职转投OpenAI的员工,也同样选择亲自出马,给员工加薪加福利。

人才大战之下,根据薪资数据网站 Levels.fyi数据,硅谷机器学习和AI工程师的薪酬中位数已经接近40万美元,OpenAI总薪资中位数甚至高达92.5万美元(包括期权)。

尽管为争夺AI人才,科技巨头开支增加,但他们的一系列疯狂举动已经在股价上迎来正反馈:2024年刚过完4个月,Meta股价年内已经大涨22%,谷歌大涨19%,亚马逊大涨19%。

参考资料:

《ChatGPT 之父最新演讲:GPT-5聪明程度超乎想象,一大批 AI 初创公司的努力将变得毫无意义》APPSO

《黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了》机器之心

《如何评价月之暗面创始人杨植麟一年套现数千万美金事件?》钛媒体

《月之暗面创始人杨植麟套现数千万美金》界面新闻

《月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进》腾讯科技

《Kimi创始人套现4000万美元疑云》市界

举报

  • 相关推荐
  • 大家在看
  • Jovu:AI驱动的代码生成,快速实现从想法到生产。

    Jovu是一个AI驱动的代码生成模型,旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码,确保一致性、可预测性,并遵循最高标准。Jovu能够加速开发过程,从概念到部署只需几分钟,提供完全可操作的、健壮的后端服务,准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

  • TapScanner:全能扫描仪,AI助力,智能识别与分析。

    TapScanner是一款利用人工智能技术,将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档,提供即时洞察力,并通过扫描轻松提升日常交互。

  • TopicRanker:AI驱动的SERP分析工具,帮助用户发现易于排名的关键词。

    TopicRanker是一款AI驱动的搜索引擎排名分析工具,专注于帮助用户通过分析竞争对手的弱点,发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告,AI生成的标题建议,内容大纲,博客文章,以及增强型元描述,帮助用户优化内容创作,提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的,并且已经帮助多个企业在谷歌上排名第一。价格方面,TopicRanker提供三种不同的订阅计划,满足不同用户的需求。

  • Warmy:通过AI引擎提高电子邮件的投递率

    Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为,为每个邮箱制定个性化的预热计划,确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器,从而最大化邮件的投递率。此外,Warmy的Adeline AI引擎能够实时分析发送性能,预测最佳发送时间和频率,帮助用户提高参与度,避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能,能够主动识别并标记具有高垃圾邮件风险的邮件,帮助用户避免邮件落入垃圾邮件文件夹,确保重要邮件能够送达接收者。

  • Glitter AI:将任何流程转化为逐步指南。

    Glitter AI是一个创新的在线工具,它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程,使得向同事、客户甚至家人传授技能变得简单快捷。

  • Tourly Guide:沉浸式音频导览,让每个地标自己说话

    Tourly Guide是一款移动应用程序,通过使用人工智能技术,为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时,通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示,它由Roadly, Inc.开发,旨在通过技术提升用户的旅游和学习体验。

  • SaveDay App:随时随地保存、管理和利用内容

    SaveDay是一个智能工具,用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案,支持保存文章、网站、图片、视频等,并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护,不与第三方共享用户内容。

  • Neurture:通过了解大脑运作制定改变计划的APP

    Neurture是一个旨在帮助用户了解大脑如何运作,并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能,帮助用户打破习惯或解决成瘾行为,实现重要的其他目标。Neurture强调隐私和信任,不收集用户数据,不投放广告,不训练模型,旨在为用户提供一个安全、无负担的自我提升环境。

  • AiWatchfulCompanion:革命化的家庭护理方式,从婴儿到老年人。

    AiWatchfulCompanion是一款旨在改变我们照顾亲人方式的应用程序,它通过使用人工智能技术,为远离家乡的护理者提供实时的关怀和支持。该应用利用计算机视觉和音频分析,实时响应亲人的需求,提供连续的安全和健康保障。它还具备紧急响应功能,在无法联系到护理者时,能够向紧急服务提供事故位置。

  • Viva:使用的 Sora 同架构视频生成模型

    Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

  • 大模型之家:提供全面的人工智能大模型产业信息和创新价值研究。

    大模型之家是一个专注于人工智能大模型产业的平台,提供行业报告、技术创新动态、专家评测和奖项荣誉等信息。它通过整合行业资源,推动人工智能技术的创新和应用,帮助企业和个人更好地理解和利用大模型技术。

  • Productboard AI:利用人工智能增强产品团队的决策力和效率

    Productboard AI 是一款集成到产品管理平台中的人工智能工具,它通过分析和理解大量的用户反馈和数据点,帮助产品团队做出更明智的决策,提高工作效率,并加速产品从概念到市场的整个生命周期。它由 OpenAI 提供支持,确保数据安全和隐私保护,同时提供无与伦比的数据组合和针对产品管理工作的微调优化。

  • UserCall:人工智能语音用户访谈代理,深入洞察客户需求。

    UserCall是一款利用人工智能技术进行用户访谈的网站,它通过AI采访员与用户进行一对一的语音通话,从而收集高质量的用户反馈和洞察。这种技术可以大规模地进行用户访谈,提供比传统调查更深入的定性见解,同时节省时间和资源。UserCall的优势在于无需专业用户研究技能,能够自动进行智能跟进提问,帮助企业更好地理解客户需求,改进产品和业务。

  • VideoToPage:将视频或音频内容快速转换成结构化网页摘要的多功能工具。

    VideoToPage是一个高效的在线工具,它能够将视频或音频内容转换成结构化的网页摘要,支持多达96种语言,并具有98.5%的高准确率。用户无需订阅即可使用,特别适合需要将视频内容转换成文字资料、教程、博客文章、标准操作程序(SOP)等多种形式的个人和企业。产品提供快速的转录服务,支持长达5小时的视频,且5分钟以内的文件完全免费。此外,还提供内容的语义层次构建、内容类型定义、语义互连、富文本编辑、多语言理解等功能,使得内容的创建、编辑和发布变得简单快捷。

  • Fiskl:现代AI自动化全球会计解决方案,专为小型企业设计。

    Fiskl是一个多货币的全球会计平台,为小型企业、创业者、开发者和自由职业者提供全面的财务管理工具。它支持170多种货币和21,000多家银行,利用人工智能技术简化银行对账流程,实现零接触Stripe支付和银行对账。Fiskl的主要优点包括实时现金流和财务概览、自动化银行同步、全球支付能力、AI驱动的对账节省高达80%的对账工作量。Fiskl的定价策略包括特别优惠,例如年度订阅可享受50%的循环折扣,并提供30天免费试用期。

  • reap.video:一键将长视频转换为社交媒体短视频的工具。

    reap是一款基于人工智能的视频再利用工具,它能够将长视频内容一键转换成适合社交媒体的短视频。它通过先进的AI分析自动提取视频中最吸引人的片段,生成能够吸引观众的短片。reap支持多种语言,并提供了智能字幕生成、品牌模板定制等功能,帮助内容创作者提高内容的吸引力和可访问性,加速增长和变现。

  • 稀土掘金大模型子站:一站式AI资讯平台,连接开发者与AI技术的最新动态。

    掘金大模型子站是一个专注于AI领域的技术社区平台,提供从基础设施到最终应用的全景图,旨在帮助个人开发者和企业更好地理解和应用大语言模型技术。该平台通过提供资讯、工具和资源,促进AI技术的创新和应用,推动整个AI生态的发展。

  • Cubox:为学习而生的AI阅读器,高效筛选优质内容,提升阅读和学习效率。

    Cubox是一款专业的AI阅读器,旨在通过智能技术帮助用户筛选和整理阅读内容,提升阅读效率和学习效果。它具备自动高亮精彩内容、一键解读网页文章、专业级标注等功能,适用于需要大量阅读和学习的用户。产品背景信息显示,Cubox深受全球专业人士青睐,并且用户阅读的文章总数达到了23,325,802篇,显示了其广泛的用户基础和影响力。

  • InsideAI:实时分析工具,助你洞察竞品用户反馈。

    Inside AI 是一款基于人工智能技术的实时分析工具,它能够帮助用户追踪竞品的用户反馈和市场动态。该工具通过实时网络连接,分析用户评论,依托专有技术,为用户提供可操作的见解。它适用于独立开发者、初创公司、企业、分析师和风险投资公司等,帮助他们节省研究时间,找到正确的产品开发方向。

  • Glato AI:使用人工智能快速生成高质量产品视频

    Glato人工智能是一个通过人工智能技术快速生成高质量产品视频的平台。该产品能够自动生成引人入胜的短视频广告,帮助用户提高投资回报率,并节省创作者招聘等待时间。价格合理,定位于帮助企业提升市场营销效率。

今日大家都在搜的词: