首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

大模型不需要眼前的共识

2024-05-07 09:18 · 稿源: 窄播公众号

声明:本文来自于微信公众号 窄播(ID:exact-interaction),作者| 李威(北京),授权站长之家转载发布。

确定性的机会指向的往往是需求场景,需要实干家,不断优化体验;而不确定的机会往往依托于技术创新,需要冒险家,探索出一条通向应用的路径。这也是为什么人们不会惊讶于雷军下场造车的决心,却很难完全相信杨植麟在月之暗面创业过程中表现出来的技术理想主义。

大模型领域,并没有形成像新能源车一样的市场共识。企业在确定性和不确定性之间进行的权衡,是引发行业分歧的主要原因。选择确定性还是拥抱不确定性,决定了企业是优先赚到钱,还是优先做好技术;是坚持做闭源大模型,还是赌开源大模型一定会迎头赶上;是要依靠通用模型催生引爆行业的超级应用,还是要通过小模型先占领细分市场。

当前的环境下,企业和投资人都会从更现实的角度去做考量,活下去、挣到钱,比一个不确定的理想愿景更能说服人。但人们对大模型的期待是给行业带来更彻底地改变。从长远来看,现在很多企业的大模型应用,还是在对原有工具进行小修小补,很难产生引爆技术的应用,也很难抵御未来大模型技术迭代带来的洗牌。

泛滥的「智能体」是最明显的一个例子。国产大模型的落地催生出各种被冠以智能体名号的聊天机器人和「XX助手」。百度文心一言中充斥着大量伏地魔、繁花-爷叔这样的模拟对话机器人;kimi+上也出现了公文笔杆子、i人嘴替等个人助理;字节豆包在抖音上的推广也都依靠批改作业、练习英语口语等简单的功能点来吸引用户。

很难想象这样的聊天机器人能有多强大的生命力。如果我们对于大模型的期待仅停留在追求确定性的阶段——利用其提升智能客服的对话体验,提高资料搜集整理的效率以及扩充某些图像或生成某些代码,那么大模型能够产生的实际价值或将远不及我们现在的预期。

大模型杀手级应用的出现一定是要革掉某个现有体验的命。现在来看,没有共识就是最好的消息,至少说明这个市场上,不是所有人都只满足于眼前的利益,还有人在沿着另一条逻辑路线前行,在不确定中寻找更大的可能,去打一场持久战。

大模型的两种逻辑

中局和终局是大模型领域目前比较有代表性的两种发展逻辑。

中局的逻辑以朱啸虎(金沙江创投主管合伙人)为代表,包括一部分聚焦应用层的创业者在内,致力于利用开源大模型快速构建服务于细分需求的小模型,然后通过数据积累和模型迭代,建立竞争门槛;终局的逻辑以月之暗面为代表,倾向继续投入于大模型能力的提升,等待技术迭代引爆超级应用。

在中局的逻辑里,大模型的理解、决策能力被融合到既有的场景中,让这些场景能够应用大模型的生成能力,提升解决方案的性能,从而产生新的商业化可能性。这种逻辑受到青睐的原因是,有确定性需求,可以迅速见到成效,用户付费意愿更强。

在朱啸虎的介绍中,一家利用开源大模型做AI视频面试的企业2023年的收入比2022年翻了一倍;利用开源大模型做AIGC视频广告的公司2023年收入做到了5000多万元,比2022年涨了四五倍。

朱啸虎追求的机会是,利用LLaMA这种快速提升的开源大模型,结合垂直场景的数据积累和人工微调,在几个月内提升某一垂直场景的效率,在大模型发展过程中先赚到第一桶金。

朱啸虎对大模型的发展持悲观预期,对应用场景的开发保持乐观,主张从实际出发,把能赚的钱先赚到。

月之暗面的创始人杨植麟的理念则更具技术理想主义色彩,他相信大模型会逐步完成对世界的建模,并在这个过程中自然涌现出杀手级应用。

杨植麟的终局逻辑下,大模型是一种解释世界的工具,就像人会用语言描述世界、理解世界一样,大模型用数学为语言建模,让AI也能够理解世界,描述世界。AI依靠这种学习能力,逐步实现像人一样使用工具,让AGI成为帮助人链接和管理细分场景的「助理」。

AI能够使用工具,也就意味着很多场景的运作方式将会迎来巨大改变。可能企业未来并不需要有一个专门的视频面试工具,也不需要有独立的AI客服,而是统合到一个大模型主导的企业级智能体中,依靠智能体打通和掌控企业的不同环节。

在即将被OpenAI带火的AI搜索中,真正的难点不是搜索结果到底要以网页列表的形式显示,还是以经过AI整合的一段话来显示,而是如何利用AI的理解能力,把被APP分解的信息重新链接成为一个整体。在Kimi+中,可以看到什么值得买、小红书的相关内容可以借助个人助理「什么值得买」和「美好生活指南」来进行唤醒。

图片

但随着杨植麟2个月套现4000万美元的消息传出,市场对他的这种终局逻辑产生了质疑。月之暗面直接面向C端用户的思路,获客成本高且营收前景低。在没有新的变化出现前,月之暗面商业化前景的不明朗被认为是杨植麟信心不足,急于套现的原因。

聊天机器人发扬不了大模型

从目前来看,国内的大模型应用给到尝鲜者的总体感觉还处于大而无当阶段,提出问题之后获得的答案很难让人满意。这一方面受限于大模型自身的技术能力不足,另一方面则受限于用户对大模型应用使用经验的不足。

很多大模型应用推出之初,都仅有一个对话框,用户可以在对话框中提出任何问题并获得答案。而利用精准的Prompt充分开发大模型的现有能力,成为大部分用户难以在短时间内逾越的门槛。

目前充斥在文心一言、豆包等大模型应用中的智能体,很多都是为了降低大模型的使用门槛而打包的Prompt,也就是将一些用户的使用经验沉淀为可以被分享的智能体,让用户可以按照需求找到不同的智能体,获得更具针对性、更有效的回答。

Prompt门槛的出现本质上还是大模型在语言理解能力上存在欠缺。用户即便利用现成的Prompt获得了有效信息,也依然要面对不成熟的体验。Prompt或者所谓的智能体,可以解决初次沟通的效率问题,但解决不了复杂对话的效果问题,大模型应用往往都不止一轮对话。

这也是为什么智能体面向B端的商业化运作依然停留在客服、营销领域,并没有能推进到其他生产生活领域中。因为客服、营销领域在大模型应用之前就已经实现了基础的智能对话体验,大模型的理解能力可以让互动变得更加灵活、自然。

从李彦宏(百度创始人)演讲中提到的案例可以看到,百度在企业智能体方面的实践是提供了一套结合大模型的无代码客服机器人生成工具。企业可以上传私域知识,自动形成对话语料,也可以过滤不在自己经营范围内的内容,还能关联第三方的工具。

被包装为智能体的客服机器人,会服务于百度的搜索生态。当用户在百度APP搜索「什么时候去新加坡人最少」时,会在最前面显示新加坡旅游局AI分身给到的答案,点击可以进行更多对话。这种智能体本质上和之前的百家号、小程序一样,是百度为售卖搜索营销、云服务等产品的新切入点。

但无论是to B的客服机器人,还是to C的各种Prompt,都不具备独特性,很难成为大模型的引爆应用。现在呈现在用户面前的智能体、大模型应用,都还是只停留在优化工具的阶段,只不过是让搜索变得智能了一点。就像王小川(百川智能创始人兼首席执行官)所说,是在聚焦于搜索如何使用大模型,而不是大模型如何学会用好搜索。

理想状态下,智能体应该能够调用工具,完成更为复杂的任务,而不仅仅是聊天。这里需要提到,无论Rabbit R1是否只是一个安卓App的套壳产品,但其结合大语言模型和所谓大动作模型对APP使用体验的创造性升级,似乎更接近于一个智能体理想中的状态——通过不断学习理解人的复杂意图,模仿人的动作执行复杂操作。

我会比较赞同杨植麟所说的,技术是这个时代唯一新变量。无论是在to B还是to C场景中,在其他变量都没有变的情况下,技术对语言的理解越来越精准,对人类意图、行为的理解越来越精准,其能够处理的任务就会越来越复杂,智能体的能力才会越来越强大。

Kimi的走红,已经证明大模型应用具备了被引爆的市场基础。Kimi于2023年10月上线,2024年2月日活访问量已经在国内排到前三,在3月将无损上下文长度从最初的20多万字增加到200万字后,Kimi关注度继续走高,连续五次扩容,访问量环比增长321.58%。

没有共识就是最好的共识

当下还未解决的是,何时会出现一款让大众用户保持高频使用的超级应用。就大模型的应用现状来看,国内和国外都还处于工具优化阶段,只是取决于大模型不同的性能,效果上会有所不同。比如,Adobe对AI的最新应用仍聚焦于AI图像编辑功能的创新和改进,文生图功能的推出,以及视频内容的换头、延长和辅助镜头的生成。

面向未来,让大模型学会使用工具,而不依赖人工微调,是技术发展的又一个节点。扎克伯格说,「对于Llama-3,当我们开始进入更多这些类似于智能体的行为时,我认为其中一些将是更多手工设计的。我们对Llama-4的目标将是将更多这样的东西纳入模型。」

最终能力的大幅提升,依然有赖于大模型本身的进步。但是,大模型的每一次进步,都需要耗费一笔相当庞大的资金。根据THE DECODER披露,GPT-4一次训练成本为6300万美元。而根据AI Index的估算,OpenAI的GPT-4估计使用了价值7800万美元的计算资源进行训练,谷歌的Gemini Ultra 的计算成本则高达1.91亿美元。

高昂的训练成本也是国内在大模型方面没有形成共识的原因之一。国内大模型的融资额度要低于国外。月之暗面在2月获得了10亿美元A轮投资,Minimax3月被传获得6亿美元战略投资。相较于亚马逊向Anthropic追加的27.5亿美元投资,都不算多。而且国内的环境并不利于大模型的进一步融资。

对大模型技术未来发展的差异化预期是另外一个原因。一部分开源大模型的支持者会认为,开源大模型与闭源大模型的发展会受到大模型技术发展坡度的影响,坡度越陡,闭源的优势越大,一旦坡度变缓,开源会很快追赶上来。

等待开源大模型追赶上来的人,都预期大模型技术发展的坡度会在短时间内变缓。这样闭源大模型与开源大模型的差距就会相对缩小。而提前深耕场景,积累了一定数据的企业则能够利用开源大模型构筑不低于闭源大模型企业的场景壁垒。

对于小企业而言,以应用场景为目标训练小技能,然后不断根据技术进步重新「练号」,可以在这个大技术趋势下不断抓到小风口,甚至在大风口到来时,以插件的形式参与其中。对于巨头企业来说,其优势是多场景的融合,是对核心入口的争抢,「重开新号」的代价太高,技术的迭代往往意味着一场淘汰赛的开启。

基于融资能力的不同、对技术应用前景预期的不同、自身体量的不同,企业之间的共识并没有形成。

这是一个好消息,说明大模型领域还远未像新能源车一样进入到市场成熟阶段。虽然不确定性会增加失败的风险,但其中也蕴藏着的机会也更大,足以说服一部分企业冒险前行,追求技术的高峰。

可以理解中局的无奈,却不应放弃对终局的坚持。

举报

  • 相关推荐
  • 大家在看
  • Jovu:AI驱动的代码生成,快速实现从想法到生产。

    Jovu是一个AI驱动的代码生成模型,旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码,确保一致性、可预测性,并遵循最高标准。Jovu能够加速开发过程,从概念到部署只需几分钟,提供完全可操作的、健壮的后端服务,准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

  • TapScanner:全能扫描仪,AI助力,智能识别与分析。

    TapScanner是一款利用人工智能技术,将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档,提供即时洞察力,并通过扫描轻松提升日常交互。

  • TopicRanker:AI驱动的SERP分析工具,帮助用户发现易于排名的关键词。

    TopicRanker是一款AI驱动的搜索引擎排名分析工具,专注于帮助用户通过分析竞争对手的弱点,发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告,AI生成的标题建议,内容大纲,博客文章,以及增强型元描述,帮助用户优化内容创作,提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的,并且已经帮助多个企业在谷歌上排名第一。价格方面,TopicRanker提供三种不同的订阅计划,满足不同用户的需求。

  • Warmy:通过AI引擎提高电子邮件的投递率

    Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为,为每个邮箱制定个性化的预热计划,确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器,从而最大化邮件的投递率。此外,Warmy的Adeline AI引擎能够实时分析发送性能,预测最佳发送时间和频率,帮助用户提高参与度,避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能,能够主动识别并标记具有高垃圾邮件风险的邮件,帮助用户避免邮件落入垃圾邮件文件夹,确保重要邮件能够送达接收者。

  • Glitter AI:将任何流程转化为逐步指南。

    Glitter AI是一个创新的在线工具,它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程,使得向同事、客户甚至家人传授技能变得简单快捷。

  • Tourly Guide:沉浸式音频导览,让每个地标自己说话

    Tourly Guide是一款移动应用程序,通过使用人工智能技术,为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时,通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示,它由Roadly, Inc.开发,旨在通过技术提升用户的旅游和学习体验。

  • SaveDay App:随时随地保存、管理和利用内容

    SaveDay是一个智能工具,用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案,支持保存文章、网站、图片、视频等,并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护,不与第三方共享用户内容。

  • Neurture:通过了解大脑运作制定改变计划的APP

    Neurture是一个旨在帮助用户了解大脑如何运作,并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能,帮助用户打破习惯或解决成瘾行为,实现重要的其他目标。Neurture强调隐私和信任,不收集用户数据,不投放广告,不训练模型,旨在为用户提供一个安全、无负担的自我提升环境。

  • AiWatchfulCompanion:革命化的家庭护理方式,从婴儿到老年人。

    AiWatchfulCompanion是一款旨在改变我们照顾亲人方式的应用程序,它通过使用人工智能技术,为远离家乡的护理者提供实时的关怀和支持。该应用利用计算机视觉和音频分析,实时响应亲人的需求,提供连续的安全和健康保障。它还具备紧急响应功能,在无法联系到护理者时,能够向紧急服务提供事故位置。

  • Viva:使用的 Sora 同架构视频生成模型

    Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

  • 大模型之家:提供全面的人工智能大模型产业信息和创新价值研究。

    大模型之家是一个专注于人工智能大模型产业的平台,提供行业报告、技术创新动态、专家评测和奖项荣誉等信息。它通过整合行业资源,推动人工智能技术的创新和应用,帮助企业和个人更好地理解和利用大模型技术。

  • Productboard AI:利用人工智能增强产品团队的决策力和效率

    Productboard AI 是一款集成到产品管理平台中的人工智能工具,它通过分析和理解大量的用户反馈和数据点,帮助产品团队做出更明智的决策,提高工作效率,并加速产品从概念到市场的整个生命周期。它由 OpenAI 提供支持,确保数据安全和隐私保护,同时提供无与伦比的数据组合和针对产品管理工作的微调优化。

  • UserCall:人工智能语音用户访谈代理,深入洞察客户需求。

    UserCall是一款利用人工智能技术进行用户访谈的网站,它通过AI采访员与用户进行一对一的语音通话,从而收集高质量的用户反馈和洞察。这种技术可以大规模地进行用户访谈,提供比传统调查更深入的定性见解,同时节省时间和资源。UserCall的优势在于无需专业用户研究技能,能够自动进行智能跟进提问,帮助企业更好地理解客户需求,改进产品和业务。

  • VideoToPage:将视频或音频内容快速转换成结构化网页摘要的多功能工具。

    VideoToPage是一个高效的在线工具,它能够将视频或音频内容转换成结构化的网页摘要,支持多达96种语言,并具有98.5%的高准确率。用户无需订阅即可使用,特别适合需要将视频内容转换成文字资料、教程、博客文章、标准操作程序(SOP)等多种形式的个人和企业。产品提供快速的转录服务,支持长达5小时的视频,且5分钟以内的文件完全免费。此外,还提供内容的语义层次构建、内容类型定义、语义互连、富文本编辑、多语言理解等功能,使得内容的创建、编辑和发布变得简单快捷。

  • Fiskl:现代AI自动化全球会计解决方案,专为小型企业设计。

    Fiskl是一个多货币的全球会计平台,为小型企业、创业者、开发者和自由职业者提供全面的财务管理工具。它支持170多种货币和21,000多家银行,利用人工智能技术简化银行对账流程,实现零接触Stripe支付和银行对账。Fiskl的主要优点包括实时现金流和财务概览、自动化银行同步、全球支付能力、AI驱动的对账节省高达80%的对账工作量。Fiskl的定价策略包括特别优惠,例如年度订阅可享受50%的循环折扣,并提供30天免费试用期。

  • reap.video:一键将长视频转换为社交媒体短视频的工具。

    reap是一款基于人工智能的视频再利用工具,它能够将长视频内容一键转换成适合社交媒体的短视频。它通过先进的AI分析自动提取视频中最吸引人的片段,生成能够吸引观众的短片。reap支持多种语言,并提供了智能字幕生成、品牌模板定制等功能,帮助内容创作者提高内容的吸引力和可访问性,加速增长和变现。

  • 稀土掘金大模型子站:一站式AI资讯平台,连接开发者与AI技术的最新动态。

    掘金大模型子站是一个专注于AI领域的技术社区平台,提供从基础设施到最终应用的全景图,旨在帮助个人开发者和企业更好地理解和应用大语言模型技术。该平台通过提供资讯、工具和资源,促进AI技术的创新和应用,推动整个AI生态的发展。

  • Cubox:为学习而生的AI阅读器,高效筛选优质内容,提升阅读和学习效率。

    Cubox是一款专业的AI阅读器,旨在通过智能技术帮助用户筛选和整理阅读内容,提升阅读效率和学习效果。它具备自动高亮精彩内容、一键解读网页文章、专业级标注等功能,适用于需要大量阅读和学习的用户。产品背景信息显示,Cubox深受全球专业人士青睐,并且用户阅读的文章总数达到了23,325,802篇,显示了其广泛的用户基础和影响力。

  • InsideAI:实时分析工具,助你洞察竞品用户反馈。

    Inside AI 是一款基于人工智能技术的实时分析工具,它能够帮助用户追踪竞品的用户反馈和市场动态。该工具通过实时网络连接,分析用户评论,依托专有技术,为用户提供可操作的见解。它适用于独立开发者、初创公司、企业、分析师和风险投资公司等,帮助他们节省研究时间,找到正确的产品开发方向。

  • Glato AI:使用人工智能快速生成高质量产品视频

    Glato人工智能是一个通过人工智能技术快速生成高质量产品视频的平台。该产品能够自动生成引人入胜的短视频广告,帮助用户提高投资回报率,并节省创作者招聘等待时间。价格合理,定位于帮助企业提升市场营销效率。

今日大家都在搜的词: