首页 > 业界 > 关键词  > 生成式AI最新资讯  > 正文

全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?

2024-07-10 17:15 · 稿源: 新智元公众号

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。

【新智元导读】面对GenAI的技术浪潮,很多人都会在不断迭代更新的技术中逐渐迷失。站在潮头的Sapphire、Emergence、Menlo等风投公司,又会如何看待这场AI变局的现状与走向?

根据Sapphire Ventures的数据,GenAI领域从2022年到2023年迎来了爆发式的增长,全球范围(不含中国)的风投资金总量从76亿美元陡增到247亿。

图片

从今年第一季度的数据来看,2023年的市场热度很有可能延续下去。

根据咨询公司Quid的统计数据,最能吸引AI方向投资的三个细分领域分别是「AI基础设施、研究和治理」、「自然语言处理」和「数据管理」。

图片

投资大量涌入,带来的直观结果就是初创公司如雨后春笋般涌现。从美国、中国到英国、以色列,都成为了AI创新的重要源头。

图片

在投资大潮的催化下,GenAI领域的技术更新也达到了前所未有的迅速。

今年1月,Menlo Ventures对于现代AI技术栈的定义还是一个简洁的四层框架,从算力和基础模型开始,到数据、模型部署,以及最顶层的模型可观测性。

图片

而短短几个月后的5月底,这个框架就已经迅速过时,取而代之的是Sapphire Ventures发布的包含200多个公司、多个领域交织在一起的复杂技术网络。

图片

而且,GenAI的发展路径不是单纯技术创新问题,商业战略、金融、教育、政策等各方面的影响交织在一起。

数据隐私问题引起了越来越多立法者的关注,AI法规即将出台的压力挥之不去;AI行业高薪的背后是持续的人才短缺,迫使科技公司不得不在内部开发和外包工作间取得平衡。

更为重要的是,控制成本、创造盈利的压力,会与技术创新的各种原动力相违背。持续不断的开源和闭源之争就是最典型的例子。

相比传统的软件公司,推理和训练的算力支出会耗费更多资金。然而,根据Emergence Capital的统计,只有58%的GenAI公司选择通过产品营利,这就又叠加了一重商业风险。

图片

「乱花渐欲迷人眼」,投资热潮、一夜暴富的表象下,入局GenAI实质是一场高风险的技术博弈。在这个瞬息万变的场域中,今天最先进的解决方案,很可能在一夜之间就被新的技术突破取代。

要面对GenAI迷宫中的这一切,也许答案只有一个——适应性。

无论是科研、技术领域的从业者,还是公司中的决策者,都需要不断调整目标和愿景,与这个千变万化的环境一同演进,才能创造出实际的价值。

数据的「量」和「质」

如果一直上溯到深度学习方兴未艾时的ImageNet,可以发现,数据始终是AI的核心问题之一。

随着近年来GenAI和LLM的兴起,数据也和算力一样,成为AI基础设施的一部分,也是需要尽力发掘的稀缺资源。

Epoch AI曾经预言,LLM到2028年将耗尽互联网上所有的高质量文本数据,阻碍Scaling Law的「数据墙」似乎就在眼前。

图片

面对数据短缺的挑战,从GenAI自身给出的解决方案——合成数据,似乎是一条仍不明朗但颇有前景的道路。

早期研究曾指出,随着合成数据比例的增加,迭代出的连续几代模型的质量和多样性都会逐渐下降。

但另一方面,较少比例的合成数据和最新的现实数据混合后训练的模型,如Google最近发布的Gemma2,却能表现出显著的性能提升。

Epoch AI的创始人也曾表示,虽然我们能看到「数据耗尽」的前景,但目前还没有感到恐慌的理由。合成数据、

多模态和迁移学习等方法都有望突破「数据墙」。

除了数据量的焦虑,数据质量和数据治理也已经成为关注的焦点。

上个月HuggingFace发布15万亿token的FineWeb数据集,就着重强调了数据质量的重要性。

微软Phi-3小模型的技术报告中,也提及了一种「数据换参数」的策略。

图片

对于企业和产品而言,数据质量的重要维度也包括语义层和数据结构(data fabrics),有望增强AI系统有效理解、使用企业数据的能力,从而带来创新的功能和用例。

初创公司Illumex就开发了一种名为「语义数据结构」(semantic data fabric)的技术,他们的CEO解释道,「data fabric有一种自动创建出来的纹理,而非预先定义好的」,可以促进更加动态、上下文感知的数据交互。

此外,AI监管和科技公司也把目光投向了数据治理领域——确保数据的使用符合伦理、安全并遵守法规。

DataBricks已经将数据治理纳入其平台的核心,被描述为「一个连续的治理体系,从数据摄取一直到GenAI的提示和响应」。

同时,Red Hat副总裁Steven Huels预测,我们会看到数据治理方面的大力推动,尤其是随着AI系统越来越多地影响关键业务决策。

端到端vs.专用解决方案

GenAI这种新兴事物显得有些复杂,有些难以理解,因此许多企业都都倾向于采用全面的端到端解决方案,这反映了决策者们希望简化AI基础设施、精简运营的愿望。

财务软件公司Intuit决定在原有的庞大生态系统中整个GenAI时,他们面临一个艰难抉择——要让数千名开发人员在现有平台的基础上构建AI吗?

最后,Intuit选择了一条更有雄心的道路:从头开始,创建一个全面的生成式AI操作系统GenOS。

图片

公司首席数据官Ashok Srivastava这样解释这个决定:为了加速创新并保持一致性,「我们将额外构建一层来抽象掉平台的复杂性」。相比之下,让各个团队构建定制解决方案,会导致「高复杂性、低速和技术债务」。

同样,Databricks最近对平台功能进行了扩展,新推出的Model Serving和Feature Serving工具,能简化数据科学家部署模型的流程,代表了他们正在推进更集成的AI基础设施,提供更全面的解决方案。

《Marvelous MLOps》一书的作者Maria Vechtomova指出,整个行业都需要这样的简化:「机器学习团队应该努力简化架构,并尽量减少使用的工具数量。」

图片

推动端到端解决方案标志着GenAI领域的成熟。企业不再满足于零散方法的拼接,而是希望高效地扩展其AI项目。

与此同时,我们还见证了一个有趣的现象——尽管端到端平台正在崛起,但专用解决方案仍在不断涌现,

通常来说,它们是对通用方案的补充,负责应对可能被忽略的复杂挑战,或者增强某些特定的功能。

专用解决方案的不断涌现表明,在解决特定AI挑战方面的创新仍然充满活力。

即使市场正在围绕少数几个主要平台进行整合,这一趋势仍在持续。

对于IT决策者来说,任务很明确:仔细评估专用工具在某些方面是否能提供比更通用解决方案更显著的优势。

开源和专有的平衡

在GenAI领域,开源和专有解决方案之间有非常活跃的相互作用。

曾经以开源Linux闻名的Red Hat公司最近宣布进入Gen AI领域,他们开发的产品Red Hat Enterprise Linux (RHEL) AI旨在让更多人能够使用LLM,并坚守自己对开源准则的承诺。

图片

然而,开源解决方案通常需要公司内部的大量专业人才,才能有效实施并维护。对于面临人才短缺或希望快速行动的组织来说,这可能是一个挑战。

另一方面,专有解决方案通常提供更集成和支持的体验。比如Databricks在支持开源模型的同时,也专注于围绕其专有平台创建一个连贯的技术生态,能够为客户集成和管理各种AI模型。

理想的开源和专有解决方案平衡将取决于组织的具体需求、资源和风险承受能力。随着AI领域的发展,有效集成和管理这两种类型的解决方案,可能成为一个关键的竞争优势。

平衡好开源和专有方案的「潜力股」也许是最近崛起的AI新星Mistral。

Mistral推出的开源模型既在社区引起了广泛影响,得到全球开发者的支持助力,同时也吸引到了潜在客户,可供任何人检查、定制的代码加强了企业用户对技术的信任。

创始人Arthur Mensch曾表示,「在构建商业模式和坚持我们的开源价值观之间找到一个平衡点是非常微妙的。我们希望创造新的事物、新的架构,但是还想向我们的客户提供一些额外的产品和服务。」

与现有系统的集成

在企业转向GenAI的过程中,一个关键挑战是如何将新功能集成到现有的业务流程与决策框架中,建立两者之间的良好衔接和互动。

这是AI系统落地的最后一步,也直接决定着AI方面的投资能否转化为实在的商业价值。

令人惊讶的是,与顶层的产品功能相比,成功的集成反而更依赖于底层系统。实时系统、流处理、批量处理,这些「骨架」是构建AI能力不可忽视的基础。

对于许多组织来说,数据方面也存在挑战,难点在于AI系统需要连接多样化的,且常常孤立存在的数据源。初创公司Illumex就开发了一种方案,允许企业利用现有的数据资产,而无需进行大规模的重组。

安全集成是另一个关键因素。由于AI系统通常处理敏感数据并做出重要决策,它们必须被纳入现有的安全框架,并符合组织政策和监管要求。

提示工程仍然是关键技能

精确且格式良好的提示,结合相关的上下文数据,能够显著影响模型输出的质量,这种效果常常令开发者和用户感到惊讶。

尽管最初对提示的长期前景以及提示工程师这一新兴职业存在怀疑,许多公司仍在积极寻找并高薪聘请具备提示工程技能的员工。

我们相信这一趋势将持续,并将得到新兴服务的进一步支持,这些服务可以帮助公司制作、存储、测试、管理和更新提示。

智能体已来,但为时尚早

AI智能体可以使模型(或一系列模型)在用户几乎不干预的情况下完成一个或一系列动作。

智能体工作流程有望扩展模型的使用方式,并使开发者能够单独优化每个步骤,从而可能带来显著的生产力提升。

虽然如今真正的自主智能体尚未成为现实,但我们观察到越来越多的服务正在帮助用户构建轻量级的定制助手,比如微软对C o p i l o t最近的更新。

这些助手能够处理更复杂的工程工作流程(不仅限于代码辅助)、从多个来源提取和总结信息、自动标记数据等任务。

图片

生成式人工智能的激进未来

随着GenAI快速发展,对技术栈的探索也愈发深入,从端到端解决方案到专用工具,从数据质量到治理框架。

可以肯定的是,我们正在见证企业技术的变革时刻,但这还只是个开始。

最近,AI大牛Andrej Karpathy描绘了一幅更加激进的未来图景。

他设想了一个「100%完全软件2.0计算机」,其中单个神经网络取代了所有传统软件。

其中,设备输入如音频、视频和触摸将直接输入到神经网络中,输出则通过扬声器和屏幕显示为音频和视频。

图片

这个概念远超我们当前对操作系统、框架甚至不同类型软件之间区别的理解——应用程序之间的界限变得模糊,整个计算体验将由一个统一的AI系统来调控。

虽然这样的愿景可能显得遥远,但它强调了一点:GenAI不仅能重塑单个应用程序或业务流程,还能改变计算的基本性质。

今天在构建AI基础设施时做出的选择将为未来的创新奠定基础。灵活性、可扩展性和接受范式转变的意愿将是关键。

不论我们谈论的是端到端平台,还是AI驱动的计算环境,成功的关键在于培养适应性。

参考资料:

https://venturebeat.com/ai/ai-stack-attack-navigating-the-generative-tech-maze/

https://menlovc.com/perspective/the-modern-ai-stack-design-principles-for-the-future-of-enterprise-ai-architectures/

https://sapphireventures.com/blog/building-the-future-a-deep-dive-into-the-generative-ai-app-infrastructure-stack/#gallery-4

https://www.emcap.com/thoughts/beyond-benchmarks/

https://www.visualcapitalist.com/mapped-the-number-of-ai-startups-by-country/

举报

  • 相关推荐
  • 大家在看
  • NinjaRIP:AI驱动的文档处理工具,快速准确。

    NinjaRIP是一款AI驱动的文档处理服务,它通过先进的机器学习模型来识别模式和提取有意义的信息,从而简化文档工作流程。它以99%以上的准确率在文档识别和数据提取方面提供无与伦比的精确度,确保了数据的可靠性和可信度。NinjaRIP在beta阶段免费提供,一旦过渡到正式版,将提供不同业务需求的定价计划,价格透明且具有竞争力。

  • DeepL Chrome扩展:在Chrome浏览器内翻译阅读或书写的内容

    DeepL Chrome扩展是一款由全球最精确的人工智能翻译器支持的浏览器插件,它允许用户在Chrome浏览器中即时翻译阅读或书写的内容。它利用神经网络和人工智能技术,能够捕捉最细微的差别,提供比同行业竞争对手更准确的翻译结果,准确度高达三倍以上。

  • 豆包浏览器插件:浏览器AI助手,提升工作学习效率

    豆包浏览器插件旨在通过AI技术提升用户的工作效率和学习效率。它具备快速视频与一键从网页、PDF和视频中总结并生成亮点的功能,同时支持在网页任意地方划词进行全方位AI搜索。此外,它还提供全文对照翻译功能,帮助用户在阅读外文资料时更轻松地理解内容。豆包插件的设计理念是将AI技术与日常使用场景相结合,让用户在进行网页浏览、文档阅读和视频观看时能够更加便捷地获取信息和知识。

  • 聚好用AI:一站式创意平台,激发无限创意。

    聚好用AI是一个集成了多种创意工具的在线平台,旨在帮助用户快速生成和编辑各种创意内容。它结合了AI技术,使得设计、绘画、音乐创作等变得更加简单和高效。平台的主要优点在于其易用性、高效性和创新性,能够满足不同用户在创意表达上的需求。聚好用AI背后的技术团队拥有丰富的行业经验,致力于通过AI技术推动创意产业的发展。目前,该平台提供免费试用,但部分高级功能可能需要付费。

  • E象:AI技术助力电商,提升运营效率

    E象 HiDream.ai 是一家专注于电商行业的AI技术公司,通过人工智能技术提供高质量的商品图,帮助商家提高商品上架和运营活动的效率。产品通过AI技术替代传统拍摄,降低成本,提升人效,缩短上架时间。主要技术包括AI生成商品图、模特效果图、商品视频生成等,适用于跨境电商和本地电商。

  • HackerPulse.io:开发者成长助手

    HackerPulse 是一个专门为开发者设计的个人资料聚合平台。它通过整合 GitHub、LinkedIn 等多个开发者常用的平台数据,帮助开发者构建一个全面的个人资料。这个平台不仅可以展示开发者的技能和成就,还能识别技能差距和提升空间,从而支持开发者的职业成长。

  • SuperCoder 2.0:开源自主软件开发系统

    SuperCoder 2.0是一个开源的自主软件开发系统,利用大型语言模型(LLMs)和大型动作模型(LAMs)针对Python代码生成进行微调,以实现更高精度的一次性或少次编程。它结合特定于开发框架的软件护栏,如Flask和Django,与SuperAGI的通用智能开发代理一起,提供复杂的现实世界软件系统。SuperCoder 2.0还确保了您的知识产权和代码免受AI相关的滥用,并与现有的开发栈如Jira、Github或Gitlab、Jenkins、CSPs以及QA解决方案如BrowserStack/Selenium Clouds深度集成,确保无缝的软件开发体验。

  • Llama Tutor:个性化AI教学助手,学习更高效

    Llama Tutor是一个基于Llama 3.1和Together AI的个性化AI教学助手,旨在为用户提供定制化的学习体验。它完全开源,用户可以在GitHub上找到相关代码并进行个性化的调整。该产品通过用户输入的学习主题和教育水平,生成个性化的学习计划,帮助用户更高效地掌握知识。

  • HoloDreamer:从文本描述生成全息3D全景世界

    HoloDreamer是一个文本驱动的3D场景生成框架,能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成:风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。

  • MusiConGen:基于Transformer的文本到音乐生成模型

    MusiConGen是一个基于Transformer的文本到音乐生成模型,它通过时间条件增强对节奏和和弦的控制。该模型从预训练的MusicGen-melody框架中微调而来。它使用符号表示的和弦和节奏控制,并结合五种不同风格的文本描述来生成样本。生成样本的和弦通过BTC和弦识别模型进行估计,如论文中所述。

  • PixVerse V2:轻松创建视觉冲击的视频内容。

    PixVerse V2是一个革命性的更新,它赋予每个用户轻松创建令人惊叹的视频内容的能力。使用V2,您可以轻松制作视觉冲击力强的电影,甚至可以加入现实世界中不存在的元素。主要优点包括模型升级、画质提升、剪辑间的一致性等。

  • KLING AI:激发你的想象力,开启创意生产的新时代。

    KLING AI是快手可灵的国际版,是一个以AI技术为核心的创意生产平台,提供AI图像和视频生成服务。其背后的技术由KOLORS和KLING提供支持,旨在通过先进的算法快速生成高质量的视觉内容,帮助用户实现创意想法,提升生产效率。

  • Comfy Deploy:快速部署AI应用的协作平台

    Comfy Deploy是一个面向产品团队的开源平台,专注于将ComfyUI工作流程快速转化为生产就绪的API。它提供了一键部署API、强大的管理GPU支持、任何模型和自定义节点的安装,以及无需自托管即可享受的ComfyUI的强大功能。该平台通过简化复杂流程,帮助团队协作、迭代和部署AI应用,显著提高了生产效率。

  • NVIDIA AI Foundry: 提供定制化的 AI 模型和解决方案。

    NVIDIA AI Foundry 是一个平台,旨在帮助企业构建、优化和部署 AI 模型。它提供了一个集成的环境,使企业能够利用 NVIDIA 的先进技术来加速 AI 创新。NVIDIA AI Foundry 的主要优点包括其强大的计算能力、广泛的 AI 模型库以及对企业级应用的支持。通过这个平台,企业可以更快速地开发出适应其特定需求的 AI 解决方案,从而提高效率和竞争力。

  • HeyGen Interactive Avatar:在线创建AI虚拟形象视频,实时互动。

    HeyGen Interactive Avatar是一个在线AI视频生成器,专注于创建和优化虚拟形象视频,支持实时互动。它允许用户创建一个为连续流媒体优化的虚拟形象,同时提醒用户保持头部和手部的最小动作。HeyGen的背景信息包括与Baron David和Ryan Hoover等知名人士的合作,产品目前处于Beta测试阶段,提供免费试用。

  • Adobe Firefly Vector AI:创意生成AI工具

    Adobe Firefly Vector AI是Adobe推出的一系列创意生成AI模型,旨在通过生成AI功能增强创意工作。Firefly模型和服务于Photoshop、Illustrator、Lightroom等Adobe创意应用中。它通过文本到图像、生成填充、生成扩展等功能,帮助用户以前所未有的控制力和创造力生成丰富、逼真的图像和艺术作品。Firefly的训练数据包括Adobe Stock的授权内容、公开许可内容和公共领域内容,确保其商业使用安全。Adobe致力于负责任地开发生成AI,并通过与创意社区的紧密合作,不断改进技术,支持和提升创意过程。

  • Jelled.ai:使用AI数字孪生优化职场沟通

    Jelled.ai是一个利用人工智能技术来提升职场沟通效率的平台。它通过创建用户的数字孪生,帮助用户从Gmail和Slack等主要通信渠道中提取、总结关键信息,并生成及时、知情的邮件草稿。数字孪生能够学习用户的邮件回复模式,节省时间和精力。此外,它还提供了即时回复、智能代理聊天、消息审查等功能,帮助用户有效管理日常沟通。Jelled.ai致力于保护用户数据安全,通过年度安全审计和符合Google API服务用户数据政策的措施,确保数据安全。

  • Mock Interviews with AI:AI驱动的模拟面试,提升求职成功率。

    Mock Interviews with AI 是一款由Invue AI提供的职业面试准备平台,它通过AI技术模拟真实面试场景,提供即时反馈和个性化建议,帮助求职者提高面试技巧和自信心。产品背景基于36,000+求职者的使用经验,由专业团队设计,旨在帮助用户在面试中取得成功。产品提供基础和高级两个版本,基础版免费,高级版提供更多功能和服务。

  • Lokal.so:本地开发工具,支持远程访问和AI辅助

    Lokal.so 是一款本地开发工具,旨在简化本地开发环境的设置和使用。它通过提供多种功能,如本地隧道服务、AI 助手、S3 兼容服务器等,帮助开发者更高效地进行本地开发和调试。主要优点包括:1. 支持通过公共和 https .local 地址共享本地主机。2. 提供自托管的本地隧道服务器,确保隐私和自由。3. 利用 Cloudflare 的全球网络加速网站交付。4. 内置 AI 助手,可以与隧道流量交互,生成代码,回答与流量内容相关的问题。5. 提供无限的 .local 域名,支持局域网内的访问。6. 内置 S3 兼容服务器,方便文件存储和调试。7. 支持 JSON 到语言模式的自动转换,简化开发流程。

  • ScanIt:轻量级、快速、无广告的文档扫描应用

    ScanIt是一款专为iPhone和iPad设计的文档扫描应用,以其轻量级、快速、无广告的特点,为用户提供了一种简单高效的文档数字化解决方案。它拥有智能文档识别、曲面调整和文本提取(OCR)等专业功能,支持多种格式导出,并能安全加密文档,满足不同用户对扫描效率和安全性的需求。

今日大家都在搜的词: