首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

大模型时代的创业者:抢跑,碰壁,活下去

2023-05-19 16:24 · 稿源: 亿邦动力网

声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:胡镤心,授权站长之家转载发布。

AIGC应用层创业,等待胜出者。

5月18日,OpenAI又放大招,苹果用户可以从App Store下载ChatGPT,价格还是19.99美元/月。OpenAI还特别强调了应用的无广告性,此举意味着聊天、搜索、翻译、问答类App危矣。

图片

大模型应用层的创业者又一次被OpenAI碾压。“看到一个比互联网更大的结构性机会时,本以为可以一战成名,没想到率先成了炮灰。”这是3月24日Plugins(ChatGPT的插件集)发布后,翻译网站创业者林晓峰第二次体会到这种感觉。

早在Plugins插件发布时,估值130亿美元的AI写作工具Grammarly在ChatGPT发布后网站用户直线下降;AI聊天机器人独角兽公司Character.AI的自建大模型在ChatGPT阴影之下,被质疑能否形成足够的竞争壁垒。

“本来大厂卷起大模型,应用层创业更有盼头,没想到OpenAI比所有竞争对手都吓人,先用插件干掉很多抢跑的人,又把火烧到手机应用上。”林晓峰认为。

相比于大模型层的诸神之战,应用层的创新数量庞大、创业者也更多。得益于大模型的通用能力和编程效果,AI应用层创业可以由更少的人,实现更好的效果,这些创业项目大多以“一句话生成……”的方式呈现,比如一句话生成思维导图、一句话生成代码、一句话生成设计图。

火石创造产业数据中心数据显示,4月全国人工智能领域(不算拟收购、被收购、定增、挂牌上市)共发生了66起融资事件,累计披露的融资金额35.24亿元。3月,全国人工智能领域共发生融资72起,累计披露融资金额74.55亿元。

大模型时代的应用层创业,想做点什么似乎更容易,但想做得与众不同似乎更难——如何建立壁垒,如何找到差异化,如何获得融资,一个个难题摆在创业者面前。

01

脑洞大的创业者,机会最佳

大模型给不少行业带来灭顶之灾,低代码是其中之一。宜博从事低代码创业六年,宜创科技已经服务国内上百家大型技术团队和项目,当低代码正在被广泛接受时,ChatGPT来了。

大模型颠覆了低代码的开发模式——低代码(或零代码)通过拖拉组合,解决软件开发慢、门槛高的问题,而ChatGPT通过自然语言描述,直接创建应用程序,AI生成代码的速度远超人工,还可以通过对话持续提出改进建议。

宜博果断转向基于大模型的开发方法,一周出demo,两周做优化,第四周产品已经上线。目前宜创科技已经推出ChatBI、ChatExcel、ChatPDF等多个产品。

图片

图片来源:宜创无代码

对于谢明炫来说,ChatGPT给行业带来希望。谢明炫是一个建筑设计师,从事虚拟世界的空间生成和空间体验。“举个例子,我们现在坐在咖啡馆聊天,我希望可以随时将我们所处的空间变成我想要表达的那个场景。”谢明炫解释。

这种在虚拟与现实空间中设计建筑和空间的设想诞生于上个世纪80年代,最早以赛博空间的形式出现。“虚拟建筑是每个建筑师心中的乌托邦。一直在追求,一直遥遥无期。”谢明炫介绍。

但大模型将这一理想向前推进一大步,通过大模型接口,未亓科技可以低成本地将空间照片进行风格化处理并调优,虚拟建筑的生成和优化首先在二维图像上实践。目前谢明炫正在等待苹果MR眼镜的发布,他觉得现在的空间设计效率和体验,是他的老师们当年不敢想象的。

尹伯昊则更加坚决地从前一个创业项目脱身,投入大模型创业。在此之前,他已经进行了两次创业,分别是在线课程和SCRM。

尹伯昊现在的创业公司猴子无限,针对大企业私有化部署大模型的需求,帮助企业进行模型调优和产线编排,目前已经接到海尔和众多行业头部客户的订单。

图片

在ChatGPT发布之后,无数创业者以前所未有的热情投身于AI创业。究其原因,大模型正在让创业变得更简单——不懂编程也可以运营网站,三五个人能完成此前三五十人做出的编程效果。一人成团也不少见,“通过调用大模型接口,我一个文科生也搭建起翻译网站,代码用ChatGPT生成,插图用Midjourney生成。”林晓峰介绍。

互联网创业需要大量人力进行建模、页面设计、规则制定,但基于AI的创业公司不需要这些。大模型是个黑箱,这个黑箱足够强大,只要解决数据输入、输出的问题,也就是有一个好看的页面进行输出,和好看的结果呈现页面,中间的人工建模过程都可以省略。

尹伯昊认为,大模型时代的产品特点是:人可以很少,界面可以简单,但计算成本很高,对算力要求高

“一个CRM公司、一个BI公司,他们的后台配置非常复杂,现在这些人都被省掉了,我们需要的不是人力,而是GPU服务器。”尹伯昊认为。

大部分投资人都把AIGC投资分为应用层、模型层、基础层:

  • 基础层包括算力、存储、数据,每个领域都有传统企业把守,新玩家基本进不去。

  • 大模型创业的机会,属于大厂和明星公司,在这波由GPT引发的AI热潮中,大厂迅速形成共识,短短一个月便推出了30多个大模型。

  • 应用层创业属于脑洞大、有想法的创业者。

图片

图片来源:甲子光年

寒武创投创始合伙人韩冰认为,在AI浪潮中,原本只擅长动脑而不擅长动手的团队,这次机会最佳

02

大模型不是壁垒,人文才是

尽管ChatGPT的发布让创投圈沸腾,但大模型以“天”为单位的迭代速度,也让创业者直呼“吃不消”——从2022年11月ChatGPT上线到2023年3月份GPT-4发布,每天都有新东西,每天都是大新闻。

进入4月份,OpenAI宣布短期内不会有GPT-5,“新闻少了,新东西也少了,我感觉终于可以安心做点东西。”尹伯昊认为。

谢明炫团队中虽然减少了码农数量,但是需要专门的软件工程师盯着国内外大模型的每一次更新,尤其是OpenAI、谷歌等大厂的每一次维护和修改,他觉得模型自身的迭代带来的威胁超过外部竞争者。

业务模式同样受到威胁的宜博,格外关注什么领域不会被GPT-X在未来碾压。宜博总结不会被大模型覆盖的行业,有这样四个特点:

1非虚拟的、实体的、硬件的、物理的产品不会被取代。

大模型编程能力很强,如果一个企业只有软件产品,大模型可以做出一模一样的对标品。这时候只有物理世界的壁垒还在,比如土地、生产机械、机器人等物理世界的产品,目前难以被大模型取代。

2私有数据、隐私数据难以转移。

“我们不可能把一个企业积累多年的行业数据转移走,甚至未来,企业的私有数据保护会越来越严格,不让大模型学会。”宜博指出。

3念Prompt咒语。

ChatGPT通用泛化能力很强,但使用方法是基于自然语言的对话,所以使用者描述得越精准,大模型生成效果越好,这叫做“会念咒语”。比如一个人要修改一篇文章,有的人会说“你帮我改改文章”,有的人会说“我需要一个什么文章,标题内容大纲是怎样,情感色彩是怎样”——能不能把Prompt写好,是使用大模型的关键。

4专业/领域模型。

由于大模型缺乏部分行业数据、隐私数据,在一些专业领域,企业会训练自己的专业模型。比如彭博社不愿意将私有数据喂给大模型,员工又需要使用大模型,彭博社就自己训练一个行业模型。

未来世界可能会变成几个foundation模型,加上成千上万个专业模型。”宜博总结。

对谢明炫来说,人文因素成为大模型创业的最好壁垒。

他发现大模型在很大程度上正在迎合大众审美,比如Midjourney在生成时,色调、造型虽然新奇,但很难生成看起来很丑的图片,Midjourney整体在迎合大众喜好的最大公约数。

但在设计行业,“客户是在为好的设计买单,不是在为更高的效率买单,客户需要的是和最大公约数不一样。”谢明炫分析,“说得通俗一点,这个时候人文跟科技结必须得结合得很紧,而且核心其实在人文因素那一面。”

在未亓科技内部,需要横跨建筑设计和代码编程的高手进行风格打磨和调优。“大模型本身成了一个可以替换的东西,我们开发时故意把产品的核心逻辑和大模型进行了分离,所以用ChatGPT也可以,用PaLM2也行,生成出来的都是我们风格的产品。”谢明炫介绍。

谢明炫也申请了最早的Plugins开发,“最开始大家觉得Plugins会颠覆很多东西,但开发一阵之后,反而觉得Plugins没有那么大威胁。”

一些头部企业也在关停Plugins开发,比如爱彼迎。爱彼迎做共享出租屋,他们认为界面的空间体验很重要,而ChatGPT的界面过于简单。爱彼迎提供的不是单纯订房租房,而是一种更完整的体验,这种体验从一开始找房子看图像开始了。

YC现任主席也认为,现在UI的重要性比以前更高,因为产品的差异化很大程度上要体现为UI的差异化。

谷歌发布的PaLM2对应用层的创业者来说是个好消息,PaLM2与GPT-4不相上下,Open AI不会成为唯一的流量入口,模型的调用不再是问题,人文因素的差异被进一步放大。

谢明炫觉得,现在更大的问题反而出现在大模型之间的交流上,“我们在实际调用各个大模型时,感觉到一种新情况,大模式之间应该实现了自己的网络,类似AutoGPT这样的平台,就是一个AI自己的互联网,它们相互之间的串联很快,甚至可能人类都看不懂它们怎么交流。我稍微有点隐忧,那可能是一个AI原生的互联网。”

03

融到钱,活下去

尽管投身AI的创业者很多,但应用层创业融资并不容易。

有投资人表示,二级市场的AI概念股虚火旺盛,一级市场反而相对稳健。“二级市场涨的基本上都是和AI没什么特别大关系的。和AIGC最有关系的互联网公司和真科技公司反而股价反应没那么激烈。一级市场相当冷静,大部分人都在观察,个别大基金出于布局需求会出手。”

尽管火石创造产业数据中心数据显示,今年前四个月国内AI领域已经完成融资243起,但主要以明星项目为主。这一现象和行业发展阶段有关,“这是一波十年的大浪潮,你在互联网刚诞生的时候能投出腾讯、阿里巴巴吗?一个道理。现在技术发展太快了,看不太清楚。”该投资人表示。

不少创业公司依靠率先调用ChatGPT接口实现创新,但当3月24日,OpenAI发布Plugins(ChatGPT的插件集),可以将ChatGPT更方便地对接到第三方程序上时,不少先发者的优势灰飞烟灭,这些仅有接口没有壁垒的项目被称为“赚外快”,而非真正的“创业”。

对于应用层的创业,投资人的问题很直接:壁垒和成长性是什么。大部分受采访者的观点也很统一:市场可以听大模型讲故事,给很多耐心去培育,但应用类项目没有这个待遇,就是要看效果、看结果。

作为应用层创业者,尹伯昊看到不少创业项目已经Game Over,在奇绩创坛,不少创业者在社群中相互寻求合并,“我们算这一批AI创业企业中跑得比较快的,我们的飞书群里至少蹲着十几个CEO。”尹伯昊介绍,“我们非常欢迎项目结束的CEO们加入。”

他认为,能够上牌桌的都是现在已经融到资的人,现在没有融到资的人,已经再也没机会了。到明年这个时候,大厂还是大厂,阿里、腾讯、字节还在牌桌上,但AI原生的创业公司中,能活下来10家已经不错了。

在生存压力下,尹伯昊必须带着公司极速奔跑。他给自己的第一个要求是快,2022年8月创业,飞快地利用大模型优势找到模型调优和 产线产线编排这个切入口,飞快上线,飞快积累经验。

模型调优是大模型私有化部署的必要步骤,在国内,模型调优的最大对手就是百度千帆。尹伯昊认为,技术积累肯定不是创业公司的优势,但是极速奔跑是必须的。除了快速积累经验、积累数据,尹伯昊还预计实在打不过就加入——猴子无限已经和字节跳动进行深度接触。

“下次见面,希望项目进行得更好。”尹伯昊匆匆告别,然后匆匆赶往下一个会议。

举报

  • 相关推荐
  • 大家在看
  • WizardLM-2:新模型,多种型号,AI驱动合成数据训练

    WizardLM-2是WizardLM推出的新一代大型语言模型,包含三种型号:8x22B、70B和7B。该产品采用AI驱动的合成数据训练系统,通过数据分析、加权抽样、渐进式学习和AI互校AI等方法,优化模型性能。它能够自动生成高品质的指令和响应,提供多样化的对话能力,适用于多种编程和开发场景。

  • idefics-80b:一个通用的多模态模型,可用于问答、图像描述等任务

    HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。

  • Video2Game:从单一视频创建实时互动游戏环境

    Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。

  • Cohere Compass:多方面数据索引与搜索模型

    Cohere Compass是一款新型的多方面嵌入模型,专为解决企业数据中的多重概念和关系检索挑战而设计。它能够将数据以JSON格式传递至嵌入模型,转换后存储在向量数据库中,保持元数据和文本的同时,捕捉多方面数据中概念间的关系。与传统的RAG流程相比,Compass通过其SDK将电子邮件及其附件解析为单一JSON,生成包含多方面表示的嵌入输出,从而在搜索时能够准确理解和匹配查询中的不同方面。

  • Ctrl-Adapter:视频生成的精细控制工具

    Ctrl-Adapter是一个专门为视频生成设计的Controlnet,提供图像和视频的精细控制功能,优化视频时间对齐,适配多种基础模型,具备视频编辑能力,显著提升视频生成效率和质量。

  • Reka Core:强大的多模态LLM,商业解决方案

    Reka Core是一个GPT-4级别的多模态大型语言模型(LLM),具备图像、视频和音频的强大上下文理解能力。它是目前市场上仅有的两个商用综合多模态解决方案之一。Core在多模态理解、推理能力、编码和Agent工作流程、多语言支持以及部署灵活性方面表现出色。

  • 2txt:快速将图片中的文字转换为可编辑文本

    2txt是一个在线OCR工具,能够将图片中的文字内容快速识别并转换成可编辑的文本格式。它支持多种语言的识别,并且操作简单,用户只需上传图片即可获得结果。该工具不存储用户上传的图片,保证了用户数据的隐私安全。

  • 法行宝:AI智能法律分析工具

    法行宝是一款集成了人工智能技术的法律服务平台,旨在为用户提供专业的法律意见和文书参考。通过预设问题引导用户提供必要信息,结合《中华人民共和国民法典》等相关法律法规,生成详细的法律意见书。法行宝不仅提供离婚流程指导、文书模板下载,还包含人性化的行动建议和扩展资料,帮助用户全面理解并应对法律问题。

  • Adobe Acrobat AI Assistant:AI智能助手,文档快速理解与生成

    Adobe Acrobat的AI助手是一个集成在Acrobat中的创新功能,它可以帮助用户通过提问来理解文档内容,快速获取信息并生成内容。这项功能特别适合需要从文档中提取关键信息并快速创建电子邮件、演示文稿、会议记录等的用户。AI助手可以生成文档摘要,提供基于文档内容的建议问题,帮助用户更有效地探索和理解内容。此外,Adobe Acrobat的AI助手遵循Adobe的AI伦理原则,确保用户数据的安全和透明。

  • AI Voice Generator Bot:使用人工智能将文本转换为音频

    AI语音生成器是一个简单易用的产品,它使用人工智能技术将文本转换为音频。它提供了多达25种不同的声音,完美演绎英语。您只需在Telegram上输入文本,我们即可回复相应的音频,无需等待。立即试用,快速将文本转换为语音。

  • Glaze:保护艺术家风格的AI工具

    Glaze是一个旨在保护人类艺术家免受AI风格模仿的系统。通过机器学习算法对艺术作品进行微小改动,使其对人类眼睛看起来不变,但对AI模型则呈现出完全不同的艺术风格。这样,当有人试图模仿特定艺术家的风格时,AI生成的结果将与预期大相径庭。Glaze不是永久解决方案,但是一个必要的第一步,为艺术家提供抵抗AI模仿的工具。

  • FastBots:无需编码,快速创建AI聊天机器人

    FastBots.ai是一个强大的AI聊天机器人平台,允许用户通过上传自己的数据,如网站内容、文档、PDF文件等,来训练并创建定制化的聊天机器人。这些机器人可以无缝集成到网站中,提供24/7的客户支持、销售辅助、个人助理等多种功能。FastBots.ai支持95种语言,提供军事级别的数据加密,无需编程即可通过简单的复制粘贴代码嵌入聊天机器人,还支持与超过5000个应用程序通过Zapier集成。

  • Limitless:超越思维限制的个性化AI助手

    Limitless是一款由人工智能驱动的生产力工具,旨在帮助用户突破思维限制,通过保存对话和提供个性化AI问答来增强记忆力和专注力。产品形态包括可穿戴设备和应用程序,支持会议准备、实时转录、自动笔记和会议总结等功能,无需额外的机器人加入会议,且提供无限存储空间。

  • Adobe Premiere Pro:AI驱动的视频编辑软件

    Adobe Premiere Pro是一款功能强大的视频编辑软件,集成了AI技术,旨在简化复杂的编辑任务并加速编辑流程。软件提供了文本基础编辑、音频分类标签、语音转文字、增强语音、场景检测、自动色彩调整、形态变换、颜色匹配、音频自动调节、自动重构等功能,大大提高了编辑效率和创作可能性。Premiere Pro适用于社交媒体短视频制作到长片电影的编辑,帮助用户节省时间,专注于创意和故事讲述。今年晚些时候,Adobe Premiere Pro计划推出第三方AI模型功能,使编辑人员能够选择最适合其素材的模型,从而提升编辑体验。这些AI模型包括OpenAI的Sora模型、Runway AI和Pika的视频模型。此外,Premiere Pro还将提供内容验证功能,帮助用户了解他们是否使用了AI以及使用了哪个模型来进行媒体创作。

  • SuperMemory:用打造你的第二大脑

    supermemory是一个帮助用户整理和回顾互联网上保存内容的工具,类似于为书签打造的ChatGPT。用户可以通过导入推文或使用Chrome扩展保存网站和内容。它包含三个主要模块:主Web UI、Chrome扩展和AI后端处理。旨在帮助用户更有效地管理和回顾信息,提高生产力。

  • Pile-T5:基于Pile数据集训练的T5模型

    Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。该模型经过了2万亿个token的训练,是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色,尤其是在代码相关任务上。此外,EleutherAI还提供了中间检查点,以便研究人员研究模型随时间的演变。

  • SoraPix AI:创建您梦想中的动漫女孩

    SoraPix是一个AI驱动的图片生成工具,内置多种独特模型,通过简单的几步操作,您可以创建您梦想中的动漫女孩。SoraPix提供衣橱、动漫和图片生成等功能,具有4K高清图像质量和更快的服务速度。您可以通过购买宝石来解锁更多功能和选择。

  • PostHunt:写病毒式推特,AI辅助

    PostHunt是一款通过AI辅助撰写病毒式推特的工具。用户可以描述内容、选择模板,快速在Twitter上获得病毒式传播。PostHunt结合了GPT 4、Claude 3和Gemini 1.5 Pro的强大功能,使用者可以通过三个简单步骤,在15秒内撰写一条病毒式推特。100多位创作者选择了PostHunt,用于撰写病毒式推特,其强大的功能和简单易用的界面备受好评。

  • MejoraImagen:提升图片质量

    MejoraImagen是一个在线图片增强工具,使用智能算法提升像素化、低分辨率、光线不佳等问题的图片质量。只需上传图片到我们的表单,几秒钟内就能得到100%增强的结果。

  • Azyri:AI医疗助手,为您的医疗团队提供最佳支持

    Azyri是一款AI医疗助手,通过骨龄测量和分析,为医疗团队提供准确的诊断和治疗建议。优势包括减轻医疗团队工作负担,提高工作效率,定价根据服务套餐而定。主要功能包括骨龄测量、诊断X射线、医学影像和机器智能分析。

今日大家都在搜的词: