首页 > 传媒 > 关键词  > 正文

ChatGPT,魔法失灵了?

2023-07-05 11:16 · 稿源: 站长之家用户

ChatGPT,魔法失灵了!

数据统计,在自今年 1 月以来,ChatGPT的访问量增速,正在节节下滑。

1 月,131.6%; 2 月,62.5%; 3 月,55.8%; 4 月,12.6%;到了 5 月,就只剩2.8%。

如果说,前面几个月还是缓慢增长,那么到了 6 月,下滑已然出现,成为笼罩在ChatGPT头顶的一片阴云。截至 6 月 20 日,访问量比 5 月少了38%左右,也就是说,如无意外,到 6 月 30 日,ChatGPT的网页访问,将首 次出现负增长。

此外,AceCamp数据更是显示,ChatGPT在内,几乎所有的AI聊天机器人,都已经出现用户增长停滞,乃至下滑。与年初的风光无量形成鲜明对比。摩根士丹利 6 月初的一项数据进一步补充,仅有16%的受访者使用过ChatGPT,4%的用户成为ChatGPT的重度用户。同一时期,谷歌Bard的使用人数,更是只有9%。

仅仅半年时间过去,大模型就从开局巅 峰,走向下滑谷底,成为最短命的风口?

答案或许并没有这么简单。

01 ChatGPT,究竟怎么了?

ChatGPT数据真的下滑了吗?

或许这只是一个统计口径选择,带来的误会。

ChatGPT访问量下滑,出自一个叫做SimilarWeb的国外网站数据分析工具,该网站统计的口径来源为ChatGPT网站的访问量。

但众所周知,作为一个爆款AI应用,ChatGPT的客群,主要包括了两方面:其一,ChatGPT网站自身的C端用户;其二,使用ChatGPT对外API接口的各种下游B端应用。

也就是说,随着越来越多的APP使用ChatGPT的API接口,SimilarWeb的数据已经逐渐失真。

6 月初流传出的一份闭门会议纪要,也佐证了这一猜想的正确:Open AI CEO 阿尔特曼表示,ChatGPT未来的核心战略使命,是吸引更多的企业应用程序接入API,而非在C端,与自己的企业客户争夺流量。

为什么要把自己从一个C端爆火的比较优秀AI应用,变成一个听来并不性感的API企业?

一个非常基础的认知是,随着使用ChatGPT的时间增长,越来越多的用户发现,ChatGPT,其实并不像我们所想的那样万 能。当我们用ChatGPT搜寻资料时,AI经常会凭空编造出一个并不存在的答案。有人用GPT- 4 做了个测试后发现,相同的问题,不同的提问阶段,GPT- 4 给出的回答不尽相同,甚至时间越近,错误率越高。

这是什么道理?针对这种通用大模型的“胡说八道”,科研界将其称作大模型的记忆幻觉。

所谓记忆幻觉,指的是,AI大模型所生成的内容,并不是来源于现实世界,而是大模型自己“想象”出的内容。比如AI给出的一些看似权 威的论文、法律、名人、历史,经过检索,就会发现这些内容在真实世界中并不存在。

这种幻觉的来源,与大模型的底层逻辑有关——AI本身并不理解自己所说的内容,而是仅仅根据自己吸收的内容进行学习模仿。

那么这种AI幻觉,是否有可能被消除?

当前的方法,主要有三个流派:

其一,奖励AI的每个正确推理过程,而不只是简单的奖励推理结果。

其二,使用知识图谱,蒙特卡洛树搜索算法等方式,进行算法层面的改进;

其三,针对特定场景,使用垂直优质数据,训练出基础认知就能达到专家级的行业大模型。

第三种,其实也正是Open AI选择将越来越多精力转移到B端应用API接口的根本原因。

同时,这也正是无数AI大模型企业正暗中角力的另一隐秘战场。

02 API能解千愁吗?

尽管Open AI正将越来越多的精力放到更行业,更垂直的API应用之上,但业内的另一个观点则是:垂直API虽好,但却并不是一把万 能的锤子。

开放API,仅仅意味着在将现成的模型开发好之后,给客户一个接口,所有的升级、数据来源,依旧是由Open AI 提供,这样的API接口,距离客户将其工程化落地,其实还有相当长一段距离。

众数信科CEO吴炳坤举了个例子“很多 AI 大厂现在不会将大模型微调为行业专用模型的能力开放出来。”但“站在客户角度,行业客户最为看重的是定制化的需求,以及AI企业的工程化落地能力。”

也就是说,如果想要AI更好落地,开放API接口是远远不够的,需要大模型企业将自己的底层模型直接开放给下游客户,让其基于大模型本身,进行微调或再训练,甚至直接参与到大模型的研发过程。

很显然,没有任何AI企业,愿意随意将自己的AI大模型底层核心技术随便开放给下游。

而众数信科的股权架构,则给予了他们能够深度参与行业,同时也能参与大模型定制化开发的能力。

天眼查数据显示,众数信科成立于 2021 年,专注于数字城市的数据及场景的产品定义和运营。其三大股东,分别是云从科技、厦门火炬创投、民生电商,其商业模式为无需财政付费、可自我造血的“政府搭台、国企主导、产业联合运营”数字经济新模式。

天眼查数据显示,众数信科成立于 2021 年,专注于数字城市的数据及场景的产品定义和运营。其三大股东,分别是云从科技、厦门火炬创投、民生电商,其商业模式为无需财政付费、可自我造血的“政府搭台、国企主导、产业联合运营”数字经济新模式。

得益于与云从科技之间的股东关系,作为一家专注于AI落地的创业公司,众数信科也能够参与到大模型的开发过程,甚至在云从从容大模型的基础上,训练出自己的专业模型。

这种基于通用大模型训练行业大模型的意义,在云从科技创始人周曦看来:如果没有强大的基础大模型,行业大模型将失去长期生命力以及成本控制力;如果只有通用大模型,就无法在具体需求上做到极 致。

两者之间的关系,就像是武术中的内功心法以及外在招式;只有互相搭配,才能发挥出更有效用。

而这种内功心法与外在招式的内外兼修,也成了众数信科成立不久,就能接连拿下政企大单的底气所在。

03 落地才是硬道理

在联合云从,在从容大模型基础上定制自己的专属大模型后,困扰众数信科的第二个问题就变成了如何更快速的落地?

依旧是众数信科的股东结构,我们可以得到这个问题的答案。

三大股东:云从科技、厦门火炬创投、民生电商,云从提供用于微调的底层大模型,厦门火炬创投提供下游产业化落地的上下游撮合,民生电商提供资金支持。

有了技术,有了产业链资源,也有了钱,距离大模型真正落地就只差最后一步,用于训练行业大模型的数据。

这正是众数信科的强项。过去两年,通过搭建“众寻知识智能化平台”的技术优势和“i城市生活平台”两大平台,其中,“i城市生活服务平台”已经签约 16 个城市,服务覆盖 3000 万的个人用户和数十万的企业用户,让众数信科积累了丰富的行业语料数据。

基于以上技术、资源、资本以及语料库层面的优势,众数信科当前在城市生活服务领域,教育、养老和文旅三大场景跑出了自己独特的优势。

以城市生活服务中的海关政策智能AI解读这一细分领域举例:

对众多跨国公司,以及跨境电商企业来说,单是一个基础的入关清关,就需要拆分成订单申报、支付申报、运单申报、清单申报、三单对碰多个环节,每个环节都涉及到不同的部门、法规以及政策文件,如何跟上这些不断变化的政策以及数千份文件,需要企业花费巨大的精力以及投入,而对海关来说,大量的咨询以及政策变动,也会导致他们人力资源的紧张。

如果有AI的帮助,入关清关的准备工作,就能够被大大简化。

通过多年积累以及大模型加持,众数信科打造了用于海关通关政策问答应用“海关政策 AI 精灵”。基于海关总署 2000 多份材料, “海关政策 AI 精灵”形成了本地的知识库,通过语义分割、语义检索、 实现 prompt learning ,构造准确提示词,让模型能比较准确地按照本地的知识库来回答用户的问题。

这一思路,一方面可以明确提问者问题所涉及的具体政策文件;另一方面,彻底解决大语言模型存在的 知识局限和数据偏见问题,让解答更专业。

另外,针对政策的变化,“海关政策 AI 精灵”还可以根据政策调整和变化更新本地知识

库,同时通过用户的问答的正、负反馈意见,实现基本RLHF( Reinforcement Learning from Human Feedback )的模型优化与微调。

在教育领域,众数信科还开发了"智能教育AI精灵",在厦门地区的部分学校、教育培训机构试点使用,从AI内容生成辅助教学切入,充当教师的教学助手,并为学生做出千人千面的发展评价,未来逐步实现因人施教,着力打造优秀教师数字分身,将先进地区优 秀教学经验通过AI学习传承复制,解决三四线城市的教育资源匮乏问题。

04 大模型没有失灵,但死亡谷正在加速到来

上世纪九十年代,美国航空航天局(NASA) 发布了一份《TRL白皮书》 (Technology ReadinessLevels,缩写为TRL),将技术的成熟度,分为九个等级:

1 基本原理被发现

2 形成技术概念或初步应用方案

3 进入关键功能实验室验证阶段

4 技术方案在实验环境中验证

5 技术方案在相关环境中验证

6 技术方案在模拟环境下系统验证

7 真实环境下的系统演示

8 定型试验

9 运行与评估。

在这 9 个等级中,高校与机构科研人员擅长1- 3 环节下的基础研究;企业为追求利润,更倾向于进行8- 9 环节中的具体产品设计与生产,相应地,中间的4-7环节,就成了所有技术从实验室走向行业普惠中间的死亡之谷。

如今的大模型,死亡之谷正加速到来。

如何让大模型在应用中真的降本增效,如何让中小企业也能用得上用得好AI,如何减少大模型应用中的AI幻觉,这些都是死亡谷中,一个又一个必须解决的现实问题。

这些问题,既不像ChatGPT可以在短时间内,吸引全世界的目光,也没像最早发布大模型论文提出通往AGI可能性一样的性感。跨越死亡谷的解法只有一条,一步步夯实通用大模型基础,深耕行业,让AI从高高的神坛走下,成为普惠每一个普通人生活的基础设施。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • Creators’ App迎来重大更新

    索尼与分秒帧联合推出云端影像创作平台ICE-Cloud,集成索尼先进影像技术与高效云端协作能力,为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用,实现素材自动上传、云端管理、在线审片和项目协同,打破时空限制,提升创作效率。通过Creators’ App连接相机与云端,实现即拍即传、异地实时协作,致力于打造新一代创意工作流。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • 新品预售 | Switch 2专属卡皇!佰维 ME300 Express高速存储卡首发

    随着Switch2性能提升,玩家对存储卡速度和容量需求升级。佰维推出专为Switch2设计的ME300 microSD+Express高速存储卡,采用SD7.1新标准,读取速度高达900MB/s,写入速度800MB/s,提供1TB超大容量。该卡能大幅缩短游戏安装、加载时间,确保流畅体验,支持4K输出和掌机模式高帧率渲染。ME300兼顾现有设备兼容性与未来扩展性,现已开启预售,提供三种容量选择。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

今日大家都在搜的词: