首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

哈佛研究发现GPT-4使得企业员工绩效提升了40%

2023-09-26 09:30 · 稿源:站长之家

文章概要:

1. 哈佛研究指出,GPT-4帮助波士顿咨询集团(Boston Consulting Group)的顾问在任务完成率、速度和质量上获得40%的提升。

2. 这项由哈佛、沃顿和麻省理工等研究人员进行的研究是首次大规模探讨企业中生成式AI的实际应用,揭示了AI在提高绩效方面的重要潜力。

3. 研究还发现,有些顾问采用了“Cyborg”和“Centaur”行为,将人工智能和人类工作相结合,可能指明了未来AI应用的方向。

站长之家(ChinaZ.com) 9月26日 消息:哈佛大学领导的一项研究发现,使用生成式人工智能(AI)的波士顿咨询集团(BCG)的数百名顾问在完成任务的频率、速度和质量方面表现出色,相较于不使用AI的同行,他们的绩效提高了40%。

这项研究由哈佛、沃顿和麻省理工等数据科学家和研究人员进行,是首次对企业中生成式AI的实际应用进行了重大研究。研究起源于ChatGPT于2022年11月公开发布后,引发了各大企业积极探索最佳利用方式的热潮。研究团队在今年1月快速展开研究,并使用了GPT-4进行实验,该模型被普遍认为是最强大的大型语言模型(LLM)。这项研究为企业如何部署AI提供了一些重要的启示。

机器人画画

哈佛本次研究的首席作者Fabrizio Dell’Acqua表示:“我们能够提升这些高薪、高技能的顾问的绩效,他们来自顶尖的MBA学院,从事与日常任务非常相关的工作,平均提高了40%,我认为这真的令人印象深刻。”

尽管报告在九天前公开评审,但除了学术界和其社交圈之外并未引起重大关注。除了其标题外,研究还提供了一些关于何时不使用AI的警示性发现。研究得出结论,存在所谓的“崎岖技术边界”,即AI可以轻松完成的任务与当前AI能力之外的任务之间存在难以辨别的障碍。

该研究还指出了一些技术能力较强的顾问采用的AI使用模式,研究人员将其称为“Cyborg”和“Centaur”行为,他们认为这可能指出了如何处理对AI能力存在不确定性的任务的方向。

这项研究的重要发现之一是AI具有平衡技能的能力。在研究之前表现最差的顾问,在使用AI后绩效提高了43%,而对顶级顾问的提升较小。

研究的主要结论之一是,AI的内部工作方式仍然不透明,很难确定在某些任务中何时可靠使用AI,这是未来组织面临的主要挑战之一。

但是,报告指出,一些顾问似乎比其他人更好地穿越了这一技术边界,他们被称为“Centaurs”或“Cyborgs”,以一种结合了人工智能和人类工作优势的方式来回切换。 Centaurs在人和机器之间有明确的界限,根据每个任务的感知优势和能力,在人工智能和人工任务之间切换。 Cyborgs则在执行大多数任务时将机器和人类相融合。

研究还发现,一些任务对AI的表现一直较好,这与目前的一些实践相矛盾。公司不应该错误地认为AI最适合作为第一稿生成,并强制人工干预。相反,公司应该让AI做它真正擅长的事情,而人工则应该尝试深入挖掘其他任务。

举报

  • 相关推荐
  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛虽存随机性,但中国开源阵营已展现强劲势头。

  • 被AI引用才是真的流量:写出让GPT、Gemini主动引用的AI搜索友好型内容(实操清单 + 工具推荐)

    本文系统介绍生成式引擎优化(GEO)的核心方法,帮助内容从“给人看”升级为“AI友好型”。关键策略包括:1.采用结构化写作框架,在开头设置可直接回答问题的“黄金段落”;2.运用分步清单、数据标注、FAQ等模块提升内容引用率;3.通过多平台同步分发增加曝光;4.使用AIBase等工具量化监测内容被AI引用的频率与场景,并给出5天落地执行表。

  • 铭凡MS-S1 MAX正式发布:126TOPS总算力的AI工作站,提供 USB4 v2、PCle 4插槽

    印凡MS-S1MAX迷你AI工作站体积仅3.3升,集成126TOPS算力,搭载AMD锐龙AI Max处理器与Radeon 8060核显,支持本地运行1280亿参数大模型。配备128GB LPDDR5X内存、双M.2插槽及高速USB4接口,采用先进散热设计实现130W稳定输出。紧凑机身支持灵活部署,为企业本地AI与边缘计算提供高效解决方案。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • ROBOT PHONE登场:荣耀为AI终端开了自进化的未来新局

    ​十年前,AI还停留在算力、模型与数据此消彼长的层面。如今,技术的发展早已超乎想象。 2025年上半年,Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”,它结合了Gemini模型的创造性问题解决能力,以及自动化评估器(Evaluator)的反馈学习机制,能够判断“什么是好的”,并据此不断自我优化。 �

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • AI日报:腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新;阿里夸克AI眼镜开启预售

    本文汇总近期AI领域重要动态:月之暗面再获数亿美元融资,显示资本对国产大模型的信心;Anthropic为Claude推出记忆功能,兼顾个性化与隐私保护;中科大与字节发布MoGA长视频生成模型,实现分钟级高质量生成;腾讯ima2.0升级任务模式,可自主拆解复杂流程;阿里夸克AI眼镜开启预售,融合拍摄与智能功能;微软Copilot新增群聊、记忆与Edge AI模式;Opera推出深度研究代理ODRA提升�

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

今日大家都在搜的词: