首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

哈佛研究: GPT-4 可将工作质量提升超过40%!

2023-10-16 10:54 · 稿源:站长之家

划重点:

- 哈佛商学院的研究发现,GPT-4能够将员工的工作质量提高超过40%。

- 不熟练地使用AI可能会降低工作绩效高达19个百分点。

- 研究还区分了AI用户为“半人半马”和“半机械人”,探讨了不同的AI合作方式。

站长之家(ChinaZ.com) 10月16日 消息:根据来自哈佛商学院的一项新研究,GPT-4语言模型可以显著提高员工的工作质量,提高超过40%。然而,研究也发现,不熟练地使用人工智能可能会导致工作绩效下降高达19个百分点。

研究对波士顿咨询集团(BCG)的咨询师进行了比较,分别考察了使用AI和不使用AI的两组咨询师。研究人员发现,使用GPT-4的咨询师的工作质量提高了40%,速度提高了25%,任务完成率提高了12%。研究还表明,无论咨询师的技能水平如何,都会受益于使用AI,但绩效最低的咨询师获益最大,工作质量提高了43%,而绩效最高的咨询师仅提高了17%。

机器人脑机接口

图源备注:图片由AI生成,图片授权服务商Midjourney

然而,尽管工作质量得到显著提高,研究结果也显示出更少的多样性。研究人员指出,虽然GPT-4有助于生成更出色的内容,但可能导致产出更同质化的结果。

这些研究结果适用于GPT-4“技术边界内”的任务,这意味着这些任务可以轻松由AI完成。在实验中,咨询师被要求进行创意产品创新和开发,包括头脑风暴新的饮料概念,选择最可行的产品并制定上市计划。

研究人员还测试了“技术边界外”的任务,即AI模型可能难以完成的任务。在实验中,咨询师被要求提出可行的策略,帮助提升一家公司的业务。他们的任务是通过采访和财务数据分析公司的渠道绩效,然后向CEO提出建议。绩效的衡量标准是是否提出了正确的策略。在这方面,使用AI的咨询师的成功率要低19个百分点。

这项研究强调了专业人士必须熟练地使用AI技术,以使其真正发挥作用。否则,将AI用于其不擅长的任务可能会损害员工的绩效。研究人员将这种不均匀的绩效称为“技术边界的崎岖”。

哈佛的研究涵盖了758名咨询师,占BCG员工总数的约7%。分析的任务涵盖了咨询师的日常工作,包括创造力、分析思维、写作能力和说服力。

研究还将AI用户分为两组 - “半人半马”和“半机械人”。半人马的方法以半人半马的神话生物命名,研究人员认为人工智能也可能是人类和机器的混合体。于半机械人——以科幻小说中设想的混合人机生物命名——这种方法更多的是关于集成,比如让人工智能完成他们开始的工作。

前者将任务分配给AI和人类,根据各自的优势和能力分配责任,而后者则更侧重于整合,例如让AI完成他们开始的工作。

这项研究的发现表明,有效与AI合作有多种途径,并且根据不同的用例需要采取不同的方式,可以为AI的好处提供更广泛的应用。不同的用例将需要不同的需求,采用半人半马或赛博格的方法可能会成为根据业务特定需求和能力量身定制的集成策略的一部分。研究人员认为,了解如何最好地使用AI的方法尚未完全理解,需要深入研究。

然而,存在一个即时风险,即雇主将不擅长的工作交给AI,从而“创造出长期的培训赤字”。专业技能需要通过正规教育、在职培训和员工提升来培养。

举报

  • 相关推荐
  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 中国品牌TOP1!海尔壁挂炉逆势增长43%

    2025年上半年中国壁挂炉行业整体销量下滑3.6%,市场趋冷。然而海尔壁挂炉逆势增长43.29%,凭借“双冷凝”节能科技获评“国际领先”技术,解决传统产品高能耗、水温不稳、预热时间长等痛点。其AI智能算法精准控温,配合水联网平台提供全流程解决方案,实现从产品制造到场景服务的跨越,为行业指明节能化、智能化、用户需求导向的发展方向。

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 中国冰箱业TOP5型号4款是海尔

    2025年7月冰箱行业零售额、零售量增速放缓,环比下降34.5%和29.1%。行业承压加剧,多数品牌负增长,仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长,TOP5型号中占4款,均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖,显著延长食材保鲜期。通过全流程数字化升级,海尔实现运营效率提升,以科技驱动和用户体验赢得市场,为行业提供增长启示。

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

今日大家都在搜的词: