首页 > 业界 > 关键词  > 正文

研究发现:BCG咨询师使用GPT-4解决业务问题表现不佳

2023-09-26 15:01 · 稿源:站长之家

文章概要:

1. BCG咨询师使用OpenAI的GPT-4在解决业务问题时表现较差,研究发现其比不使用GPT-4的同行表现差23%。

2. 研究发现,即使在被警告可能出错后,参与者仍未对工具的输出提出挑战。

3. 观点认为,企业需要积极采用生成式人工智能(Gen AI)以及如何管理与风险相关的问题。

站长之家(ChinaZ.com) 9月26日 消息:一项新研究发现,波士顿咨询集团(BCG)的咨询师在使用OpenAI的GPT-4解决业务问题时表现不佳,他们的表现比那些没有使用GPT-4的同行差了整整23%。这一发现引发了对于人工智能在业务领域中的实际效用和风险的讨论。

有趣的是,即使在研究参与者被提醒工具可能出错后,他们仍然未对GPT-4的输出提出挑战。这表明了一种对于人工智能技术的过度依赖,尤其是当它们在决策和问题解决方面发挥关键作用时,可能导致潜在的问题。

1_1693449769614_ai2023_Facial_AI_robots_a_lot_of_cash_on_the_conference_table_i_d531bb02-0ec5-4e0a-9f1c-a65fa11a4c51

图源备注:图片由AI生成,图片授权服务商Midjourney

在这个技术驱动的时代,企业领导者对于如何管理和应对风险提出了一些关键见解。Sharon Marcil,BCG北美区董事总经理表示,企业需要立即采纳生成式人工智能(Gen AI),并确保在组织的最高层有人负责,而不是将其委派给下级。她还强调了在风险流程和核心流程(如产品开发)中嵌入风险保护,使其真正成为文化元素的重要性。

Allstate的CEO Tom Wilson表示,企业已经从技术支持的战略转向了需要不同专业知识的技术驱动战略。他强调了需要创造力,需要能够超越常规思维的人才。对于他们来说,更重要的是建立内部能力,而无法从外部获取,并确保与外部人员建立正确的合作伙伴关系,以获取最佳思维。

IBM的CEO Arvind Krishna则关注知识产权(IP)的问题,特别是在代码领域。他提出了一个例子,如果某人在支付行业使用生成式人工智能来编写某项工作,然后将其保留20年,那么在第15年,某人可能会出现并指出代码中的某些部分与他们的工作非常相似。这种情况引发了对于知识产权和法律责任的复杂问题。

举报

  • 相关推荐
  • 微软计划裁员并加强对表现不佳员工的审核

    微软正在筹备一轮裁员,并将强化对表现不佳员工的审核作为裁员计划的一部分。虽然微软发言人证实了这一消息,但并未透露具体的裁员数字,表示公司将注重高绩效人才的培养与发展,并会对表现不佳的员工采取相应措施。作为一家跨国企业,裁员可能会涉及多个部门和地区,但具体影响范围有待公司官方进一步披露。

  • 心跳快和心跳慢的人谁更健康:研究发现心跳慢更长寿

    诸多研究发现,在安静休息状态下,每分钟50~80次心跳最健康,超过80次就算增快了。静息心率维持在正常且偏低水平的人更长寿,与静息心率为60~69次/分钟的老年人相比,那些静息心率在70~99次/分钟的老年人全因死亡风险更高。2、情绪平稳、饮食清淡、保证睡眠日常应保持情绪平稳,日常饮食应避免过度饱餐,食物可以清淡为主,熬夜可使静息心率加快,所以晚上保证充分睡眠,也是保持心血管健康的基础。

  • 阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误

    今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。这证明了过程奖励模型能够显著提高推理的可靠性,为未来开发推理过程监督技术开辟了新的途径。

  • Check Point:通过高级电子邮件防护确保业务安全

    随着5G的发展、个人智能设备的不断普及,人们日常沟通的方式也变得更加多样。在商务领域,电子邮件仍然是企业员工内外部正式沟通的首选方式。CheckPoint相信,通过“预防为先”的安全理念,用户能够在保障安全的前提下,享受邮件沟通通畅带来的便利与高效。

  • 狂暴起来!REDMI发布K80 OTA说明:游戏表现显著提升

    快科技12月27日消息,REDMI K80系列上市后非常火爆,创下了10天销量突破100万台的K系列最快破百万记录。与此同时,也有不少用户提出反馈,尤其是部分重度游戏用户觉得K80的性能调校不够狂暴,希望能更放开一些。对此,REDMI今天专门发布了一份K80OTA说明,称这些用户的呼声都听到了,产品和研发的同学也在持续推进改进中。REDMI K80「OS2.0.13.0.VOKCNXM」OTA当前正式推送中,其中�

  • 2.5亿美元!谷歌将购买部分HTC XR业务

    据报道,谷歌将斥资2.5亿美元与HTC达成一项重要交易,其中部分HTC的XR研发团队精英将融入谷歌大家庭。根据协议条款,谷歌将获得HTC非专属的XR知识产权授权,这一战略合作的预计完成时间为2025年第一季度。此次协议的达成,将助力谷歌兑现对AndroidXR平台的承诺,加速推动头戴式装置和眼镜生态系统的蓬勃发展,为XR产业的全面进步注入强劲动力。

  • 部分XR业务卖给谷歌!HTC王雪红发内部信:VIVE品牌等维持不变

    HTC与Google签署了一项2.5亿美元的XR协议,根据协议,Google将收购部分HTCXR的研发团队,并获得HTCXR知识产权的非专属授权,此次交易预计将于2025年第一季度完成。HTC董事长王雪红今天向员工发出内部信指出,此次与Google的合作将强化HTC在XR生态系统中的战略布局,并实现更精简的产品组合,提升运营效率和财务灵活性。HTC在新产品、平台、内容、服务以及跨部门协同合作方面取得了显著成就,通过与Google合作,HTC将推动XR生态系统的进一步发展,助力Google实现AndroidXR平台的承诺,加速头戴式设备和眼镜生态系统的成长。

  • 余承东喜提享界S9发布实测:超长续航、表现给力

    余承东分享了他刚刚购买的享界S9Ultra长航版的新能源汽车的体验。余承东表示,新车提供了如丝般顺滑且舒适宁静的驾驶体验,车内环境健康,无刺鼻气味,达到了五星级健康座舱标准。鸿蒙智行享界S9Ultra长航版自2024年11月26日发布以来,以其42.98万元起的售价,为用户提供了给力的续航表现。

  • 国产智算集群黑马!曦源一号SADA算力集群综合评测表现优异

    近日,加佳科技曦源一号SADA算力集群项目一期顺利通过工信部中国软件评测中心权威评测认证。本次测试涵盖了项目一期已上线的 1024 张沐曦高性能GPU加速卡集群。评测结果显示,该集群在生态兼容性、系统稳定性、线性度、模型支持度等多个维度均表现优异。加佳科技长期深耕国产替代数字科技的技术研发、平台运营与解决方案提供。旗下曦源一号SADA万卡集群通过构建开放

  • 腾讯和育碧或将成立电子游戏公司 此前马化腾态:期待海外业务更快发展

    今日,有知情人士称,腾讯控股和法国游戏公司育碧的创始家族吉耶莫家族正考虑成立一家新合资公司。这家合资公司的资产份额,会包括部分育碧资产。育碧现任CEOYvesGuillemot,以及他代表的整个家族,曾宣称希望能将更多股份卖给腾讯,但是又不希望交出控制权。