首页 > 业界 > 关键词  > 正文

研究发现:BCG咨询师使用GPT-4解决业务问题表现不佳

2023-09-26 15:01 · 稿源:站长之家

文章概要:

1. BCG咨询师使用OpenAI的GPT-4在解决业务问题时表现较差,研究发现其比不使用GPT-4的同行表现差23%。

2. 研究发现,即使在被警告可能出错后,参与者仍未对工具的输出提出挑战。

3. 观点认为,企业需要积极采用生成式人工智能(Gen AI)以及如何管理与风险相关的问题。

站长之家(ChinaZ.com) 9月26日 消息:一项新研究发现,波士顿咨询集团(BCG)的咨询师在使用OpenAI的GPT-4解决业务问题时表现不佳,他们的表现比那些没有使用GPT-4的同行差了整整23%。这一发现引发了对于人工智能在业务领域中的实际效用和风险的讨论。

有趣的是,即使在研究参与者被提醒工具可能出错后,他们仍然未对GPT-4的输出提出挑战。这表明了一种对于人工智能技术的过度依赖,尤其是当它们在决策和问题解决方面发挥关键作用时,可能导致潜在的问题。

1_1693449769614_ai2023_Facial_AI_robots_a_lot_of_cash_on_the_conference_table_i_d531bb02-0ec5-4e0a-9f1c-a65fa11a4c51

图源备注:图片由AI生成,图片授权服务商Midjourney

在这个技术驱动的时代,企业领导者对于如何管理和应对风险提出了一些关键见解。Sharon Marcil,BCG北美区董事总经理表示,企业需要立即采纳生成式人工智能(Gen AI),并确保在组织的最高层有人负责,而不是将其委派给下级。她还强调了在风险流程和核心流程(如产品开发)中嵌入风险保护,使其真正成为文化元素的重要性。

Allstate的CEO Tom Wilson表示,企业已经从技术支持的战略转向了需要不同专业知识的技术驱动战略。他强调了需要创造力,需要能够超越常规思维的人才。对于他们来说,更重要的是建立内部能力,而无法从外部获取,并确保与外部人员建立正确的合作伙伴关系,以获取最佳思维。

IBM的CEO Arvind Krishna则关注知识产权(IP)的问题,特别是在代码领域。他提出了一个例子,如果某人在支付行业使用生成式人工智能来编写某项工作,然后将其保留20年,那么在第15年,某人可能会出现并指出代码中的某些部分与他们的工作非常相似。这种情况引发了对于知识产权和法律责任的复杂问题。

举报

  • 相关推荐
  • 专业创作者之选:佳能R50V在视频、Vlog与直播领域的全能表现

    佳能R50V相机专为视频创作者设计,集专业视频制作、Vlog记录与高质量直播于一体。支持6K超采样4K视频录制,配备10-bit 4:2:2色彩与Canon Log3,保障画质细腻且后期空间大。机身仅323克,便携性强,优化自拍与竖拍操作,内置美颜与智能对焦功能。直播时可通过USB直连电脑,实现4K 60P高清输出。它融合专业性能与易用性,是应对多种创作需求的理想选择。

  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • 短剧分账迎红利、漫剧赛道成蓝海,快手内容消费业务再升级

    快手在短剧与漫画领域持续发力,通过多元变现模式与AI技术赋能行业。短剧用户规模超3亿,年上线剧集超3万部,消费规模增长5.6倍,平台提供IAP、IAA、分账、品牌定制剧等变现方式,并升级智能推荐与广告体验。漫画作为新兴赛道实现爆发增长,累计消费破2亿,平台通过"造梦专家2.0"AI工具提升制作效率,并推出流量扶持、现金激励等政策。快手可灵AI引擎进一步赋能内容生产,支持图文生成、视频制作及多语言交互,携手生态伙伴共建健康内容生态,实现商业价值突破。

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 海尔智慧楼宇调整业务布局,紧抓新机会实现逆势增长

    2025年暖通行业承压前行,节能改造成为企业突破口。海尔智慧楼宇通过磁气悬浮空调、AI多联机等硬件创新,结合“楼宇大脑”软件平台,实现全场景智慧节能方案。在新能源、数据中心等领域应用案例中,系统节能超50%,PUE值低于1.2,以技术升级推动行业低碳转型,助力企业降本提效。

  • 中国移动北斗卫星短信业务升级:支持文字+图片+语音

    中国移动宣布北斗短信息服务完成重大升级,新增图片、语音等富媒体功能,文本传输能力显著提升,单条消息可发送40个汉字、接收达10个汉字。Redmi Note 15 Pro+卫星消息版率先支持升级,其他品牌终端也将陆续开启。此次升级在无地面网络信号时仍能通过多种形式传递信息,为户外探险、应急救援等场景提供坚实通信保障,标志着北斗通信正式步入“视听兼具”新时代。

  • 百度发布 2025 年第三季度财报:AI 业务收入同比增长超 50%

    日,百度正式发布2025年第三季度财报,数据显示,公司当季总营收达312亿元,其中百度核心业务营收247亿元,AI业务成为核心增长引擎,收入同比增长超50%,展现出强劲的商业化落地能力。 在AI云领域,百度实现33%的同比增长,其中AI高性能计算基础设施的订阅收入同比激增128%。财报披露,百度千帆大模型平台已完成全面升级,推出整套Agent Infra解决方案,进一步强化模型服�

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • GEO排名查询工具实测:如何监控你的品牌在AI搜索中的表现

    在为SaaS公司进行内容审计时发现,虽然官网在Google排名前三,但在ChatGPT和豆包等AI搜索平台询问"推荐项目管理工具"时却未被提及。这揭示了传统SEO与AI搜索排名的差异:AI搜索更看重内容权威性、信息新鲜度和结构化程度,而非外链和关键词密度。数据显示,58.5%的Google搜索为零点击,ChatGPT日查询量超10亿,AI搜索正分流传统流量。建议企业使用AIBase等工具监控多平台曝光数据,通过优化高质量内容提升AI搜索排名,尤其适合ToB企业、教育机构和本地服务商。

今日大家都在搜的词: