首页 > 业界 > 关键词  > 正文

研究发现:BCG咨询师使用GPT-4解决业务问题表现不佳

2023-09-26 15:01 · 稿源:站长之家

文章概要:

1. BCG咨询师使用OpenAI的GPT-4在解决业务问题时表现较差,研究发现其比不使用GPT-4的同行表现差23%。

2. 研究发现,即使在被警告可能出错后,参与者仍未对工具的输出提出挑战。

3. 观点认为,企业需要积极采用生成式人工智能(Gen AI)以及如何管理与风险相关的问题。

站长之家(ChinaZ.com) 9月26日 消息:一项新研究发现,波士顿咨询集团(BCG)的咨询师在使用OpenAI的GPT-4解决业务问题时表现不佳,他们的表现比那些没有使用GPT-4的同行差了整整23%。这一发现引发了对于人工智能在业务领域中的实际效用和风险的讨论。

有趣的是,即使在研究参与者被提醒工具可能出错后,他们仍然未对GPT-4的输出提出挑战。这表明了一种对于人工智能技术的过度依赖,尤其是当它们在决策和问题解决方面发挥关键作用时,可能导致潜在的问题。

1_1693449769614_ai2023_Facial_AI_robots_a_lot_of_cash_on_the_conference_table_i_d531bb02-0ec5-4e0a-9f1c-a65fa11a4c51

图源备注:图片由AI生成,图片授权服务商Midjourney

在这个技术驱动的时代,企业领导者对于如何管理和应对风险提出了一些关键见解。Sharon Marcil,BCG北美区董事总经理表示,企业需要立即采纳生成式人工智能(Gen AI),并确保在组织的最高层有人负责,而不是将其委派给下级。她还强调了在风险流程和核心流程(如产品开发)中嵌入风险保护,使其真正成为文化元素的重要性。

Allstate的CEO Tom Wilson表示,企业已经从技术支持的战略转向了需要不同专业知识的技术驱动战略。他强调了需要创造力,需要能够超越常规思维的人才。对于他们来说,更重要的是建立内部能力,而无法从外部获取,并确保与外部人员建立正确的合作伙伴关系,以获取最佳思维。

IBM的CEO Arvind Krishna则关注知识产权(IP)的问题,特别是在代码领域。他提出了一个例子,如果某人在支付行业使用生成式人工智能来编写某项工作,然后将其保留20年,那么在第15年,某人可能会出现并指出代码中的某些部分与他们的工作非常相似。这种情况引发了对于知识产权和法律责任的复杂问题。

举报

  • 相关推荐
  • Panduit 泛达荣获EcoVadis企业可持续发展表现银牌评级

    泛达公司宣布荣获EcoVadis企业可持续发展银牌评级,位列全球前6%,彰显其在环境责任与可持续商业实践方面的坚定承诺。该评估覆盖环境、劳工与人权、商业道德及可持续采购四大核心领域,包含21项可持续发展指标。泛达全球可持续发展经理Mark Dehmlow表示,这一成就证明公司在环境管理、道德采购及员工健康安全方面的努力正产生可衡量影响。作为全球领先的电气与网络基础设施解决方案制造商,泛达将持续提升可持续发展表现,契合市场期望,并支持合作伙伴生态系统及行业优先发展事项。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • 爱幸福·美好生活服务平台携手广州市心理咨询师协会与家教通 走进江夏社区

    2025年9月26日,江夏文化传承基地举办“倾听心灵,传递幸福”主题培训。活动由爱幸福平台联合广州心理咨询师协会等机构发起,通过专业课程培养社区倾听者,既增强心理健康服务力量,又助力居民提升就业技能。培训涵盖倾听技巧、危机干预等内容,学员通过考核后可入驻平台或社区服务站提供公益服务。该模式将专业技能与就业结合,为社区注入“幸福守护者”,并计划推广至全国。

  • 高频科技携多元化业务亮相IC WORLD 2025,为产业发展注入“芯”活力

    2025年北京微电子国际研讨会暨IC WORLD大会于9月24日在北京亦庄开幕。高频科技携超纯水工艺及多元化业务亮相,成为全场焦点。其超纯水系统以高水质、稳定供应和高效节水为核心优势,覆盖半导体超纯水供应、运维服务、水处理专用药剂等全链条解决方案。现场通过3D沙盘、数字化平台等互动形式生动展示技术实力,吸引大量观众咨询交流。高频科技致力于推动集成电路产业协同发展,通过多元化业务布局增强产业链关键环节的高效衔接,为合作伙伴创造更大价值。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

  • 美国洛杉矶上空现V形“UFO” 表面分布 9 个白色灯光

    8月28日晚,洛杉矶两名居民在阳台目击一架黑色V形不明飞行器悬停夜空,表面分布9个白色灯光,持续约25分钟后向南缓慢飞行消失。目击者拍摄的高清视频显示飞行器呈回旋镖状,中心有小型结构,外形类似F-117战机但无常规推进装置。专家推测可能是美军绝密无人机或超轻型飞机,但目击者否认后者可能性。事件引发广泛猜测,真实身份仍成谜,凸显公众对未知领域的好奇与探索。

  • 华为WATCH GT 6/Pro系列手表发布 售价1488元起

    华为于9月24日正式发布WATCH GT6系列智能手表,起售价1488元。该系列提供41mm和46mm两种尺寸,搭载OLED屏幕,续航最长可达21天,支持5ATM防水和IP69防尘。GT6 Pro新增跌倒检测、ECG心电图分析及专业运动模式,并配备蓝宝石玻璃表镜。全系采用高硅叠片电池技术,能量密度提升37%,支持无线快充。此外,首次应用骑行模拟功率功能,并搭载TruSense技术,精准监测心率、血氧等健康指标。GT6 Pro起售价2488元,进一步满足专业用户需求。

今日大家都在搜的词: