首页 > 业界 > 关键词  > 互联网地址最新资讯  > 正文

GPT-4并非完美无缺:“胡编乱造”依旧存在

2023-03-15 11:15 · 稿源: 快科技

今天,OpenAI带来了全面进化的GPT-4,相较此前的GPT-3.5,新模型在准确度等方面存在相当显著的提升。

但AI毕竟还是AI,OpenAI也明确表示,现阶段的GPT-4并不完美,在一些方面依旧存在问题。

比如,在GPT-3.5中就存在的,AI胡编乱造”问题,到了GPT-4,也依旧存在。

在新版本中,AI依旧会编造事实,并且事实方向也不一定总是可靠的,由于系统不知道什么是真的,什么是假的,它们可能会生成完全错误的文本。

对此,OpenAI表示,它倾向于坚持认为它是正确的,即使它错了”,这导致它有时仍然会输出完全错误的结果。

比如在被要求提供描述最新癌症研究的网站地址时,GPT-4甚至会生成不存在的互联网地址,用来佐证并不正确的结论。

举报

  • 相关推荐
  • ChatGPT重磅升级GPT-4.1:编程专家模型登场

    OpenAI于5月15日正式推出GPT-4.1模型,采用差异化推送策略:付费用户可体验完整版,普通用户使用轻量级GPT-4.1 mini。新版模型在编程任务表现突出,能精准遵循指令,避免冗长输出。测试显示其响应速度提升30%,输出稳定性提高40%,部分性能超越GPT-4o。同时OpenAI宣布将斥资30亿美元收购编程工具Windsurf,强化开发者生态,与Google同日发布的Gemini-GitHub形成直接竞争。两大巨头的动作标志着AI编程助手进入生态竞争新阶段。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱

  • 小米高管发声:华为、小米等都非常优秀 没必要评价别人

    日前小米产业投资部合伙人潘九堂发布微博,称上汽、吉利、长城、长安、奇瑞、比亚迪、理想、华为和小米等等等都非常优秀,都为中国汽车产业做出了贡献,都是某些方面的榜样。 每家企业因为起步/基础和时代/历史条件不一样,发展模式/路径不太一样,没必要站在企业自己角度乱评价别人,相信市场经济和用户的选择。”

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 用DeepSeek徒手一个能对话的AI简历,助你当场拿下Offer。

    ​故事是这样的。 我最近一直在招人,想招点人帮我分担一些压力,全职的实习的啥的都可以。 我这再怎么说,也是一个跟AI有关的地方,所以很多人在投简历的时候,都会写很多跟AI相关的经历,我甚至收到过很多AI生成的简历。 很多写的很玄乎,什么掌握全链路工作流,独立搭建xx系统,深度参与xx项目,掌握xx行业资源等等,但是一面,问用过最惊艳的AI产品是啥,10个�

  • 小米芯11年修成正果!玄戒O1、玄戒T1、自研4G基带齐发 雷军:后来者总有机会

    小米在5月22日发布会上宣布推出玄戒O1、玄戒T1和自研4G基带三款芯片产品。其中玄戒O1采用3nm工艺,拥有190亿晶体管,采用创新的10核架构,性能达到旗舰级别;玄戒T1是专为智能手表设计的4G芯片,性能提升35%。雷军回顾了小米11年造芯历程,从2014年松果项目立项到2021年重启大芯片研发,累计投入超135亿元,研发团队超2500人。小米通过先研发小芯片积累经验,最终实现SoC大芯片突破,展现了持续投入半导体产业的决心。

  • 小米芯过程非常艰难!林斌:一波三折

    小米创始人雷军5月22日透露,公司芯片研发已默默投入4年多,累计投入超135亿元,研发团队超2500人。他表示芯片研发远比外界想象的艰难,小米选择在O1芯片量产后才对外公布。小米联合创始人林斌称芯片业务"一波三折",暗示研发过程充满挑战。目前小米芯片研发投入和团队规模均居国内前三,今年预计研发投入将超60亿元。雷军强调芯片是小米突破硬核科技的底层赛道,呼吁给予更多时间和耐心。

  • 理想汽车OTA7.4正式推送!自研MindGPT-4o-preview模型首次上车

    理想汽车5月28日发布OTA 7.4版本升级,主要亮点包括:1)首次搭载自研MindGPT-4o大模型,智能助手"理想同学"升级为3D毛绒形象,新增双手交互动作,语音交互更自然生动;2)新增"小同桌"多角色对话功能,支持连续聊天和情商引导;3)升级为生活助手Agent,能自主操作车机完成复杂任务,支持支付宝小程序操作;4)新增家庭账号系统、面容识别和对话历史功能;5)影音体验优化,支持前后排独立音区;6)推出儿童节专属"小主人"模式,新增斑马百科应用;7)新增超充站降锁、冰箱定时开关等实用功能;8)优化L6车型CDC悬架系统,提升操控性。

  • 谷歌宣布 Chrome 浏览器提速,但“吃内存”的毛病依旧没改

    有网友在 Reddit 上吐槽:就一个 Chrome 标签页,内存占用竟高达 6GB,导致系统卡顿,影响使用体验……