研究发现：GPT-3经常出错，重复有害的错误信息

2023-12-25 17:03 · 稿源：站长之家

划重点:
⦁ 研究人员系统地测试了ChatGPT对事实、阴谋、争议、误解、刻板印象和虚构等六类声明的理解
⦁ 研究发现GPT-3经常出错，自相矛盾，并重复有害的错误信息
⦁ 大型语言模型如OpenAI的ChatGPT显示它们重复了阴谋论、有害的刻板印象和其他形式的错误信息

站长之家（ChinaZ.com）12月25日消息:一项新研究发现，OpenAI的ChatGPT等大型语言模型经常重复阴谋论、有害的刻板印象和其他形式的错误信息。

机器人上网

图源备注：图片由AI生成，图片授权服务商Midjourney

最近的一项研究中，加拿大滑铁卢大学的研究人员系统地测试了ChatGPT对六个类别的声明（事实、阴谋、争议、误解、刻板印象和虚构）的理解。他们发现GPT-3经常出错，在一次回答过程中自相矛盾，并重复有害的错误信息。

计算机科学David R. Cheriton学院的教授丹·布朗表示:“大多数其他大型语言模型都是基于OpenAI模型的输出进行训练的。所有这些模型都反复出现了我们在研究中发现的这些问题。”

研究中，研究人员使用了四种不同的调查模板，询问了超过1200个不同的陈述，涵盖了六个类别的事实和错误信息。

（举报）

相关推荐

关键词：

GPT-3

OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
1299元起售！iPhone Pocket发布：采用3D 针织一体结构

今日下午，苹果发文称，三宅一生携手苹果正式推出新配件iPhone Pocket。其中短带款提供八种色彩外观：柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。长带款提供三种色彩外观：宝石蓝色、肉桂色和黑色。短带款iPhone Pocket售价为1299元，长带款售价为1899元。

苹果 iPhone Pocket
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
50人团队、1亿美元ARR，AI PPT还在续写“神话”？

AI 生成 PPT 可以说是去年的热门赛道，尤记得关于这类产品是否具有真正竞争力的热烈讨论，而2025年9月份的数据显示，赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且，今天官宣了由 a16z 领投的6800万美元 B 轮融资，融资后估值达到21亿美元。而不仅 Gamma，根据 AI 产品榜数据，9月份，AIPPT 赛道的 Top3产品流量平均涨幅30%+，更有一款

AI生成PPT Gamma融资 AIPPT赛道
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
新品预售 | Switch 2专属卡皇！佰维 ME300 Express高速存储卡首发

随着Switch2性能提升，玩家对存储卡速度和容量需求升级。佰维推出专为Switch2设计的ME300 microSD+Express高速存储卡，采用SD7.1新标准，读取速度高达900MB/s，写入速度800MB/s，提供1TB超大容量。该卡能大幅缩短游戏安装、加载时间，确保流畅体验，支持4K输出和掌机模式高帧率渲染。ME300兼顾现有设备兼容性与未来扩展性，现已开启预售，提供三种容量选择。

Switch2 存储卡游戏扩容
荐排队5小时，互动3分钟，年轻人流行“调戏”景区NPC

当被NPC“李世民”现场封为大唐郡主、骠骑大将军时，游客们大概就知道，这景区来对了。最近，因为在全国各大景区还原李世民等经典角色，演员郑国霖翻红，成了名副其实的“打工皇帝”、景区NPC顶流。有媒体报道，不久前的十一假期，他七天内去了七个城市，最忙的一天只睡三四个小时。 NPC原指游戏中的非玩家角色（Non-Player Character），但在近几年，一些景区会安排

景区NPC 郑国霖李世民
iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

苹果联合日本设计师品牌三宅一生推出iPhone Pocket配件，售价1299元。产品采用3D针织工艺，支持七种佩戴方式，但被质疑与普通手机套功能无异。社交媒体上“1299元买块会变形的布”引发热议，消费者对比9.9元帆布手机套直指苹果收割粉丝。支持者认为定价符合奢侈品逻辑，反对者则拒绝为设计概念支付溢价。该产品在设计价值与实用功能间引发两极争议。
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型

今日大家都在搜的词：

热文

3 天
7天

研究发现：GPT-3经常出错，重复有害的错误信息

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

1299元起售！iPhone Pocket发布：采用3D 针织一体结构

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

50人团队、1亿美元ARR，AI PPT还在续写“神话”？

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

新品预售 | Switch 2专属卡皇！佰维 ME300 Express高速存储卡首发

荐排队5小时，互动3分钟，年轻人流行“调戏”景区NPC

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

95岁巴菲特每周还上5天班此前计划年底退休

微信宣布治理恶意外部链接：6类违规内容将遭限访

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

华为Mate 70 Air维修备件价格公布：换主板2499元

站长商机