OpenAI 聘请 50 名专家测试 GPT-4 模型安全性

2023-04-15 11:03 · 稿源：站长之家

站长之家(ChinaZ.com) 4月15日消息:据 Financial Times 报道，OpenAI 为了降低 ChatGPT 的危险性，建立了一支「红队」，并聘请了 50 名学者和专家来测试最新 GPT-4 模型。这支「红队」将「定性探测和对抗性测试」新模型，试图「攻破」它。

OpenAI，ChatGPT，人工智能，AI

去年，他们在六个月的时间里进行了测试。他们用探索性或危险的问题来挑战 GPT-4，发现了一些神经毒剂、谎言、语言操纵和危险的科学常识等问题。

OpenAI 根据「红队」的反馈，对 GPT-4 进行了重新训练和安全评估，然后更广泛地向公众发布。OpenAI 表示，该公司非常重视安全性，在发布前对插件进行了测试。随着越来越多的人使用 GPT-4，该公司将定期更新它。

（举报）

相关推荐

关键词：

AI全面落地双11，淘宝走出一条和OpenAI不同的路

今年的双11已经进入最后阶段，消费者和商家都有一个明显的感受是，AI的浓度真的很高，并且AI的全面落地应用，真的在改变传统用户购物、商家经营的链路。消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品，其公布的数据显示，AI万能搜已经帮助消费者解决了5000万个消费需求。另一个则是平台推荐的商品越

AI导购双11购物淘宝AI
荐OpenAI 推出浏览器：“让位吧，Chrome”

北京时间10月22日凌晨，没等来传闻中的Gemini3，等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。简单来说，这是一个把ChatGPT"塞进"浏览器的产品，你在任何网页上都能随时唤出ChatGPT侧边栏，让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。听起来有点像Chrome装了个ChatGPT插件?确实如此，但OpenAI的野心远不止于此。

OpenAI
从“实现需求”到“共创价值”：AI Native时代需要什么样的工程师团队？

在1024程序员节，小红书技术副总裁风笛出席CCF工程师文化日五周年庆典，分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码，其余被会议沟通挤占，导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式：通过任务导向的扁平化组织，让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例，展示新型协作效能。强调AI不会取代工程师，而是将其角色提升至系统定义和复杂性管理的新高度。

1024程序员节工程师文化 AI
OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
新品预售 | Switch 2专属卡皇！佰维 ME300 Express高速存储卡首发

随着Switch2性能提升，玩家对存储卡速度和容量需求升级。佰维推出专为Switch2设计的ME300 microSD+Express高速存储卡，采用SD7.1新标准，读取速度高达900MB/s，写入速度800MB/s，提供1TB超大容量。该卡能大幅缩短游戏安装、加载时间，确保流畅体验，支持4K输出和掌机模式高帧率渲染。ME300兼顾现有设备兼容性与未来扩展性，现已开启预售，提供三种容量选择。

Switch2 存储卡游戏扩容
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech

今日大家都在搜的词：

热文

3 天
7天

OpenAI 聘请 50 名专家测试 GPT-4 模型安全性

AI全面落地双11，淘宝走出一条和OpenAI不同的路

荐OpenAI 推出浏览器：“让位吧，Chrome”

从“实现需求”到“共创价值”：AI Native时代需要什么样的工程师团队？

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

华为WATCH Ultimate 2非凡探索版明日开启预售

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

荐OpenAI也来了，巨头为何决战AI浏览器？

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

新品预售 | Switch 2专属卡皇！佰维 ME300 Express高速存储卡首发

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

焕新享界S9开卖72小时预订突破8000台

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

站长商机