OpenAI公布ChatGPT安全框架以保障AI安全

2023-12-19 08:11 · 稿源：站长之家

站长之家（ChinaZ.com）12月19日消息:OpenAI 是 ChatGPT 的开发者，他们制定了应对人工智能可能带来的严重危险的计划。该框架包括使用 AI 模型的风险 “记分卡” 来衡量和跟踪潜在危害的各种指标，以及进行评估和预测。OpenAI 表示将根据新数据、反馈和研究不断完善和更新框架。

微信截图_20231219075955.png

该公司的 “应对” 团队（Preparedness Framework）将雇佣人工智能研究人员、计算机科学家、国家安全专家和政策专业人员来监测技术，并不断测试并警告公司，如果他们认为任何人工智能能力变得危险。该团队位于 OpenAI 的 “安全系统” 团队和 “超对齐” 团队之间。前者致力于解决人工智能中的问题，例如注入种族主义偏见，而后者研究如何确保在想象中的人工智能完全超过人类智能的未来中，人工智能不会对人类造成伤害。

据悉，“应对” 团队正在招聘来自人工智能领域之外的国家安全专家，帮助 OpenAI 了解如何应对重大风险。他们正在与包括美国国家核安全管理局在内的组织展开讨论，以确保公司能够适当地研究人工智能的风险。

该公司还将允许来自 OpenAI 之外的 “合格、独立的第三方” 测试其技术。

微信截图_20231219081518.png

OpenAI 的 “应对框架” 与其主要竞争对手 Anthropic 的政策形成了鲜明对比。

Anthropic 最近发布了其 “负责任扩展政策”（Responsible Scaling Policy），该政策定义了特定的 AI 安全级别和相应的开发和部署 AI 模型的协议。两个框架在结构和方法论上存在显著差异。Anthropic 的政策更加正式和规范，直接将安全措施与模型能力联系起来，并在无法证明安全性时暂停开发。OpenAI 的框架更加灵活和适应性强，设定了触发审查的一般风险阈值而不是预定义的级别。

专家表示，这两个框架都有其优点和缺点，但 Anthropic 的方法可能在激励和执行安全标准方面更具优势。一些观察人士还认为，OpenAI 在面对对 GPT-4等模型的快速和激进部署后，正在赶上安全协议方面的工作。Anthropic 的政策之所以具有优势，部分原因是它是主动开发而不是被动应对。

无论差异如何，这两个框架都代表了人工智能安全领域的重要进展。随着人工智能模型变得越来越强大和普及，领先实验室和利益相关者之间在安全技术上的合作和协调现在是确保人工智能对人类的有益和道德使用的关键。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
奥地利隐私投诉瞄准 OpenAI 的 ChatGPT

微软支持的初创公司OpenAI在周一成为了奥地利维权团体NOYB的投诉对象，指控其生成式AI聊天机器人ChatGPT提供了不准确的信息，可能违反欧盟隐私规定。图源备注：图片由AI生成，图片授权服务商MidjourneyNOYB表示，投诉人是一名公众人物，他向ChatGPT询问了自己的生日，但多次收到了错误的信息非机器人告知用户它没有必要的数据。”OpenAI此前承认该工具倾向于用“听起来有道理但不准确或毫无意义的答案”进行回复，他们认为这是一个难以解决的问题。

ChatGPT OpenAI
OpenAI允许用户直接使用ChatGPT：无需注册账号

当地时间4月1日，知名人工智能公司OpenAI发布重要公告，宣布将允许用户无需注册即可直接使用ChatGPT，这一举措旨在让更多人能够轻松体验人工智能的魅力。值得注意的是，对于未注册的用户，某些高级功能如保存或分享聊天记录、使用个性化指令等将无法享受。这一举措既体现了OpenAI对于技术进步的追求，也充分尊重了用户的个人意愿和权益。

人工智能 OpenAI ChatGPT
重磅！OpenAI宣布无需注册即可使用ChatGPT

日前，OpenAI宣布放开限制，允许用户无需注册ChatGPT即可直接使用该服务，这将让人们更容易体验人工智能的潜力。OpenAI表示，将从周一开始逐步推出这一功能，让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感，并获得问题答案。去年12月，中国工程院等单位发布2023全球十大工程成就，其中就包括ChatGPT，与中国空间站、百亿亿次超级计算机、鸿蒙操作系统等并列。

OpenAI ChatGPT 人工智能
荐OpenAI发布全新微调API ：ChatGPT支持更详细可视化微调啦！

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。这些功能包括:基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置和更详细的微调仪表板改进。如果对模型的请求超时或找不到模型名称，可能是因为模型仍在加载中，可在几分钟后重试。

OpenAI OpenAI
ChatGPT使用量增长，OpenAI在东京开设首家亚洲办事处

人工智能聊天机器人ChatGPT的开发者表示，他们已经在东京开设了一家办事处，这是其在亚洲的第一家办事处，旨在响应该服务在日本日益增长的受欢迎程度。此举是在去年四月美国OpenAI的首席执行官SamAltman与日本首相岸田文雄在东京会晤后推出的，当时这位高管表示了在日本设立办事处的意向。OpenAI在东京开设首家亚洲办事处的举动，无疑将为日本的科技创新和经济发展注入新的活力，也为OpenAI在亚洲市场的拓展奠定了坚实基础。

ChatGPT OpenAI AI头条
OpenAI新GPT-4 Turbo模型上线：可供付费ChatGPT用户使用

OpenAI的全新GPT-4Turbo模型已全面上线，并正式向付费ChatGPT用户开放。GPT-4Turbo更新标志着人工智能领域的又一重要进步，为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力。GPT-5预计将在今年夏季推出，有望在性能、功能和应用场景等方面实现更大的突破和创新。

OpenAI GPT-4 Turbo
荐今天起，ChatGPT无需注册就能用了！

OpenAI狠狠地open了一把:像这样，直接登录网站，然后就可以开启对话:OpenAI对发布这个“超自由版ChatGPT”的解释是:不过面对OpenAI突如其来的open，很多网友还是觉得难以置信:但OpenAI这一次，是真没开玩笑。超自由版ChatGPT对于这个“超自由版ChatGPT”，需要强调是开放的只有3.5版本，GPT-4的使用还是老方法。奥特曼交出基金控制权，可能就是加速主义的妥协，毕竟内讧事件中，加速

ChatGPT
Nothing 宣布其耳机将支持 ChatGPT

Nothing近日宣布，计划将ChatGPT与其智能手机和耳机更深度整合。此举将为公司的客户提供更快速的服务。该博客文章表示:“Nothing还将通过在NothingOS中嵌入系统级入口点到ChatGPT，包括截屏共享和Nothing风格的小部件，改善Nothing智能手机用户体验。

ChatGPT Nothing AI头条
荐ChatGPT火了以后，一个值钱的运营，需要具备的6个能力。

各位村民好，我是村长ChatGPT火了以后，大部分运营都要失业了，这是目前许多人悲观的态度。目前市面上出现了越来越多好用的工具，不仅覆盖场景广且功能还多。且越是中小公司，对于运营的综合能力要求更高。

ChatGPT 产品运营
ChatGPT首次亮相电视剧创作名单

印度泰卢固语喜剧《SavetheTigers》第二季大结局的片尾演职员表中，音乐团队部分明确标注列出了ChatGPT。这一现象引发了业界的广泛关注，因为这标志着人工智能技术在影视剧音乐制作领域的首次应用。随着人工智能技术的不断进步，其在影视行业的应用将越来越广泛，为创作者带来更多便利和灵感。

ChatGPT AI头条

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

图表设计 AI生成跨平台

Notta Showcase:通过AI技术，轻松实现视频的多语言翻译和配音，连接全球观众。

Notta Showcase是一款在线视频翻译和配音工具，它通过AI技术帮助用户将视频内容翻译成15种不同的语言，同时保持原始的语音风格和情感，以提供自然的听觉体验。该产品的主要优点包括高效率、成本效益、用户友好的界面、高准确度的转录和翻译，以及支持多种文件格式和平台。它适用于营销、社交媒体和教育等多个领域，可以显著扩大内容的全球影响力。

AI翻译视频配音内容本地化

SunoAI API:开源项目，实现AI音乐服务的API接口

Suno API是一个开源项目，允许用户设置自己的Suno AI音乐服务API。它实现了app.suno.ai的创建API，兼容OpenAI的API格式，支持自定义模式，一键部署到Vercel，并且拥有开放源代码许可证，允许自由集成和修改。

AI音乐 API 开源

x-crawl:灵活的 Node.js AI 辅助爬虫库，让爬虫工作更高效、智能、便捷。

x-crawl 是一款基于 Node.js 的 AI 辅助爬虫库，它通过强大的 AI 辅助功能，使得爬虫工作变得更加高效、智能和便捷。它支持对动态页面、静态页面、接口数据以及文件数据的爬取，同时提供了自动化操作、键盘输入、事件操作等控制页面的能力。此外，它还具备设备指纹、异步同步、间隔爬取、失败重试、轮换代理、优先队列和记录爬取等功能，以适应不同的爬取需求。x-crawl 拥有类型，通过泛型实现完整的类型，基于 MIT 许可发布，适合需要进行数据爬取的开发者和企业。

爬虫 AI辅助自动化

MetaCLIP:一种用于图像和文本数据的先进机器学习模型，专注于数据质量和透明度。

MetaCLIP是一个开源的机器学习模型，用于图像和文本的联合表示学习。它通过一个简单算法对CLIP数据进行筛选，不依赖于先前模型的过滤，从而提高了数据的质量和透明度。MetaCLIP的主要贡献包括无过滤的数据筛选、透明的训练数据分布、可扩展的算法和标准化的CLIP训练设置。该模型强调数据质量的重要性，并提供预训练模型，以支持研究人员和开发者进行控制实验和公平比较。

机器学习图像识别文本处理

AITown:一个虚拟城镇，AI角色在这里生活、聊天和社交。

AI Town是一个基于MIT许可的可部署启动套件，用于构建和定制您自己的AI城镇版本。这个项目受到了研究论文'Generative Agents: Interactive Simulacra of Human Behavior'的启发，旨在提供一个强大的基础平台，旨在被扩展。后端原生支持共享全局状态、事务和模拟引擎，适用于从简单的项目到可扩展的多人游戏。

AI 虚拟城镇聊天模拟

Vanna:通过自然语言生成SQL查询，简化数据库交互。

Vanna是一个使用Retrieval-Augmented Generation (RAG) 技术的开源Python框架，用于SQL生成和相关功能。它通过训练RAG模型，将自然语言问题转换为SQL查询，从而允许用户以提问的形式与数据库进行交互。Vanna的主要优点包括高准确度、安全性、私有性、自学习能力，并且支持任何SQL数据库。

SQL 自然语言处理数据库

Fal AI:AI图片生成式开发者平台

fal.ai 是一款面向开发者的生成媒体平台，提供了业界最快的推理引擎，可以让您以更低的成本运行扩散模型，创造出全新的用户体验。它拥有实时、无缝的 WebSocket 推理基础设施，为开发者带来了卓越的使用体验。fal.ai 的定价方案根据实际使用情况灵活调整，确保您只为消耗的计算资源付费，实现了最佳的可扩展性和经济性。

生成媒体推理引擎开发者工具

Chat With Llama 3:一个开源的聊天机器人，能够解释概念、写诗、编程、解逻辑谜题。

Chat With Llama 3 是一个开源的聊天机器人，由Meta AI开发。它能够进行多种智能对话，包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题，甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性，使其可以被广泛地应用于各种场景，并且可以根据需要进行定制和改进。

人工智能聊天机器人开源

AI图片生成与搜索:释放创意，一键生成或搜索超过200万张AI图片。

AI图片生成与搜索是一个在线平台，利用先进的人工智能技术，允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率，同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示，这是一个面向广大创意工作者和设计师的工具，旨在帮助他们快速实现创意构想。目前，该产品提供免费试用，但具体价格和定位信息未在页面中提供。

AI技术图像生成创意工具

OpenPerplex:，您的知识门户

OpenPerplex是一个提供广泛知识资源的在线平台，它通过整合多种信息源，为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习，也适合专业人士进行深入研究。

知识获取信息检索在线学习

JavaVision:基于Java的全能视觉智能识别项目

JavaVision是一个基于Java开发的全能视觉智能识别项目，它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能，还可以轻松扩展到其他领域，如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案，让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。

人工智能计算机视觉人脸识别

RMBG:利用AI技术，快速高效地从您的图片中移除背景。

AI-Powered Background Removal（AI驱动的背景移除）是一款基于AI技术的在线工具，它能够快速且高效地从用户上传的图片中移除背景。该工具的主要优点在于其隐私保护和本地执行能力，即图片处理在用户设备上完成，无需上传至互联网，保证了数据的安全性和处理速度。此外，作为一款开源且完全免费的工具，它极大地释放了用户的创造力，无需担心成本问题。

AI技术背景移除图片编辑

SearchForJohn:一个专注于搜索功能的在线工具

SearchForJohn是一个在线搜索工具，旨在帮助用户快速找到所需的信息。它以简洁的界面和高效的搜索算法为特点，为用户提供了一个便捷的信息检索平台。该产品的主要优点包括快速响应、准确的搜索结果和用户友好的界面设计。SearchForJohn的背景信息显示，它是由一群对搜索技术充满热情的开发者创建的，旨在解决用户在信息过载时代中寻找特定信息的难题。目前，该产品提供免费试用，但具体价格和定位信息未在页面上明确展示。

OpenAI公布ChatGPT安全框架 以保障AI安全

今日大家都在搜的词：

热文

站长商机

OpenAI公布ChatGPT安全框架以保障AI安全