首页 > AI头条  > 正文

OpenAI重磅升级Agents SDK:支持TypeScript和语音打断,2026年将淘汰Assistants API

2025-06-04 08:56 · 来源: AIbase基地

OpenAI近日宣布对其Agents SDK进行全面升级,为开发者带来多项重要功能更新。此次升级不仅扩展了编程语言支持,还引入了突破性的语音交互技术。

Agents SDK现已正式支持TypeScript,功能与Python版本完全一致。开发者可以利用细粒度控制机制和人工审批选项,更精确地管理AI代理行为。该SDK专为简化多代理工作流程而设计,提供可配置的语言模型、代理切换功能、内置安全控制和完整的分析工具套件。

OpenAI,ChatGPT,人工智能,AI

语音代理技术突破

新推出的RealtimeAgent功能是此次升级的亮点。开发者现在可以创建既能在客户端又能在服务器端运行的语音代理,这些代理支持语音打断功能,并可在对话过程中实时调用各种工具。

配套的"Traces"仪表板也进行了重大更新,能够显示语音代理的实时运行数据,包括音频流状态、工具使用情况和打断次数统计,为开发者提供全面的性能监控.

OpenAI同时改进了支撑这些功能的底层语言模型。更新后的"GPT-4O-Realtime-Preview-2025-06-03"版本在指令执行准确性、工具调用可靠性和中断处理优雅度方面都有显著提升,该模型已通过实时和聊天API向开发者开放。

API战略调整

在产品路线图方面,OpenAI计划在2026年中期实现功能对等后,逐步淘汰现有的Assistants API,全面转向新的Responses API。Chat Completions API将继续为不需要工具集成的开发者提供服务,但OpenAI建议开发者尽早过渡到Responses API以获得更强大的扩展功能。

Agents SDK与OpenAI API以及其他遵循Chat Completions标准的第三方模型提供商完全兼容,为开发者提供了灵活的选择空间。

  • 相关推荐
  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 瞄准中国市场!折叠iPhone最快2026年登场

    苹果首款折叠iPhone锁定2026年下半年发布,定价或突破2000美元(约合人民币14345元),刷新iPhone价格天花板。 据悉,折叠iPhone将采用书本式对折设计,主屏由三星显示独家供应,苹果重点攻关铰链耐久与折痕可视度,目标折叠寿命20万次以上。 系统层面,iOS 27将新增多任务浮窗、动态分屏及外屏快捷卡片,充分发挥大屏优势。

  • API攻击年增超162%,瑞数信息重磅发布《API安全趋势报告》

    瑞数信息发布的《API安全趋势报告》指出,2024年API攻击流量同比增长超162%,占所有网络攻击的78%。报告揭示三大特征:1)攻击规模化,自动化工具普及使单次扫描可覆盖数千API资产;2)AI技术加持,42%攻击采用动态变异特征绕过传统检测;3)供应链风险突出,61%攻击通过单个漏洞横向渗透。报告建议企业构建全生命周期安全框架,覆盖设计、开发到运营各环节,实施业务逻辑防护、细粒度访问控制及LLM专用防护。以某电信运营商为例,部署防护方案后三个月内显著提升安全能力。报告强调,API安全需从技术防御转向业务智能防护,成为企业数字化免疫力的核心。

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • 腾讯云TencentOS提交Swap Table补丁系列 Linux内核内存交换性能提升20%~30%

    腾讯云操作系统团队提交了名为Swap Table的补丁系列,针对Linux内核交换子系统进行优化。该系列在4K页面和mTHP folios场景下,使系统性能提升20%-30%。Swap Table通过智能调度机制优化数据定位,支持大页尺寸减少操作次数,并实现动态空间扩展。27项独立改进解决了历史遗留问题,经实测性能显著提升。目前补丁系列正处于审核阶段,有望纳入Linux内核主线。这是腾讯云团队继内存控制组、页面热管理等创新后,在操作系统核心技术领域的又一突破,将强化TencentOS Server的高性能优势。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • AI日报:字节发布同声传译模型Seed LiveInterpret 2.0;秘塔搜索API上线;Lovart AI正式版全球发布

    AI日报栏目报道了多项AI领域最新进展:1)字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0,实现中英高质量实时翻译;2)秘塔搜索API上线,提供低价多模态搜索服务;3)Lovart AI正式版发布,作为首个AI设计Agent重塑创作流程;4)李沐团队推出Higgs Audio v2语音合成模型,融合千万小时训练数据;5)OpenAI开发Sora2视频生成模型,与谷歌Veo3展开竞争;6)OpenAI与Oracle合作扩展Stargate项目,�

  • 苹果首款折叠iPhone定价或超一万四千元 定档2026年下半年

    据彭博社资深记者Mark Gurman最新披露,苹果公司首款折叠屏iPhone计划于2026年下半年正式发布,起售价预计突破2000美元(约合人民币14345元),创下iPhone系列价格新高。该产品将采用书本式横向对折设计,屏幕由三星显示独家供应,苹果研发团队正集中攻克铰链耐久性与折痕控制技术,目标实现20万次以上折叠寿命。 系统适配方面,iOS27操作系统将针对大屏特性开发多任务浮窗�

  • 谷歌24亿收购Windsurf击败OpenAI,Meta/微美全息竞相扩充AI战略布局

    谷歌以24亿美元收购AI编程初创公司Windsurf,原计划由OpenAI斥资30亿美元收购的交易突然取消。Windsurf年收入已达1亿美元,其核心团队将加入谷歌DeepMind。同时,Meta收购AI语音公司PlayAI,加强自然语音生成能力。微美全息等企业也在积极布局"AI+"赛道,推动多场景应用。全球科技巨头正通过收购和人才争夺加速AI领域布局,AI技术已成为推动行业变革的核心引擎,未来竞争将围绕技术创新和商业化应用展开。

今日大家都在搜的词: