首页 > AI头条  > 正文

重磅!OpenAI推超强o1模型API:音频费用狂降60% 增加函数调用、图像分析能力

2024-12-18 10:24 · 来源: AIbase基地

OpenAI 近日推出了其 API 的全新版本 o1模型,命名为 “o1-2024-12-17”,此版本带来了多个激动人心的新功能,包括智能函数调用、支持 JSON 格式的结构化输出以及图像分析能力。

image.png

根据 OpenAI 的报告,新模型在多个任务上的表现显著提升,特别是在数学和编程方面。新发布的 o1模型在数学任务上的准确率达到了96.4%,相比于前一版本 “o1-preview” 的85.5% 有了大幅提升。

同时,在编程任务中的准确率也从52.3% 提高到了76.6%。这一系列的提升意味着开发者和用户在使用该模型时,将能获得更为精准和高效的结果,尤其是在处理复杂问题时,准确性得到了更好的保障。

除了准确率的提高,新模型在处理推理任务时的token使用量也减少了约60%。这不仅提升了模型的运行速度,也降低了使用成本,使得开发者在应用这一模型时更加经济。

OpenAI 计划逐步向5级 API 用户开放新模型,确保用户能够体验到这一全新技术带来的便利。

音频 API 大幅降价

在音频功能方面,OpenAI 同样进行了重要的价格调整,音频输入token的费用降低了60%,目前每百万个输入token仅需40美元,输出token则为80美元。而对于缓存音频输入的费用,降幅更为显著,减少至每百万个token仅需2.50美元。

此外,OpenAI 还推出了一个名为 GPT-4o mini 的更经济实惠的选项,价格为每百万个输入token10美元和输出令牌20美元,为开发实时语音应用提供了更多便利。

新的风格和微调选项

OpenAI 还引入了一种名为 “偏好微调” 的新方法,这种方法与传统的监督微调不同,通过学习用户对不同响应的偏好,使得模型在处理创意写作和摘要等主观性任务时表现更佳。

此外,OpenAI 也扩展了其开发者工具,推出了针对 Go 和 Java 的新软件开发工具包(SDK),进一步提升开发者的使用体验。

这些新功能将逐步向开发者开放,OpenAI 会首先向5级用户提供详细文档,帮助他们更好地理解和运用这些新特性。

划重点:  

📊 新版 o1模型在数学和编程任务中的准确率分别提升至96.4% 和76.6%。  

💰 OpenAI 音频功能大幅降价,音频输入令牌降至每百万40美元,输出token为每百万80美元。  

🛠️ 新推出的 “偏好微调” 方法和 Go、Java SDK 助力开发者提升定制能力。  

  • 相关推荐
  • API攻击年增超162%,瑞数信息重磅发布《API安全趋势报告》

    瑞数信息发布的《API安全趋势报告》指出,2024年API攻击流量同比增长超162%,占所有网络攻击的78%。报告揭示三大特征:1)攻击规模化,自动化工具普及使单次扫描可覆盖数千API资产;2)AI技术加持,42%攻击采用动态变异特征绕过传统检测;3)供应链风险突出,61%攻击通过单个漏洞横向渗透。报告建议企业构建全生命周期安全框架,覆盖设计、开发到运营各环节,实施业务逻辑防护、细粒度访问控制及LLM专用防护。以某电信运营商为例,部署防护方案后三个月内显著提升安全能力。报告强调,API安全需从技术防御转向业务智能防护,成为企业数字化免疫力的核心。

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • AI日报:字节发布同声传译模型Seed LiveInterpret 2.0;秘塔搜索API上线;Lovart AI正式版全球发布

    AI日报栏目报道了多项AI领域最新进展:1)字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0,实现中英高质量实时翻译;2)秘塔搜索API上线,提供低价多模态搜索服务;3)Lovart AI正式版发布,作为首个AI设计Agent重塑创作流程;4)李沐团队推出Higgs Audio v2语音合成模型,融合千万小时训练数据;5)OpenAI开发Sora2视频生成模型,与谷歌Veo3展开竞争;6)OpenAI与Oracle合作扩展Stargate项目,�

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 推荐几个国内比较主流的API管理平台

    本文介绍了国内主流的API管理平台,包括Apifox、RestCloud iPaaS、YApi、API Umbrella、Postcat、白山云和数环通。这些平台各具特色:Apifox集文档、调试、Mock和测试于一体;RestCloud iPaaS支持AI助手和300+ SaaS应用连接;YApi适合跨语言开发团队;API Umbrella提供多团队协同和实时监控;Postcat轻量可扩展;白山云专注企业级全流程管理;数环通主打智能化自动化。企业应根据自身规模、行业需�

  • 领星ERP超值免费版重磅来袭,每月5000单免费用,初创跨境卖家的首选!

    文章介绍了跨境电商ERP系统对初创卖家的重要性,指出领星ERP凭借70万企业用户的市场占有率成为行业首选。其每月5000单免费版功能齐全,能全方位满足初创企业的运营需求,包括采购、物流、财务等模块。同时,系统操作简单,提供全国覆盖的完善服务体系,7×24小时专属客服支持。对于月单量5000以下的企业,免费版性价比极高,后续还可根据业务发展升级。领星ERP完美契合卖家对功能、成本、操作和服务的多重需求,成为跨境电商企业的理想选择。

  • 玄戒O1专属!小米15S Pro上线芯片性能面板:可手动调节频率、电压

    据小米社区用户反馈,目前小米15S Pro上线了芯片性能面板的内测,可以手动调节处理的频率、电压。 目前只有小米15S Pro手机支持,应该是玄戒O1的专属功能,这也是自研芯片带来的好处之一,可以完全自己控制。 其实这个功能早在4月份就被开发者从代码中发现,这个功能可以说是重回初心了,让发烧友们能够有更多玩法。

  • 智草与岐黄双模型赋能,APUS医疗MCP服务登陆魔搭社区

    APUS公司宣布其中西医大模型MCP服务正式上线魔搭社区。该服务基于开源通用智能体协议MCP,突破AI模型依赖训练数据的局限,能动态获取上下文信息或执行外部操作。APUS岐黄(西医)和智草(中医)大模型已累计为120万医患提供服务,其中岐黄大模型诊断准确率达92.3%,智草大模型在执业医师考试中展现80.3%的专业水准。此次合作将推动AI医疗技术在更多机构应用,为提升医疗服务质量、改善患者就医体验贡献力量,同时为开发者提供创新可能,预计将在医疗行业掀起新一轮创新应用浪潮。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • AI日报:扣子空间网页设计功能上线;阿里Wan 2.2即将上线;​OpenAI即将发布 GPT-5

    【AI日报】今日AI领域重要动态:1)Coze推出网页AI设计功能,5分钟生成网页;2)通义千问发布Qwen-MT翻译模型,支持92种语言;3)ChatGPT全面推出Agent功能;4)阿里云Wan2.2视频生成AI即将上线;5)Anthropic推出审计Agent提升AI对齐测试;6)OpenAI计划8月发布GPT-5;7)谷歌发布无代码AI应用开发工具Opal;8)南洋理工与上海AI Lab推出PhysX-3D项目,为3D模型添加物理属性;9)快手开源KAT-V1大模型,40B版本性能接近DeepSeek-R1;10)讯飞星火X1升级版上线,在多语言和语音处理方面显著提升。(140字)

今日大家都在搜的词: