首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本

2024-10-02 11:30 · 稿源: TechWeb.com.cn
<a href="//www.chinaz.com/tags/OpenAI.shtml" target="_blank"><span>OpenAI</span></a> <a href="//www.chinaz.com/tags/895155.shtml" target="_blank"><span>DevDay</span></a> 2024: Introducing New Tools to Enhance AI Capabilities

OpenAI Unveils Groundbreaking Tools to Revolutionize AI Development

At its annual DevDay event on October 1st, OpenAI showcased a suite of innovative tools designed to empower developers and advance the field of AI.

Realtime API: Seamless Multimodal Dialogue Interactions

The Realtime API, currently in public beta, enables developers to build low-latency, multimodal dialogue experiences. It supports text and audio inputs and outputs, as well as function calls.

Powered by the GPT-4o model, the API allows developers to send any text or audio prompt to the model and receive a response in their chosen format.

The Realtime API simplifies the creation of voice assistants and other conversational AI tools, eliminating the need for complex model stitching for transcription, inference, and text-to-speech conversion.

Vision Fine-Tuning: Enhanced Image Understanding for Advanced Applications

GPT-4o, OpenAI's latest LLM, now features Vision Fine-Tuning, which enables developers to tailor the model for enhanced image understanding.

Similar to text fine-tuning, developers can prepare image datasets and upload them to OpenAI's platform. With as few as 100 images, they can significantly improve GPT-4o's performance on visual tasks, with further improvements possible using larger datasets.

For example, Grab, a Southeast Asian food delivery and ride-hailing company, leveraged this technology to enhance their mapping services.

Prompt Caching: Optimized Cost and Latency

Prompt Caching is a game-changing update that significantly reduces costs and latency for developers.

Many AI applications involve repeated use of the same context across multiple API calls, such as editing codebases or engaging in extended multi-turn conversations with chatbots.

Prompt Caching automatically reuses recently processed input tokens, resulting in a 50% discount and faster prompt processing times.

Model Distillation: Bringing Advanced Model Capabilities to Compact Models

OpenAI introduced a new Model Distillation offering that provides developers with an integrated workflow to manage the distillation process directly within the OpenAI platform.

This enables them to leverage the outputs of cutting-edge models like o1-preview and GPT-4o to fine-tune and improve the performance of more cost-effective models like GPT-4o mini.

Small companies can now benefit from capabilities similar to state-of-the-art models without incurring the computational costs associated with using them.

举报

  • 相关推荐
  • 云原生API安全获认可,绿盟科技入选 Gartner®《Hype Cycle™ for APIs, 2025》

    近日,Gartner发布《Hype Cycle™ for APIs,2025》报告,绿盟科技凭借云原生API安全方案入选API威胁防护领域代表厂商。该方案针对云原生环境下的API全流量防护,适配容器化、微服务架构等特性,解决东西向流量防护难题,已在金融行业试点应用,帮助用户构建稳定可靠的云原生API安全防护体系,保障核心业务数据机密性、完整性与可用性。

  • 功能不“性感”,也能月入千万,工具App重新迎来窗口期?

    随着直播、短视频、AI 等新潮应用陆续爆发,工具类的热度似乎在逐渐降温。但社媒平台和榜单情况来看,却显示出另一番样貌。在 TikTok 上,以“iPhone storage”为标签的短视频达到了1.3万个,与之对应的是美国 iOS 工具畅销榜长期被一款清理工具占据榜单 Top1,类似的情况也出现在其它工具品类,海外用户为“找不到遥控器”买单、为识别花草长期订阅。它们看似“不性感”,

  • 微算法科技(NASDAQ:MLGO)突破性FPGA仿真算法技术助力Grover搜索,显著提升量子计算仿真效率

    量子计算迅猛发展,量子算法在搜索和加密领域潜力巨大。然而,量子计算机实现复杂,当前研究重点是在经典平台上高效仿真量子算法。微算科技提出基于FPGA的高效仿真技术,通过硬件仿真而非传统软件方法,显著提升Grover搜索算法仿真速度,实现百倍提速。该技术结合软硬件仿真,优化架构与数据路径,提高效率与资源利用率,为量子算法实际应用提供支持,推动量子计算发展。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

    OpenAI首席执行官Sam Altman近日接受采访时透露,虽然公司正推进数万亿美元级的计算基础设施投资计划,但他对上市后继续担任CEO持保留态度。 Altman坦言,尽管主导着OpenAI多项战略级项目,但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。 他特别强调,上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力,而自己可能并非最优人选。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 可赶上这波了!iOS用户“一键补课”了Mistplay的新功能

    在2023 ChinaJoy展会上,Mistplay凭借其独特的"玩赚"模式成为BTOB展区热门平台。该平台通过游戏时长激励玩家,同时为开发者提供高质量用户,已覆盖全球九大应用市场,累计安装超3500万次。Mistplay近期推出iOS版本,新增锦标赛、益智问答等功能,并创新推出LoyaltyPlay功能,为非游戏应用搭建激励桥梁。其核心AI引擎"Helios"能精准匹配用户与游戏,提升用户留存率和LTV。中国区负责人彭超楠在展会上分享了"忠诚度营销"理念,为游戏出海提供新思路。双平台布局使Mistplay优势更加突出,成为开发者提升用户留存的重要合作伙伴。

  • CCF HPC China 2025 | KunLun HPC解决方案赋能多行业创新升级 并获全国产异构创新HPC解决方案奖

    8月13-16日,第21届CCF全国高性能计算学术年会在鄂尔多斯召开。本届大会以"绿动计算 超智融合"为主题,汇聚顶尖学术阵容,展示全产业链成果与前沿趋势。河南昆仑技术有限公司重点展示双生态硬件平台、极致性能软件平台、应用迁移调优服务等HPC全栈解决方案。其KunLun HPC解决方案实现100%国产化,兼容x86设备,具备东西方双生态兼容、高性能、高能效等五大特点,并获全国产异构创新HPC解决方案奖。昆仑技术同期发布KunLun V2系列服务器产品,助力科研转化和行业智能化升级。多位专家在主题论坛分享国产超算软件生态建设经验,强调需持续投入构建自主可控的超算软件生态。昆仑技术表示将持续深耕高性能计算领域,推动行业向智能高效方向发展。

  • 微云全息(NASDAQ:HOLO)打造区块链创新型金融协同设计方案,引领行业变革

    金融行业协同工作面临效率与安全挑战。微云全息开发的金融智链协同方案融合区块链技术,通过智能合约、分布式账本和先进加密技术,实现数据安全、透明同步与自动化处理。该方案提升协同效率,保障数据完整性,支持跨机构无缝协作,有望推动金融行业建立更高效、安全的协同标准,促进金融科技发展。

今日大家都在搜的词: