首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本

2024-10-02 11:30 · 稿源: TechWeb.com.cn
<a href="//www.chinaz.com/tags/OpenAI.shtml" target="_blank"><span>OpenAI</span></a> <a href="//www.chinaz.com/tags/895155.shtml" target="_blank"><span>DevDay</span></a> 2024: Introducing New Tools to Enhance AI Capabilities

OpenAI Unveils Groundbreaking Tools to Revolutionize AI Development

At its annual DevDay event on October 1st, OpenAI showcased a suite of innovative tools designed to empower developers and advance the field of AI.

Realtime API: Seamless Multimodal Dialogue Interactions

The Realtime API, currently in public beta, enables developers to build low-latency, multimodal dialogue experiences. It supports text and audio inputs and outputs, as well as function calls.

Powered by the GPT-4o model, the API allows developers to send any text or audio prompt to the model and receive a response in their chosen format.

The Realtime API simplifies the creation of voice assistants and other conversational AI tools, eliminating the need for complex model stitching for transcription, inference, and text-to-speech conversion.

Vision Fine-Tuning: Enhanced Image Understanding for Advanced Applications

GPT-4o, OpenAI's latest LLM, now features Vision Fine-Tuning, which enables developers to tailor the model for enhanced image understanding.

Similar to text fine-tuning, developers can prepare image datasets and upload them to OpenAI's platform. With as few as 100 images, they can significantly improve GPT-4o's performance on visual tasks, with further improvements possible using larger datasets.

For example, Grab, a Southeast Asian food delivery and ride-hailing company, leveraged this technology to enhance their mapping services.

Prompt Caching: Optimized Cost and Latency

Prompt Caching is a game-changing update that significantly reduces costs and latency for developers.

Many AI applications involve repeated use of the same context across multiple API calls, such as editing codebases or engaging in extended multi-turn conversations with chatbots.

Prompt Caching automatically reuses recently processed input tokens, resulting in a 50% discount and faster prompt processing times.

Model Distillation: Bringing Advanced Model Capabilities to Compact Models

OpenAI introduced a new Model Distillation offering that provides developers with an integrated workflow to manage the distillation process directly within the OpenAI platform.

This enables them to leverage the outputs of cutting-edge models like o1-preview and GPT-4o to fine-tune and improve the performance of more cost-effective models like GPT-4o mini.

Small companies can now benefit from capabilities similar to state-of-the-art models without incurring the computational costs associated with using them.

举报

  • 相关推荐
  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • 连续三年折桂!瓴羊Dataphin荣膺2025年度DAMA数据治理优秀产品奖!

    2025全球数据管理峰会以“数据×人工智能”为主题,聚焦行业最佳实践,构建从理念探讨到技术落地的完整交流链。会上,瓴羊与DAMA联合发布数据治理实践证书体系,覆盖数据分析等认证,旨在提升全民数据素养。瓴羊副总裁王赛提出Data与AI双向赋能重构企业数字化生产力,强调未来系统需支持自主决策与自动化执行。以快消品牌为例,通过Quick BI智能分析工具实现业务效率提升。瓴羊Dataphin平台助力企业构建AI友好型数据模型,连续三年获“数据治理优秀产品”大奖,提供全链路数据服务,加速释放数据价值。

  • 更新功能、内测新App,抖音快手再战社交

    ​抖音和快手又一次向社交领域发起进攻。 近日,抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外,抖音还被曝正在内测全新的社交App。 当流量增长触及天花板,内容的稀缺性逐渐变弱,社交似乎成为了短视频巨头的“新叙事”。 它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择,还是一场注定艰难的豪赌?

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • AI日报:快手KAT-Dev代码模型开源登顶;全球首款IP66防护人形机器人DR02发布;谷歌Chrome即将引入Gemini新功能

    快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%,创国产AI编程里程碑;杭州云深处推出全球首款IP66防护全候作业机器人DR02;谷歌Chrome将集成Gemini引发隐私担忧;学者指控苹果使用盗版书籍训练AI,版权争议再起;Liquid AI发布高效稀疏激活模型LFM2-8B-A1B;苹果拟收购Prompt AI布局智能家居视觉技术;AI伴侣应用泄露4300万条用户隐私对话;西湖大学DeepScientist显著提升科研效率。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 火车免费坐?12306今起又上新功能:积分可兑换车票

    国铁集团10月20日宣布升级“铁路畅行”常旅客会员服务,重点针对14至28岁年轻会员推出更大幅度积分优惠:购票后可获票面金额10倍积分(普通会员为5倍),例如购1000元票可得1万分(价值100元)。同时拓展积分应用场景,新增列车座位升席功能,会员乘车时可通过扫描二维码或联系工作人员办理升席。积分还可用于兑换火车票(100分抵1元),但需注意兑换的车票仅可改签1次且不退票。此次升级旨在为年轻旅客提供更多出行便利与实惠。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 润开鸿重磅发布DAYU300与DAYU600,入选开源鸿蒙面向PC场景及移动智能终端场景主干开发平台

    近日,开源鸿蒙技术大会2025在长沙举办。江苏润开鸿公司发布基于开源鸿蒙的DAYU300和DAYU600开发平台,分别面向PC及移动智能终端场景,支持多样化设备创新。同时,开源鸿蒙6.0版本发布,在ArkUI组件、窗口能力等方面实现突破,提升开发效率与用户体验。润开鸿将持续推动开源鸿蒙生态建设,加速行业应用落地。

今日大家都在搜的词: