首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本

2024-10-02 11:30 · 稿源: TechWeb.com.cn
<a href="//www.chinaz.com/tags/OpenAI.shtml" target="_blank"><span>OpenAI</span></a> <a href="//www.chinaz.com/tags/895155.shtml" target="_blank"><span>DevDay</span></a> 2024: Introducing New Tools to Enhance AI Capabilities

OpenAI Unveils Groundbreaking Tools to Revolutionize AI Development

At its annual DevDay event on October 1st, OpenAI showcased a suite of innovative tools designed to empower developers and advance the field of AI.

Realtime API: Seamless Multimodal Dialogue Interactions

The Realtime API, currently in public beta, enables developers to build low-latency, multimodal dialogue experiences. It supports text and audio inputs and outputs, as well as function calls.

Powered by the GPT-4o model, the API allows developers to send any text or audio prompt to the model and receive a response in their chosen format.

The Realtime API simplifies the creation of voice assistants and other conversational AI tools, eliminating the need for complex model stitching for transcription, inference, and text-to-speech conversion.

Vision Fine-Tuning: Enhanced Image Understanding for Advanced Applications

GPT-4o, OpenAI's latest LLM, now features Vision Fine-Tuning, which enables developers to tailor the model for enhanced image understanding.

Similar to text fine-tuning, developers can prepare image datasets and upload them to OpenAI's platform. With as few as 100 images, they can significantly improve GPT-4o's performance on visual tasks, with further improvements possible using larger datasets.

For example, Grab, a Southeast Asian food delivery and ride-hailing company, leveraged this technology to enhance their mapping services.

Prompt Caching: Optimized Cost and Latency

Prompt Caching is a game-changing update that significantly reduces costs and latency for developers.

Many AI applications involve repeated use of the same context across multiple API calls, such as editing codebases or engaging in extended multi-turn conversations with chatbots.

Prompt Caching automatically reuses recently processed input tokens, resulting in a 50% discount and faster prompt processing times.

Model Distillation: Bringing Advanced Model Capabilities to Compact Models

OpenAI introduced a new Model Distillation offering that provides developers with an integrated workflow to manage the distillation process directly within the OpenAI platform.

This enables them to leverage the outputs of cutting-edge models like o1-preview and GPT-4o to fine-tune and improve the performance of more cost-effective models like GPT-4o mini.

Small companies can now benefit from capabilities similar to state-of-the-art models without incurring the computational costs associated with using them.

举报

  • 相关推荐
  • 音乐弹幕、AI美音、音色测试…..回森携音乐黑科技亮相华为开发者大会2025

    快手旗下Z时代音乐K歌社区APP回森受邀参加华为开发者大会2025,展示AI技术在音乐领域的创新应用。该平台通过多项首创技术降低音乐创作门槛,推出"音乐弹幕"等互动玩法,并与鸿蒙生态深度合作,实现音频自动对齐、AI美音等功能升级。其中,音乐弹幕功能让用户长按即可录制20秒合唱片段,结合多轨混音技术实现高质量"云合唱";AI美音功能则通过生成式技术

  • 全场景智能操作系统再进化,鸿蒙6点亮2025华为开发者大会

    华为鸿蒙系统迎来重大升级,HarmonyOS 6开发者Beta版正式启动报名。该系统在互联、智能、安全、流畅等核心体验全面优化,已覆盖超10亿设备,Top5000应用适配率达100%。鸿蒙生态建设取得突破性进展:开源代码超1.3亿行,800万开发者加入,30000+应用及元服务加速开发;创新推出"碰一碰"跨设备交互、AI主动防诈等特色功能。通过星盾安全架构保障用户隐私,累计拦截86亿次不合理权限请求。此次升级标志着国产操作系统在万物互联时代的技术突破,正推动全场景智能生态发展。

  • GCDG丨江阴站:AI赋能,开发者技术沙龙圆满举办!

    2025年6月8日,葡萄城开发者社区在江苏举办"AI赋能·开发者技术交流会"。活动汇聚多地开发者,共同探讨AI+低代码创新实践。开发者谷凯展示如何利用GPT-4等AI工具提升开发效率,强调独立开发者"一人也能创造价值"的理念。钟代冬分享家纺电商低代码工程案例,展示活字格平台实现复杂任务自动化运维的能力。技术顾问薛禹坤介绍"All-in-One一站式智能体开发"理念,演示活字格V11.0新版本AI功能。活动促进跨地域、跨领域思维碰撞,为开发者搭建紧密连接平台,推动前沿技术交流与实践经验分享。

  • 华为鸿蒙HarmonyOS 6 Beta版面向开发者正式启动

    今日下午,在华为开发者大会HDC2025主题演讲中,华为常务董事、终端BG董事长余承东正式官宣鸿蒙HarmonyOS6操作系统,并强调“全场景智能操作系统再进化”。 鸿蒙6带来了全新的全场景互联架构,其中星闪连接和小艺智能助手均实现了进化升级。小艺背靠20万亿Tokens,功能更为强大,支持真人感对话,让用户与智能助手的交流更加自然流畅;具备AI修图能力,可帮助用户轻松处�

  • 华为HarmonyOS 6开发者Beta启动!支持Mate 70等7款机型

    今日,华为开发者大会2025在松山湖举办,华为鸿蒙6(HarmonyOS 6)操作系统首次亮相。 华为常务董事、终端BG董事长余承东在会上宣布,鸿蒙6开发者Beta面向开发者正式启动。 目前,鸿蒙6开发者预览版Beta支持机型已公布,包括华为MatePad Pro 2024 11英寸、华为Mate 70、华为Mate 70 Pro、华为Mate 60、华为Mate X5、华为Mate 60 Pro、华为MatePad Pro 2025 13.2英寸7款机型。 据介绍,鸿蒙6将带来全新�

  • OpenAI奥特曼:GPT5预计今年夏季发布

    OpenAI创始人奥特曼在最新播客中透露,GPT-5预计今夏发布,具体日期未定。 GPT-5将是生成式AI能力的重大升级,《商业内幕》称其远超GPT-4,早期测试者认可进步显著。 GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。上月初,奥特曼发文向GPT-4告别。 目前GPT-4o已经完全替代了GPT-4,前者于2024年5月14日发布,其中o”代表omni”,意为 全能”。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 前OpenAI研究员:有时,ChatGPT为了“自救”,会选择牺牲用户

    他对OpenAI最新GPT-4o模型进行的一系列实验。这些实验旨在测试AI是否会偏向“自我保护”,甚至可能以牺牲用户利益为代价……

  • Meta V-JEPA 2模型来袭,OpenAI/微美全息AI创新跃升赋能千行百业变革

    Meta推出开源模型V-JEPA2,帮助AI理解3D环境和物理规律;OpenAI发布最强推理模型o3-pro,在数学测试中超越Google Gemini2.5Pro;苹果宣布将推出全新智能模型,扩展语言支持并开放开发者访问;微美全息凭借技术积累在大模型、多模态智能等领域取得突破。全球科技巨头加速布局AI前沿领域,推动AI与教育、金融等重点行业深度融合,赋能产业升级。