首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

OpenAI 宣布自 GPT-4 发布以来的更新:ChatGPT 现在可以「看、听、说」

2023-09-26 09:03 · 稿源:站长之家

站长之家(ChinaZ.com) 9月26日消息:OpenAI 宣布,其聊天机器人 ChatGPT 现在可以「看、听、说」,或者至少能够理解口语,用合成的声音回应并处理图像

OpenAI ChatGPT,人工智能,AI

这次更新是自引入 GPT-4 以来 OpenAI 最大的一次改进。用户可以选择使用五种不同的合成声音与 ChatGPT 进行语音对话,并向其分享图片并突出显示重点或分析区域(例如:「这些是什么类型的云?」)。

这些变化将在未来两周内推出给付费用户。虽然语音功能将仅限于 iOS 和 Android 应用程序,但图像处理功能将适用于所有平台

OpenAI 在其网站上提供了一个宣传视频,展示了与 ChatGPT 的交流演示:用户询问如何升起自行车座椅,并提供了照片、使用手册和用户工具箱的图片。ChatGPT 会做出反应并建议用户如何完成这一过程。

那么它是如何工作的呢?OpenAI 并未公布 GPT-4 或其多模态功能如何在后台运行的技术细节,但根据其他公司(包括 OpenAI 合作伙伴微软)的已知人工智能研究,多模态人工智能模型通常会将文本和图像转换到一个共享的编码空间,从而使它们能够通过相同的神经网络处理各种类型的数据。OpenAI 可以使用 CLIP 在视觉数据和文本数据之间架起一座桥梁,将图像和文本表征整合到同一个潜在空间(一种矢量化的数据关系网)中。这种技术可以让 ChatGPT 跨文本和图像进行上下文推理,不过这只是一种推测。

此次大规模推广新功能正值聊天机器人领导者之间人工智能竞赛日益升级之际,如 OpenAI、微软、谷歌和 Anthropic 等公司都在努力鼓励消费者采纳生成式人工智能技术,并竞相发布新的聊天机器人应用程序和特性。谷歌已经宣布了 Bard 聊天机器人的一系列更新,微软则为必应添加了视觉搜索功能。

据 PitchBook 报道,今年早些时候,微软扩大了对 OpenAI 的投资——追加 100 亿美元——使其成为本年度最大的人工智能投资。据报道,今年 4 月,这家初创公司完成了 3 亿美元的股票出售,估值在 270 亿至 290 亿美元之间,投资方包括红杉资本(Sequoia Capital)和 Andreessen Horowitz 等公司。

专家们对人工智能生成的合成声音提出了关注,这种技术可以让用户获得更自然的体验,但也可能会产生更令人信服的深度伪造。网络威胁行为者和研究人员已经开始探索如何利用深度伪造来渗透网络安全系统。

OpenAI 在周一发布公告时承认了这些问题,并表示合成声音是「与我们直接合作过的配音演员创作」的,而不是从陌生人那里收集来的

该公司还未提供有关 OpenAI 将如何使用消费者语音输入或如何保护数据(如果使用的话)的信息。该公司服务条款规定,「在适用法律允许范围内」,消费者拥有其输入内容所有权。

OpenAI 引述了其有关语音交互指南中所述内容,其中指出 OpenAI 不会保留音频剪辑,并且这些剪辑本身并不用于改进模型。但该公司还指出,在此过程中转录被视为输入,并可能用于改进大型语言模型

举报

  • 相关推荐
  • 大家在看
  • WaveAI:AI驱动的高级照片编辑器

    Wave AI是一款AI驱动的高级照片编辑器,可轻松编辑照片和图像。它具有背景更改、物体移除和定制广告等高级功能。通过简单的点击,无需设计技能,轻松提升您的图像。

  • NovelAI.Dev:AI 绘画兴趣站

    NovelAI.Dev 是一个以技术宅为核心的 AI 绘画爱好者群体网站,提供多种与绘画相关的 AI 技术应用和工具。

  • AI SEO Service in Australia | Optidan:AI数字营销和SEO服务

    Optidan AI是澳大利亚顶级AI数字营销机构,提供AI SEO服务、Shopify SEO服务、去抄袭和内容创作服务。我们通过性能管理、Web诊断和战略优化提升SEO卓越,快速增长您的在线业务。

  • AskJack:让你的AI助手回答HR问题

    AskJack通过为频繁的HR咨询提供自动化响应,提高了工作效率,让你能够专注于战略性事务。它使用AI技术将助手带到你团队最常用的工作场所。通过AskJack,你可以减少重复的HR咨询,让你和团队能够专注于战略性事务。它还可以简化员工入职流程,提供即时访问所需的文件、指南和资源,并在入职后全年无休地提供相同的信息。AskJack还能帮助你了解员工的需求,提供数据驱动的见解。

  • OPS 提示词工作室:可视化编辑提示词工具

    OPS 提示词工作室是一款可视化编辑工具,支持一键翻译 AIGC 提示词,提供 Midjourney 提示词库,让用户轻松管理和使用提示词,助力提升生产力。该工具还提供简洁清晰的界面,方便用户快速复制、导出和翻译提示词。

  • imiprompt:Midjourney v5 艺术生成器

    IMI Prompt Builder 是一款全面的 Midjourney v5 提示生成器,拥有数千种选项可在 Web、Android 和 iOS 上使用。用户只需点击几下,即可创建反映其个人风格和艺术愿景的独特 Midjourney v5 艺术作品。

  • Ai 画廊:Ai 关键词生成器

    Ai 画廊是一款提供 Ai 关键词生成器的网站,展示人工智能作品和生成关键词描述,帮助用户更好地了解和分享 Ai 作品。用户可以浏览不同风格的 Ai 作品,获取灵感和创意。

  • KALOS.art:AI 艺术风格库

    KALOS.art 是世界上最大的 AI 艺术风格库,提供超过 1300 位艺术家和 292 种风格 / 媒介。用户可以浏览不同艺术家和风格,创建收藏并探索 AI 艺术创作。价格取决于会员级别。

  • ClickPrompt:优化 Prompt 设计,多种 AI 应用支持

    ClickPrompt 是一款专为 Prompt 编写者设计的工具,支持 Stable Diffusion、ChatGPT 和 GitHub Copilot 等多种 AI 应用。用户可轻松查看、分享、一键运行模型,并使用在线 Prompt 生成器创建符合需求的 Prompt。

  • 词魂:AI 提示词工具,提升工作效率

    词魂是一款提供 AI 提示词(promt)和咒语服务的工具,用户可以在这里快速找到各类高质量提示词和咒语,帮助 AI 绘画、midjourney、stable diffusion 等工具用户提升工作效率。定位于提供优质的提示词服务。

  • Replit AI:AI 驱动的软件创作平台

    Replit 是一个 AI 驱动的软件创作平台,让每个人能快速构建、共享和发布软件。它可以将自然语言转换为代码,帮助用户自动化编码中的重复部分,并提供个性化的辅助,包括多文件代码上下文、协作式 AI 聊天等功能。Replit 还提供对特定代码库的上下文 AI 支持,帮助用户解释复杂代码、生成测试用例、撰写文档、设计应用程序等。用户可以快速将创意转化为软件,节省时间并提高效率。

  • 天工智码 SkyCode:AI 代码生成工具,助力编程。

    天工智码 SkyCode 是一款 AI 代码生成工具,支持各种主流编程语言,助力开发人员更快更好的编码。其功能包括二分查找、排序算法实现、代码优化等,优势在于提高编码效率,定位于提供智能编程辅助。目前提供免费试用服务,用户可以根据实际需求选择付费套餐。

  • CodyAI:sourcegraph旗下的是 AI 编码助手

    Cody 是一款强大而准确的 AI 编码助手,可帮助编写、修复和维护代码。它利用人工智能和对代码库的深入理解,帮助用户更快地编写和理解代码。

  • Clipping Magic:移除图像背景自动化工具

    Clipping Magic 是一款专业的图像处理工具,通过强大的算法和智能编辑功能,可以自动移除图像背景并提供多种调整选项,包括裁剪、旋转、色彩修正等。用户可以免费使用部分功能,提供付费升级服务。定位于提供快速、精确、高质量的背景移除解决方案。

  • Background Remover:AI 背景移除,制作透明背景

    AI 背景移除器通过人工智能检测图片主体、创建蒙版并消除背景。支持 PNG、JPG、WebP 格式,无需担心影响图片尺寸和质量。让您轻松制作透明背景图片。

  • My StoryBot:AI驱动的故事书

    MyStoryBot是一个AI驱动的故事书平台,可以根据用户输入的提示生成完整的故事,包括配音和精美插图。用户可以个性化定制自己的故事书,并分享给他人。平台提供个人化故事、教育故事和多语言故事等多种类型。价格分为免费试用和付费订阅两种,付费订阅用户可以享受无限故事、无限插图、重新生成插图、故事朗读和商业使用等特权。

  • Growth Suite Shopify App:创造紧迫感,提高销售额

    Growth Suite是一款能够帮助您收集更多电子邮件、增加销售额并保护品牌的智能助手。它集成在您的Shopify商店中,利用实时购买意向分析、智能折扣和购物车回收等功能,帮助您创造紧迫感、增加销售额。购买意向算法能够计算每个顾客购买的可能性,根据购买意向设置不同的折扣和时限,提供有限的一次性折扣和倒计时,增加购买动力。Growth Suite还提供无缝的体验,与您的Shopify商店完美融合,通过自动折扣应用、清晰的倒计时显示和透明的说明,提升品牌形象并提高转化率。

  • OpenChat AI:使用ChatGPT和AI的OpenChat,开启一万种赚钱方式

    OpenChat是一个使用ChatGPT和AI工具的平台,为用户提供了使用自己的技能和兴趣赚钱的新方法。通过ChatGPT进行交互,用户可以提供内容生成、客户服务、市场调研分析、语言翻译、教育资源和教程创建、AI辅助的设计等服务。OpenChat提供多种功能和使用场景,并且定价灵活。

  • Thryve Chat:个性化营养、健身和正念指导,助您迈向更快乐、更健康的生活。

    Thryve是您的数字健康向导,提供个性化的营养、健身和正念策略,帮助您过上更快乐、更健康的生活。我们的聊天机器人可以为您提供有意义的互动,帮助您了解自己、探索新事物,并通过持续的互动帮助您建立抗压能力,成为最好的自己。

  • FineWeb:高质量英文网页数据集

    FineWeb数据集包含超过15万亿个经过清洗和去重的英文网页数据,来源于CommonCrawl。该数据集专为大型语言模型预训练设计,旨在推动开源模型的发展。数据集经过精心处理和筛选,以确保高质量,适用于各种自然语言处理任务。

今日大家都在搜的词: