首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

为什么本周整个人工智能世界都在谈论 OpenAI 的「Q*」项目?

2023-12-03 14:03 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 3 日消息:在上周令人震惊的 OpenAI 权力斗争之后,有一个最后的启示充当了这一错综复杂事件的尾声:路透社揭露了这家初创公司一个被认为是惊人的突破。这一突破据称是通过一个鲜为人知的名为「Q-Star」或「Q*」的项目实现的

OpenAI ChatGPT,人工智能,AI

根据该报道,可能引发这家有影响力的 AI 公司内部冲突的一个因素是与 Q 相关的「发现」。在 Altman 被解雇之前,一些 OpenAI 的员工据称写信给公司董事会,关于一项「强大的人工智能发现,他们说这可能威胁到人类。」这封信是「导致 Altman 被解雇的一系列不满因素中的一个」,路透社引用匿名消息来源声称。

这个故事听起来非常疯狂。这个奇怪的新项目是什么,为什么它会(据称)导致 OpenAI 的所有混乱?路透社声称,Q*项目使 AI 代理能够做「小学级的数学」,如果属实,这将是一个惊人的技术突破,可能会加速创造人工通用智能(AGI),消息来源说。《The Information》的另一篇报道在很大程度上重申了路透社文章的观点。

然而,关于这个所谓的 Q 项目的细节尚未由公司公开,只留下匿名来源的报道和网络上关于该项目真正性质的猜测。

有人猜测,由于其名称,该项目可能与 Q 学习(一种机器学习形式)有关。那么,Q 学习到底是什么,它又如何应用于 OpenAI 的秘密项目呢?

一般来说,有几种不同的方法可以教授 AI 程序做某事。其中之一被称为「监督学习」,它通过向 AI 代理提供大量的「标记」数据,然后用这些数据来训练程序自行执行功能(通常该功能是更多的数据分类)。大体上,像 ChatGPT 这样的 OpenAI 内容生成机器人是使用某种形式的监督学习创建的。

与此同时,非监督学习是一种 ML 形式,其中 AI 算法被允许筛选大量未标记的数据,以寻找分类的模式。这种人工智能可以部署到许多不同的目的,例如创建 Netflix 和 Spotify 这样的公司使用的推荐系统,根据用户过去的消费选择向用户推荐新内容。

最后,还有强化学习,或 RL,这是一种激励 AI 程序在特定环境中实现目标的 ML 类别。Q 学习是强化学习的一个子类别。在 RL 中,研究人员将 AI 代理视为他们正在试图训练的狗。如果程序采取某些行动来影响某些结果,它们会得到「奖励」,如果采取其他行动,则会受到惩罚。通过这种方式,程序实际上是「训练」的,在给定情况下寻求最优化的结果。在 Q 学习中,代理显然是通过反复试验来找到实现其被编程追求的目标的最佳方式。

这一切与 OpenAI 所谓的「数学」突破有什么关系?可以推测,据称能够进行简单数学运算的程序可能是通过某种与 Q 相关的 RL 实现的。尽管如此,许多专家对 AI 程序能否真的解决数学问题持有一定的怀疑态度。其他人似乎认为,即使 AI 能够实现这些目标,它也不一定会转化为更广泛的 AGI 突破。麻省理工技术评论报道:

研究人员多年来一直试图让 AI 模型解决数学问题。像 ChatGPT 和 GPT-4 这样的语言模型可以做一些数学,但不是很好或可靠。爱丁堡大学的 AI 讲师 Wenda Li 表示,我们目前还没有算法甚至没有合适的架构能够使用 AI 可靠地解决数学问题。深度学习和变换器(一种 transformers)这是语言模型所使用的,非常擅长识别模式,但仅此并不足够,Li 补充说。

简而言之,我们对 Q 了解甚少,尽管专家们相信,围绕它的热潮可能只是炒作

Sam Altman 到底发生了什么?

尽管他已经回到 OpenAI,但我们仍然不知道上周 Sam Altman 到底发生了什么。在上周三接受 The Verge 采访时,Altman 对于其公司发生的戏剧性权力斗争的起因几乎没有透露任何信息。尽管不断受到该媒体记者的追问,Altman 只是摆摆手,说他在可预见的将来都不会谈论这个问题。「我完全明白为什么人们现在想要一个答案。但我也认为现在期望得到它是完全不合理的,」这位恢复首席执行官职位的人说。他最多只能告诉 The Verge,OpenAI 正在进行一项「独立审查」以了解发生了什么——这是一个他说他不想「干扰」的过程。

我们对上周的混乱进行了报道,按照董事会的理论和 Altman 推动将 OpenAI 的技术商业化之间的冲突进行了解读。然而,这个说法只是一个说法。我们不知道导致 Sam 被解雇的细节,尽管我们很想知道。

举报

  • 相关推荐
  • 大家在看
  • Google Gemma Chat Free:Google Gemma, 轻量级开放模型

    Google Gemma是由Google开发的前沿轻量级开放模型。这些模型分为2B和7B参数版本,包括基础和调优版本。Gemini模型的基础技术和指令调优技术都来自Google的技术,Gemma遵循AI原则,确保安全可靠的使用,并针对Google Cloud和NVIDIA GPU进行了优化,在全球范围内提供支持。

  • ClarityWrite:AI驱动的内容创作解决方案

    ClarityWrite是一款使用OpenAI API驱动的开源SaaS脚本,可以解锁AI驱动的内容创作能力。它包含AI写作、AI图像、AI代码和转录等功能,提供500个内置模板,还配备强大的编辑器和管理工具。ClarityWrite通过简化内容创作流程,使内容制作更加高效和轻松。

  • Snap Video:Snap视频用于文本到视频合成的可扩展空间时间转换器

    Snap视频是一个视频优先的模型,通过延伸EDM框架系统地解决视频生成域中的运动保真度、视觉质量和可扩展性等挑战。该模型利用帧间的冗余信息,提出了一个可伸缩的transformer架构,将空间和时间维度作为一个高度压缩的1D潜在向量,从而有效地进行空间时间联合建模,合成时间连贯性强、运动复杂的视频。这种架构使模型可以高效训练,达到数十亿参数规模,在多项基准测试中取得最优效果。

  • Differential Diffusion:让每个像素根据指定地图的强度变化

    Differential Diffusion是一个图像生成和编辑的平台,可以根据文本提示以及指定每个区域变化量的地图来修改图片。它能够为每个像素或图像区域提供定制化的变化量控制。这种细粒度的变化量控制为各种新的编辑能力打开了大门,例如控制个别对象被修改的程度,或者引入渐变的空间变化等。此外,该平台展示了该框架在图像补全领域的有效性,即在无缝融合新的内容时微调周边区域。它还提供了探索不同变化量效果的新工具。该框架仅在推理时运行,不需要模型训练或微调。展示了它与当前最先进的开源模型的集成效果,并通过定量、定性比较和用户研究进行了验证。

  • OgtAI:AI聊天系统,与任何媒体类型进行对话

    Ogt.ai是一款先进的AI聊天系统,可以与任何媒体类型进行对话。它可以与YouTube视频、音频文件、文本文档和链接进行交互式对话,提供更加智能、直观的媒体体验。Ogt.ai能够分析内容、提问问题并实时获取洞见,使媒体交互更加有趣和信息丰富。它还可以与PDF、文本、JSON、CSV、DOCX和PPTX等基于文本的文档进行对话,提取关键信息或像与专家交谈一样讨论内容。Ogt.ai能够识别各种媒体的细微差别,并根据视频情绪、文档上下文或关键音频点调整回答,提升媒体交互体验。

  • SoraHub:OpenAI Sora创意视频和提示词聚合平台

    SoraHub是一个聚合展示OpenAI Sora平台生成的各种创意视频和提示词的网站。用户可以在网站上探索最新的Sora生成视频,一站式体验OpenAI前沿AI的强大创意能力。网站定期更新各类有趣、实用的Sora创意内容。用户还可以在网站订阅邮件列表,随时获取Sora的更新资讯。

  • Sora Prompts:Sora是OpenAI推出的一款基于NLP的视频生成工具

    Sora是一个利用自然语言处理技术生成视频的AI模型。它能够根据使用者的文字提示生成高质量、连贯性强的视频,长度可达1分钟。Sora最大的优势在于生成视频的质量高,可控性强,同时也具有创意性。定价方面,Sora目前还在内测阶段,暂未公布具体定价,定位是面向影视制作人、设计师等创意人群。

  • Finpilot:人工智能助手,帮助金融分析师提高工作效率

    Finpilot是一个人工智能助手,专为金融分析师设计,可以帮助他们快速搜集和分析金融数据、编写报告以及进行数据可视化,大大提高工作效率。它可以自动化搜集和分析公开的财务数据,节省大量手动工作时间,同时提供可验证的信息来源,保证研究质量。用户只需与Finpilot聊天即可获得直接的答复和可靠的洞见,从而简化金融分析工作流程。

  • HomeworkAI:智能作业助手,快速解答

    HomeworkAI是一款智能作业助手,提供详细的逐步解答,涵盖各个学科。通过HomeworkAI,您可以轻松应对繁重的作业和棘手的任务,实现无压力的学习,提高成绩。

  • OpenCodeInterpreter:集代码生成与执行于一体的开源系统

    OpenCodeInterpreter是一个开源的代码生成系统,将代码生成、执行和迭代优化结合在一起。它利用包含6.8万段交互的Code-Feedback数据集进行训练,可以根据执行输出和人类反馈对代码进行动态优化。在HumanEval、MBPP等基准测试上的评估显示了它在代码生成方面的突出表现。具有33B参数量的OpenCodeInterpreter在HumanEval和MBPP的平均准确率可达83.2%,与GPT-4代码解释器的84.2%不相上下,并可通过人工反馈提升至91.6%。OpenCodeInterpreter缩小了开源代码生成模型与GPT-4等专有系统之间的差距。

  • Walle:您的一站式AI助手和浏览器扩展

    Walle是您的一站式AI助手和浏览器扩展,集成于Chrome、Safari和Edge浏览器。它提供聊天机器人、AI阅读器、AI写手、聊天PDF、图片创作与图像阅读等功能。Walle支持写作辅助、知识查询、文本概括、翻译摘要、图像生成等多种场景,助您提升效率和创造力。

  • NameHassle:域名生成器

    NameHassle是世界上最受欢迎的免费人工智能域名生成器。使用NameHassle的域名生成器即可立即获得最佳的商业域名创意!

  • Convert image to mindmap:将图像转换为思维导图的在线工具

    Image2MindMap是一款先进的在线工具,可将图像转换为结构化的思维导图。它利用先进的图像识别技术分析并提取图像中的文本信息,然后自动生成初步的思维导图结构。用户可以轻松自定义导图节点,添加、编辑或删除节点,确保思维导图准确反映其想法。Image2MindMap的主要功能包括:上传图像、文本提取、自动映射、自定义节点、附加图像等。它适用于多种场景,可以帮助用户快速转换图像中的想法和概念为结构化的思维导图。

  • Best Man Pro:定制化的伴郎致辞助手

    Best Man Pro是一款定制化的伴郎致辞助手。它可以帮助你轻松准备一份感人的伴郎致辞,让你的致辞在婚礼上留下深刻的印象。你只需花费五分钟的时间,按照我们的指南创建致辞大纲,然后我们的人工智能助手将生成三份可供选择的致辞。无论你想表达什么,我们的助手都能帮你找到恰当的表达方式。购买价格为19.99美元,包括三份完整的致辞,并提供14天的100%退款保证。

  • Push Lap Wholesale:最佳和最准确的亚马逊批发扫描工具

    PushLap Wholesale是亚马逊批发扫描工具中最好和最准确的选择。通过快速扫描供应商提供的价格列表,你可以找到最优质的产品。省时、准确计算利润、精确预测需求、智能匹配产品标题、描述和品牌信息等功能,助你轻松达到每月的采购目标,让你的亚马逊FBA业务持续增长。

  • UseSora:最佳文案生成工具

    Sora是一款强大的文案生成工具,通过AI算法生成优质的文案内容,提供多语言支持,每日更新。具有简单易用、高效准确、多样化等优势。定价灵活,可根据需求选择不同套餐。定位于提供最佳的文案生成解决方案。

  • Grabtext:免费在线OCR和AI图像转文字

    GrabText是一款免费在线OCR工具,可以将手写笔记、数学公式和打印文字转换为可编辑的数字内容。支持从图片、纸张、收据、PPT和书籍中转录。可将手写的想法精确转换为Latex公式。

  • SoraPrompt:从文本生成视频

    SoraPrompt是一种AI模型,可以根据文本指令创建逼真且富有想象力的场景。它利用Sora技术生成视频查询摘要,用于高效的内容分析。SoraPrompt基于最新的openai技术,可以生成各种类型的视频,如水族馆、纽约市、后退慢跑者、篮球爆炸、大溪地等。用户可以根据自己的兴趣和想法与SoraPrompt互动。

  • U:计算机视觉自动化和RPA工具

    U-xer是一款基于计算机视觉的测试自动化和RPA工具,旨在自动化屏幕上看到的任何内容,包括Web和桌面应用程序。它具有易用和高级两种模式,可以满足非技术用户和高级用户的不同需求。U-xer能够识别屏幕,像人类一样解释屏幕内容,实现更自然、准确的自动化。它适用于各种应用场景,包括Web应用程序、桌面软件、移动设备等,并提供定制化解决方案。U-xer的定价和定位请查看官方网站。

  • TogetherForm:实时协作表单

    TogetherForm是一个实时协作表单工具,可以让团队成员共同填写和编辑表单。它将每个字段都转化为一个迷你的Google文档,使得团队可以在表单中进行协作。无需复制到Google Docs,你可以直接在TogetherForm中协作编辑你的YC申请。TogetherForm提供免费试用,无需注册或付费。

今日大家都在搜的词: