GPT-5正秘密训练！DeepMind联创爆料，这模型比GPT-4大100倍

2023-09-04 08:51 · 稿源：新智元公众号

【新智元导读】GPT-5仍在秘密训练中!DeepMind联合创始人在近日采访中透露，未来3年，Inflection模型要比现在的GPT-4大1000倍。近来，DeepMind联合创始人Mustafa Suleyman，现Inflection AI的CEO，在采访时投出了重磅炸弹:OpenAI正在秘密训练GPT-5。我认为我们都直截了当地说会更好

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

GPT-5

GPT-4退役，但，OpenAI接下来准备了“很多好消息”！

OpenAI 的重大调整仍在继续。

OpenAI GPT-4 自然语言处理
重磅！OpenAI确定GPT-4退役日期：4月30日

快科技4月14日消息，据报道，OpenAI宣布，自2025年4月30日起，GPT-4将从ChatGPT中退役，由GPT-4o完全替代，不过GPT-4仍将在API中提供。OpenAI表示，在面对面的评估中，GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程，使其成为GPT-4的自然继承者。据悉，GPT-4于2023年3月发布，较上一代GPT-3.5有了显著提升。而GPT-4o是OpenAI为聊天

OpenAI GPT-4 GPT-4o
荐DeepSeek爆火100天，大厂又找回初心了

DeepSeek R1模型发布100天后，中国AI行业竞争格局被彻底重构。该模型3个月内用户突破1.9亿，成为国内最大AI原生应用。腾讯、百度等科技大厂纷纷接入，其中腾讯元宝APP借助DeepSeek流量一度登顶苹果应用下载榜。字节和阿里选择自研路线，字节推出"深度思考"功能，阿里则专注开源模型研发。随着DeepSeek热潮减退，豆包重回下载量榜首，元宝跌出前20。科技大厂在享受DeepSee

DeepSeek AI模型中国AI
为编程而生？OpenAI 发布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是为开发者量身定制的……

openai gpt-4.1 gpt-4.1mini
荐刚刚，OpenAI发布GPT-4.1，性能暴涨、100万上下文

今天凌晨1点，OpenAI进行了技术直播发布了最新模型——GPT-4.1。除了GPT-4.1之外，还有GPT4.1-Mini和GPT4.1-Nano两款模型，在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文，这对于金融分析、小说写作、教育等领域帮助巨大。由于GPT-4.1的发布，OpenAI宣布将会淘汰刚发布不久的GPT-4.5，其能力可见一斑。目前，如果想体验GPT-4.1而无法通过API身�

GPT-4.1 OpenAI 技术直播
IQ 过百的 AI 模型名单发布：ChatGPT、Deepseek等上榜

人工智能IQ哪家强？o3 智商高达 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 凭借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

AI智商 ChatGPT Deepseek
荐超越DeepSeek-R1，英伟达开源新王登顶，14万H100小时训练细节全曝光

英伟达发布开源Llama-Nemotron系列模型，性能超越DeepSeek-R1。该系列包含三个版本：8B、49B和253B参数模型，其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括：1）采用神经架构搜索优化模型结构；2）通过知识蒸馏和持续预训练提升性能；3）结合合成数据监督微调；4）在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平，单节点8xH100即可高效运行。模型创新性支持"推理开关"功能，通过指令动态切换推理模式。训练流程包含五阶段优化，最终模型在数学推理和通用任务上均表现优异，部分基准超越专有模型。

英伟达 Llama-Nemotron DeepSeek-R1
奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

【新智元导读】代码截图泄露，满血版o3、o4-mini锁定下周!更劲爆的是，一款据称是OpenAI的神秘模型一夜爆红，每日处理高达260亿token，是Claude用量4倍。奥特曼在TED放话:将推超强开源模型，直面DeepSeek挑战。持续的创新、丰富的资源和智能AI将会无缝融入日常生活，未来一代人将会觉得当前人们又辛苦又落后。

代码泄露 OpenAI 模型发布
DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍，DeepSeek-Prover-V2-671B 其参数量达到6710亿，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多种计算精度，方便模型更快、更省资源地训练和部署。在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达163840，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提

DeepSeek AI模型发布开源社区
荐OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

Meta、西北大学和新加坡国立大学的研究团队提出TokenShuffle技术，显著提升了自回归模型生成高分辨率图像的能力。该技术通过局部窗口内的token合并与解构操作，将视觉token数量减少为平方分之一，首次实现2048×2048分辨率图像生成。基于27亿参数的Llama模型，TokenShuffle在GenAI基准测试中获得0.77综合得分，超越同类自回归模型0.18分，在人类评估中展现出更好的文本对齐和视觉质量。该方法无需修改Transformer架构，通过三阶段训练策略（512→1024→2048分辨率）逐步提升生成能力，为多模态大语言模型的高效高保真图像生成开辟了新路径。

自回归模型高分辨率图像多模态大语言模型

热文

3 天
7天

GPT-5正秘密训练！DeepMind联创爆料，这模型比GPT-4大100倍

GPT-4退役，但，OpenAI接下来准备了“很多好消息”！

重磅！OpenAI确定GPT-4退役日期：4月30日

荐DeepSeek爆火100天，大厂又找回初心了

为编程而生？OpenAI 发布 GPT -4.1 系列模型

荐刚刚，OpenAI发布GPT-4.1，性能暴涨、100万上下文

IQ 过百的 AI 模型名单发布：ChatGPT、Deepseek等上榜

荐超越DeepSeek-R1，英伟达开源新王登顶，14万H100小时训练细节全曝光

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型

荐OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

热文

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

基于安卓16的三星 One UI 8 本月发布首个测试版本

苹果“为彼此创造”不再？听乔纳森·艾维忆往昔、谈传承

三星推出新型微显示技术，加剧 AR 眼镜竞争

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

2025 年，SpaceX 发射了多少枚火箭？

苹果高管称：10 年后，可能 iPhone 将不复存在！

谷歌在Pixel 9 Pro广告中，嘲讽iPhone 17：抄袭、老旧！

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

站长商机