首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

2025-01-02 11:07 · 稿源: 量子位公众号

微软又把OpenAI的机密泄露了??在论文中明晃晃写着:o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……‍英伟达2024年初发布B200时,就摊牌了GPT-4是1.8T MoE也就是1800B,这里微软的数字更精确,为1.76T。除此之外,论文中给OpenAI的mini系列,Claude3.5Sonnet也都附上了

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 阿里巴巴宣布与英伟达开展合作:股价大涨9% 创4年新高

    9月24日,阿里巴巴股价大涨近9%,市值突破3.3万亿港元,创2020年以来新高。市场普遍认为,此次股价异动与公司在人工智能领域的战略布局密切相关。在当日举行的2025阿里云栖大会上,阿里巴巴宣布与英伟达达成全面Physical AI合作,覆盖数据处理、模型训练优化等核心技术环节。集团CEO吴泳铭首次提出“阿里云要做AI时代的安卓”的战略定位,强调将推进通义千问大模型开源生

  • 临时办公、敏感岗位、宿舍游戏,向日葵隐私屏保护远控隐私不泄露

    随着远程办公普及,隐私安全成为核心关切。向日葵16推出双模式隐私屏功能,兼顾保密与协作:纯黑模式彻底屏蔽屏幕内容,适合处理财务、研发等敏感数据;显示提示模式则标注“远程控制中”,既避免误操作又能传递工作状态。无论是居家办公还是处理机密业务,用户均可灵活切换,实现高效与安全兼得。该设计让远程办公真正实现“隐私保护不中断,透明协作两不误”。

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • 微算法科技(NASDAQ: MLGO)融合二次矩阵变换模型,研发基于区块链的可溯源IP版权保护算法

    微算科技(NASDAQ: MLGO)研发基于区块链的可溯源IP版权保护算法,解决现有技术效率低、可追溯性差等痛点。该方案融合二次矩阵变换、分布式随机嵌入与位置映射函数,实现版权从产生到交易流转的全链路精准追踪与安全保护。凭借区块链的不可篡改特性,算法有效抵御重放攻击,确保版权信息稳定可靠,有望拓展至专利、商标等知识产权领域,推动全球版权保护生态健全高效。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 微软全球资深副总裁张祺:未来公司要么大,要么小,中型公司将急剧收缩

    微软在AI浪潮中通过前瞻性投资与快速转型实现强劲增长。2019年投资OpenAI后,其市值突破4万亿美元,成为第二家达成此成就的科技巨头。微软全球资深副总裁张祺强调,大公司需具备“成长型思维”,以“学习一切”的态度拥抱变革,并推动“单人创业者”模式,即个人借助AI工具可完成传统团队的工作。微软将AI深度集成至Windows、Office、Azure等全线产品,年发布产品数量超过去十年总和。面对Agent技术等新趋势,张祺指出,未来组织形态将融合人类与数字员工,传统行业边界模糊,竞争核心转向算力与生态协同。微软以“与AI为友”的战略,持续引领技术革新与商业重塑。

  • Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛,聚焦下一轮市场周期话语权

    在2025年TOKEN2049新加坡峰会期间,Matrixport举办闭门论坛探讨数字资产财库战略。与会专家一致认为,DAT正从风控工具升级为机构战略核心,预计将形成寡头主导格局。Matrixport通过一站式解决方案推动行业标准化,其管理的DATCO持仓规模突破千亿美元。论坛凸显DAT作为华尔街资本入局加密市场的重要通道,未来将在全球金融体系中扮演关键角色。

今日大家都在搜的词: