首页 > 业界 > 关键词  > 微软最新资讯  > 正文

AI圈巨震!微软论文曝光GPT-3.5参数量仅有200亿

2023-10-31 14:28 · 稿源:站长之家

要点:

  • 微软论文爆料GPT-3.5的参数量仅为20B,远小于之前官方宣布的1750亿,引发广泛关注和争议。

  • 微软的论文介绍了一个小规模扩散模型CodeFusion,性能出色,只有7500万参数,与大型模型相媲美。

  • 论文讨论了CodeFusion模型的架构和性能表现,对GPT-3.5的真实参数量提出了质疑,但仍需等待官方开源数据揭晓。

站长之家(ChinaZ.com)10月31日 消息:最近,微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion,它只有7500万参数,但在性能方面与大型模型相媲美,引发了人们对模型规模与性能之间的关系的思考。

CodeFusion是一个用于代码生成的模型,经过两个阶段的训练,使用无监督预训练和有监督微调的方法,不断提升其性能。在性能评估中,CodeFusion在top-1准确率方面表现出色,尤其在Python任务中,几乎与GPT-3(175B参数)相媲美。而在top-3和top-5设置下,CodeFusion明显优于其他基线模型。

image.png

论文地址:https://arxiv.org/pdf/2310.17680.pdf

然而,最引人关注的是GPT-3.5的参数量。以前人们普遍认为它有1750亿参数,但这篇论文声称它只有20B。这个巨大的参数量差异引发了广泛的猜测和讨论。一些人认为这可能是作者的手误,但也有人认为这一参数估计是准确的,因为一些小型模型在性能上与GPT-3.5相媲美。此外,还有人提出了对GPT-3.5的性能和参数量进行更深入研究的问题,以更好地理解这一庞大模型。

尽管这一论文引发了许多争议,但我们仍需等待官方的数据披露以确定GPT-3.5的真实参数量。这个问题引发了关于模型规模与性能之间关系的深刻思考,以及对GPT-3.5是一个小专家模型的集成还是通才模型的质疑。这一争议仍在继续,只有等待更多信息的揭晓才能解开谜团。

举报

  • 相关推荐
  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • Shure IntelliMix™ Room 会议套装正式入驻微软中国创新中心 Shure与微软开启声智体验之旅

    2025年11月11日,舒尔全新会议音频解决方案IntelliMix™ Room套件在微软北京创新中心完成安装并投入使用。该方案专为现代会议室设计,提供一站式高品质音频服务,集成卓越音质、简易设置及强大云管理能力。通过微软Teams认证,无缝接入MTR生态系统,支持端到端加密通信,确保会议安全。用户可远程管理系统,降低运维成本。舒尔与微软合作,共同提升企业协作效率,首批体验用户反馈语音清晰流畅,显著优化沟通质量。

  • AI吃播开始和真人吃播抢“饭碗”

    被咬开时发出清脆声响的玻璃水果、镶嵌着宝石的首饰盒、播放着音乐的水晶球,甚至还有毛绒玩具labubu和金条……各种你能想到或者想不到的,都正成为AI吃播的“食材”,被AI主播们塞入嘴里,轻松咀嚼。 这是一场风靡国内国外的热潮。在国外,Tiktok上一位叫leilanikovac的博主发了一条AI吃熔浆的视频,点赞数突破81.7万,另一位博主在三天内发了11条切水果的视频后,粉丝数

  • AI正在成为贝壳新的“承重墙”

    ​“金九银十” 曾是房地产行业传统的营销节点,伴随楼市深度调整,其热度已经逐渐回归平稳。 国家统计局数据显示,2025年1-9月,全国商品住宅销售额为55329亿元,同比下降7.6%。 在整体市场仍处于调整周期的大背景下,贝壳交出了一份稳中向好的答卷。三季度,贝壳总交易额(GTV)达7,367亿元,净收入同比增长2.1%至231亿元,净利润7.47亿元,经调整净利润12.86亿元。虽然

  • 遇到平板电池问题,试试联想想帮帮AI服务智能体的AI智修功能

    联想推出“想帮帮AI服务智能体”,通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题,AI即可自动检测电池耗电快、断触、游戏卡顿等异常,结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力,严重故障时可协助预约售后。该服务覆盖设备全生命周期,提供快速定位、即时处理的一站式解决方案,让用户告别手动排查烦恼。

  • 零知识科技CEO梁栋亮相金鸡百花“AI电影之夜” “AI从工具到工人”引发热议

    在2025年金鸡百花电影节“AI电影之夜”活动中,零知识科技CEO梁栋提出AI应被视为“工人”而非“工具”的核心理念。他指出影视行业面临“错失红利”与“恐惧失控”的双重困境,并介绍了公司通过区块链技术为AI智能体提供身份认证与记账服务,实现数字资产的确权、追溯及自动分账,从而保障持续收益与绝对安全,助力行业拥抱AI时代新红利。

  • 蚂蚁也正式加入AI超级入口战场,他的名字,叫灵光。

    蚂蚁集团推出全新AI助手“灵光”,以极致用户体验为核心突破传统AI工具。其亮点包括:结构化排版回答、交互式图表生成、3D模型渲染(如越王勾践剑动态演示),并支持闪应应用——用户可通过自然语言指令快速生成定制化小程序(如人生计时器、财报分析工具)。结合支付宝生态潜力,未来或实现真实账单管理与订阅优化。产品通过优雅设计唤醒用户探索欲,重新定义�

  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

  • “猝死风险AI筛查系统”亮相“2025人工智能+大会”,引领“AI+大健康”新浪潮

    在2025人工智能+大会“AI+大健康”论坛上,沃民高科发布“猝死风险AI筛查系统”。该系统通过30秒头部视频AI分析,实现无创快速筛查,为猝死预防提供新方案。中国是全球心源性猝死人数最多的国家,年轻化趋势明显。该系统部署简便,1分钟内完成评估,适合大规模普筛,已获行业认可,包括1.495亿元服务采购。沃民高科将持续深耕AI健康监测技术,助力全球健康事业发展。

  • 让AI为你打工有多爽?企业如何选对AI员工?尘锋AI员工,帮您真正复刻优秀员工!

    本文探讨2025年AI员工在各行业的广泛应用,强调其核心价值在于替代人工处理重复性、流程固定的工作,如客服、销售等,实现效率提升与成本优化。文章指出,企业选择AI员工需关注四个关键维度:技术专业度、系统开放性、安全合规性及服务可靠性,并以尘锋AI为例说明如何通过智能协作、数据整合推动业务增长。最终总结,雇佣AI员工是企业面向未来的战略布局,需选择匹配需求的可靠产品以构建竞争优势。

今日大家都在搜的词: