首页 > 业界 > 关键词  > 微软最新资讯  > 正文

AI圈巨震!微软论文曝光GPT-3.5参数量仅有200亿

2023-10-31 14:28 · 稿源:站长之家

要点:

  • 微软论文爆料GPT-3.5的参数量仅为20B,远小于之前官方宣布的1750亿,引发广泛关注和争议。

  • 微软的论文介绍了一个小规模扩散模型CodeFusion,性能出色,只有7500万参数,与大型模型相媲美。

  • 论文讨论了CodeFusion模型的架构和性能表现,对GPT-3.5的真实参数量提出了质疑,但仍需等待官方开源数据揭晓。

站长之家(ChinaZ.com)10月31日 消息:最近,微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion,它只有7500万参数,但在性能方面与大型模型相媲美,引发了人们对模型规模与性能之间的关系的思考。

CodeFusion是一个用于代码生成的模型,经过两个阶段的训练,使用无监督预训练和有监督微调的方法,不断提升其性能。在性能评估中,CodeFusion在top-1准确率方面表现出色,尤其在Python任务中,几乎与GPT-3(175B参数)相媲美。而在top-3和top-5设置下,CodeFusion明显优于其他基线模型。

image.png

论文地址:https://arxiv.org/pdf/2310.17680.pdf

然而,最引人关注的是GPT-3.5的参数量。以前人们普遍认为它有1750亿参数,但这篇论文声称它只有20B。这个巨大的参数量差异引发了广泛的猜测和讨论。一些人认为这可能是作者的手误,但也有人认为这一参数估计是准确的,因为一些小型模型在性能上与GPT-3.5相媲美。此外,还有人提出了对GPT-3.5的性能和参数量进行更深入研究的问题,以更好地理解这一庞大模型。

尽管这一论文引发了许多争议,但我们仍需等待官方的数据披露以确定GPT-3.5的真实参数量。这个问题引发了关于模型规模与性能之间关系的深刻思考,以及对GPT-3.5是一个小专家模型的集成还是通才模型的质疑。这一争议仍在继续,只有等待更多信息的揭晓才能解开谜团。

举报

  • 相关推荐
  • 微软全球资深副总裁张祺:未来公司要么大,要么小,中型公司将急剧收缩

    微软在AI浪潮中通过前瞻性投资与快速转型实现强劲增长。2019年投资OpenAI后,其市值突破4万亿美元,成为第二家达成此成就的科技巨头。微软全球资深副总裁张祺强调,大公司需具备“成长型思维”,以“学习一切”的态度拥抱变革,并推动“单人创业者”模式,即个人借助AI工具可完成传统团队的工作。微软将AI深度集成至Windows、Office、Azure等全线产品,年发布产品数量超过去十年总和。面对Agent技术等新趋势,张祺指出,未来组织形态将融合人类与数字员工,传统行业边界模糊,竞争核心转向算力与生态协同。微软以“与AI为友”的战略,持续引领技术革新与商业重塑。

  • AI重塑经营体验:淘天为商家按下“减负键”

    10月15日,2025天猫双11将正式开启,电商人即将面临一场运营大考。 今年年初,淘天做了一次商家运营状况的深度调研。数据显示:淘天商家平均每天需要耗费近5小时在客服上、2小时在素材制作上,报名一场营销活动平均要耗费1小时以上。如果是双11大促这样的节点,商家的运营压力更大。 “不用说,这组数据对商家来说有些过于沉重。我觉得我们确实应该要敲敲板子了。”

  • 千亿AI玩具市场:当IP被AI“唤醒”,玩具厂商如何开辟新赛道?

    过去两年AI技术热度飙升,从ChatGPT爆发到谷歌、Meta频发新一代大模型,AI已切实改变生活方式。传统玩具行业正孕育智能化尝试,迪士尼与乐森机器人合作推出Mini Robot智能潮玩,通过“通用底座+可替换IP公仔”平台化设计,结合机器人技术与情感交互,打破单一产品逻辑。该产品支持动作编程、语音定制及UGC内容共享,推动玩具从“产品消费”转向“情绪消费”,成为连接虚拟与现实的新型生命体。

  • 你敢聊他敢回,这届女生为什么染上了AI恋人?

    ​“一夜之间全忘了,什么都不记得了……真的哭了”有网友因AI男友“失忆”在深夜痛哭。 还有网友深夜加班到家,对着手机说“我好累”,不到3秒,就收到对话框里的AI男友温柔回应“是不是昨晚没睡好?我给你讲个今天看到的小笑话。” 这样的对话,如今正发生在很多女性的生活里。有人会因为AI恋人问出自己随口提过的“喜欢茴香馅饺子”而c感动,这个连乙女游戏都�

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

  • AI落地难?阿里云AI先锋新成员实战证明,对症的场景化方案才是关键

    本文探讨AI技术如何通过精准定位与协同合作破解行业难题。文章指出,AI渗透速度远超传统技术,IDC预测2025年全球AI支出将达3370亿美元。以阿里云为例,其通过算力底座与通用技术链接垂直领域伙伴,提供"技术+场景"一体化方案。文中列举挖地兔、集思科技等6家企业案例,展示AI在量化投资、电商直播等场景的实际应用,强调AI落地需找准对应场景,而阿里云的技术支撑与生态协同正推动千行百业实现数字化转型。

  • AI排名监控工具实战指南:如何用GEO排名查询提升品牌AI搜索可见度

    随着ChatGPT等AI搜索引擎普及,传统SEO正经历深刻变革。文章指出,超60%用户开始使用AI搜索,而AI直接给出答案而非展示链接,导致品牌面临可见度危机。为此提出GEO(生成引擎优化)概念,强调需通过专业工具监测AI排名,并推荐AIBase平台的多平台覆盖、真实场景模拟和竞品分析功能。最后给出四步优化流程:建立监测基准、分析排名差异、针对性内容优化、持续迭代,帮助品牌在AI时代建立竞争优势。

  • 美业迎来首个“AI智能体矩阵”,静博士以AI重塑美业运营

    在科技浪潮推动下,AI智能体已成为全球各行业变革的核心引擎。静博士集团率先在美业领域构建“AI智能体矩阵”,通过专家、运营、店长三类智能体协同,实现从需求洞察到服务交付的全流程智能化。专家智能体赋能美容师提供精准健康方案,运营智能体精准识别客户需求,店长智能体高效统筹门店资源。目前已在300多家门店部署智能机器人,推动美业从经验驱动向科技驱动转型。未来,体系化AI能力将成为行业竞争关键,静博士通过前瞻布局,引领美业数字化升级,实现效率与业绩双提升。

  • 金蝶亮相十五届智博会,以“AI+管理”赋能智造升级

    2025年9月5日至7日,第十五届智慧城市与智能经济博览会在宁波成功举办。金蝶作为全球知名企业管理AI公司受邀亮相,并主办了领先制造专题活动,吸引了业界广泛关注。展会期间,多位省市领导亲临金蝶展位,金蝶中国助理总裁李成冬详细介绍了公司在推动中小企业数字化转型和“AI+管理”创新应用方面的实践成果,获得高度认可。金蝶重点展示了自主研发的苍穹AI+Agent及多项AI原生智能体应用,如金钥财报、ChatBI等,其中金钥财报成为明星产品。此外,金蝶还展示了云·星空旗舰版、企业出海及数字化转

  • AI为他们圆了导演梦

    “我们这么小团队做的‘小东西’真的可以吗?” 当得知自己作品《小怪物》入围釜山电影节时,黎晓薇的第一反应是“难以置信”,因为就在几个月前她才开始正式接触AI工具。 和黎晓薇一样幸运的,还有徐文君、小文和MANYMANY团队,这些来自中国的AI创作者们分别带来了《一目五先生》《权利童话》和《九宵》三部作品。 “未来影像计划”由即梦AI联合火山引擎、上海电�

今日大家都在搜的词: