只激活3.8B参数，性能比肩同款7B模型！训练微调都能用，来自微软

2024-07-18 14:16 · 稿源：量子位公众号

只需激活60%的参数，就能实现与全激活稠密模型相当的性能。微软亚洲研究院的一项新研究，实现了模型的完全稀疏激活，让推理成本大幅下降。而且适用范围广泛，无论是从头训练、继续训练还是微调，都能提供有效支持。该方法名为Q-Sparse，在神经元级别上实现了模型稀疏化，相比于其他

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

微软

先后打通苹果、微软！小米澎湃OS 3互联服务Windows通用版开启内测

小米在昨天的发布会上介绍了不少澎湃OS 3与苹果的互联功能，包括小米手机和iPhone、iPad、Mac都能进行互联互通。值得注意的是，小米这次不光打通了苹果生态，还覆盖了范围更大的Windows系统。小米刚刚宣布，小米互联服务Windows通用版（Beta）今日开启内测，升级了澎湃OS 3 Beta版的机型可以尝鲜体验。

小米澎湃OS Windows互联文件传输
微软

微软(英文名称：microsoft，中文简称：微软公司或美国微软公司)始建于 1975 年，是一家美国跨国科技公司，也是世界PC(Personal Computer，个人计算机)软件开发的先导，由比尔·盖茨与保罗·艾伦创办于 1975 年，公司总部设立在华盛顿州的雷德蒙德(Redmond，邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

比尔盖茨纳德拉微软CEO
微软任命葛兰素史克 CEO 为微软董事

据 CNBC 报道，微软周四表示，该公司正在向其董事会提名制药企业葛兰素史克（GlaxoSmithKline）的首席执行官 Emma Walmsley 出任其董事会的第五位女性董事。

微软
微软删人脸识别库微软为什么删除识别库？

6月11日消息，根据英国《金融时报》报道，微软日前悄然删除MS Celeb人脸识别数据库，删除大约1000 万张人脸信息，微软表示这个网站的目的是为了学术需求。后来交由不再与微软合作的员工运营，现在(网站)已被移除。

微软删人脸识别库
微软最后一个华人高管离职沈向洋给微软AI留下什么？

就在微软公司的人工智能(AI)业务刚刚起步之际，这家软件巨头却失去了一位关键高管。这位高管帮助微软把AI研究转化成了实实在在的产品。

微软微软高管沈向洋
荐比尔盖茨痛惜微软没成为安卓，但微软到底错哪了？

日前，在风投公司Village Global举办的一个活动上，比尔盖茨坦言了自己犯下的最大的错误是，就是给了谷歌推出安卓这一“标准化的、非苹果阵营的手机操作平台”的机会。

比尔盖茨微软安卓
荐微软的筋斗“云”

但是相比于各种股价的分析，我更关注市值背后的故事。这短暂的追逐，不仅宣告着那个“错失了十年”的微软王者归来，更宣告着微软“云转型”的阶段性胜利。那么，云计算是如何拯救微软的，它又会如何改变世界呢?

微软微软市值苹果
微软沈向洋离职曾是微软级别最高的中国人

11月14日，在今天凌晨微软公司宣布，该公司执行副总裁沈向洋将于 2020 年初正式离职。随后，微软官方发言人披露具体的时间为 2 月 1 日。沈向洋是目前微软公司中最高级别的中国人，也是所有美国巨头公司中职位最高的中国人。

微软沈向洋离职沈向洋微软
《微软梦幻赌城》秘籍

《微软梦幻赌城》秘籍内容在三个豪华旅馆中进行十个最受欢迎的赌局，包含最普遍与最容易的Big 6 Wheel到策略性的加勒比海宝藏扑克（Caribbean Stud Poker），尽量累积你的财富吧！游戏所提供的赛局皆为大家耳熟能详的赌局

《微软梦幻赌城》秘籍攻略秘籍
微软小娜的“人性”

还有好几个月才到今年的万圣节，但微软高管们已经开始构想如何应对传统的“不给糖就捣蛋”挑衅。西雅图办公室的一个团队正在交流各种建议。“给我一个可怕的故事!”有人试探着说道，但没人应答。“来，我给你准备了一些看不见的糖果!”一个人建议。“我手头最好的东西是万圣节笑话，”另一个人试着提出。我们置身于微软个人数字助理“小娜”的后台，这里有“小娜”的编辑团队，他们的工作是给一个机器人注入生命和个性。他们正在?

微软人性的

今日大家都在搜的词：

热文

3 天
7天

只激活3.8B参数，性能比肩同款7B模型！训练微调都能用，来自微软

先后打通苹果、微软！小米澎湃OS 3互联服务Windows通用版开启内测

微软

微软任命葛兰素史克 CEO 为微软董事

微软删人脸识别库微软为什么删除识别库？

微软最后一个华人高管离职沈向洋给微软AI留下什么？

荐比尔盖茨痛惜微软没成为安卓，但微软到底错哪了？

荐微软的筋斗“云”

微软沈向洋离职曾是微软级别最高的中国人

《微软梦幻赌城》秘籍

微软小娜的“人性”

今日大家都在搜的词：

热文

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

全新问界M7小订破22万：将于明晚上市公布价格

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

小米平板8系列搭载11.2英寸3.2K旗舰屏

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

iPhone17遭首批用户吐槽客服回应：建议新机带壳

鸿蒙智行尚界H5小订破15万台：明晚上市

realme真我GT8系列官宣10月发布

AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

全新问界M7小订破22万：将于明晚上市公布价格

苹果 iPhone 17/Pro 系列今日发售多维度升级

京东：iPhone 17开卖4小时全国超3万人签收

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

站长商机