智源研究院推出1bit自然语言理解预训练模型BiPFT

2024-01-11 09:35 · 稿源：站长之家

站长之家（ChinaZ.com）1月11日消息:智源研究院提出了首个用于自然语言理解任务的1bit 轻量化预训练模型 BiPFT。与传统的 FP32模型相比，BiPFT 模型在推理阶段显著减少了操作数量和内存使用。该模型在 GLUE 标准测试集上的平均性能超过了15.4%。

与以往的1bit 量化方法不同，BiPFT 直接在预训练阶段使用大量的文本数据对模型进行1bit 预训练，而不是在下游任务上进行量化。这种方法使得模型具备了更好的独立学习能力和超参数鲁棒性。

微信截图_20240111093607.png

另外，智源团队还创新地采用了一种数据驱动的1bit 量化方法，通过对自注意力操作中的1bit 量化误差进行参数化，减少了量化损失。

实验结果表明，BiPFT 模型在1bit activation 下的计算量和内存消耗相比于全精度32位模型分别降低了56倍和28倍。同时，该模型在不同超参数设定下都能取得更好的效果，具有较好的独立学习能力和超参数鲁棒性。

研究论文

https://arxiv.org/abs/2312.08937

（举报）

相关推荐

关键词：

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
荐50人团队、1亿美元ARR，AI PPT还在续写“神话”？

AI 生成 PPT 可以说是去年的热门赛道，尤记得关于这类产品是否具有真正竞争力的热烈讨论，而2025年9月份的数据显示，赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且，今天官宣了由 a16z 领投的6800万美元 B 轮融资，融资后估值达到21亿美元。而不仅 Gamma，根据 AI 产品榜数据，9月份，AIPPT 赛道的 Top3产品流量平均涨幅30%+，更有一款

AI生成PPT Gamma融资 AIPPT赛道
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》，筑牢智能体应用安全基座

腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》，提出智能体场景罗盘评估模型，覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎，同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障，通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效，助力企业构建“高可靠、强防护”的智能体体系。

智能体落地腾讯云安全企业智能化转型
2025乌镇峰会：易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势，能提升获客、风控与运营效率，优化用户体验。通过全链路智能决策能力，推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构，显著提高融资通过率与业务质量，填补领域技术空白，引领汽车金融智能化发展。

汽车金融 Agentic大模型 XinMM-AM1
华为年度机皇！Mate 80 RS非凡大师亮相：首发20GB内存、双潜望长焦镜头

今日，华为Mate 80系列宣布定档11月25日发布，目前已在华为商城上架，将于今天中午12:08开启预订。华为商城显示，作为华为最顶级的高端旗舰，华为Mate 80 RS非凡大师首发20GB内存，这是华为内存最大的旗舰手机，比安卓阵营普遍采用的16GB内存更大。

华为Mate 80 麒麟9030芯片
小米超级小爱AI大模型推出随心修图功能

小米宣布超级小爱AI大模型推出随心修图功能，用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式：在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求：超级小爱需v7.8.50及以上，相册编辑功能需v2.1及以上，相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级，支持全局多模态交互和自然语音搜索，提升使用体验。

小米超级小爱 AI大模型

今日大家都在搜的词：

热文

3 天
7天

智源研究院推出1bit自然语言理解预训练模型BiPFT

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

荐50人团队、1亿美元ARR，AI PPT还在续写“神话”？

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》，筑牢智能体应用安全基座

2025乌镇峰会：易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

华为年度机皇！Mate 80 RS非凡大师亮相：首发20GB内存、双潜望长焦镜头

小米超级小爱AI大模型推出随心修图功能

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

快手发布2025年第三季度财报：可灵AI营业收入超3亿元

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机