智源团队Aquila2-34B双语对话模型推出Int4量化版本

2023-10-23 08:09 · 稿源：站长之家

站长之家（ChinaZ.com）10月23日消息:智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀，超过了其他全球开源模型，包括 LLama-70B 等。

同时，Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型，仅次于 GPT4。

微信截图_20231023081238.png

为了降低使用大模型的门槛，智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中，从而显著降低了34B 级别大模型的训练和推理所需的资源。

经过 Int4量化，AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗，提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合，通过4位量化和 Low Rank Adapters （LoRA）方法进行微调，从而实现在不损失模型性能的情况下节省内存和提高训练速度。

据悉，Aquila2-34B 系列模型已经在国产芯片上进行了适配，并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术，用户可以在低资源环境中运行大参数模型。

项目地址：

https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py

（举报）

相关推荐

关键词：

海尔智家复合增长率34.04%头部企业最高，靠什么？

8月28日，海尔智家发布2025半年报，显示上半年营收1564.94亿元，同比增长10.2%；归母净利润120.33亿元，增长15.6%，创历史新高。面对行业价格战和海外高关税等挑战，公司通过聚焦爆款产品、优化SKU效率、推进多品牌协同及数字化变革实现逆势增长。海外市场收入增长11.66%，欧洲增长24.07%，新兴市场增速显著。数字化助力费率优化0.1个百分点，效率持续提升。

海尔智家 2025半年报家电行业
花费348亿元，可口可乐的“苦”生意，被“瑞幸”们打败

用一瓶肥宅快乐水征服全世界的可口可乐，不想再做“苦”生意了。 Sky News（英国天空新闻）近期发布消息，表示可口可乐公司正在与投资银行Lazard合作，评估出售Costa咖啡，出售标价预估20亿英镑(约合192.3亿元人民币)并且目前已经和私募股权投资机构进行了初步接触。不少人都有听说过Costa。它是英国最大的咖啡连锁品牌，在全球拥有超过4000家门店，被誉为“英伦咖啡的�

可口可乐 Costa咖啡品牌收购
荐王宁掏出迷你版LABUBU

“这周就要发布Mini版LABUBU，以前可能大家是挂在包上，可能从下周开始，大家甚至可以挂在手机上，它的使用场景会更多，相信它会是一个超级受欢迎的爆款。” 8月20日，在泡泡玛特2025年中期业绩发布会上，泡泡玛特董事长兼CEO王宁化身“带货博主”，从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。这款即将登场的 Mini 版 LABUBU 仅有掌心大小，延续了LABUBU标志性的搪胶毛�

泡泡玛特 LABUBU Mini版LABUBU
小米张国全回应澎湃OS 3 Beta版是否本月推出：不能说很快！

小米集团日前发布了第二季度财报，小米手机系统软件部总监张国全转发了该消息，并表示坚定投入核心技术，连续3个季度超千亿”。有网友在评论区问到，澎湃OS 3 Beta版是否会在这个月推出，张国全回复称：不能说，很快”。另外，近期国产手机厂商都纷纷接入了12306，可以在系统内方便的展示购票信息。也有网友问到了澎湃这边什么时候接入，张国全称：本来计划OS3一�

小米财报澎湃OS 12306接入
荐AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源 Mobile-Agent 3

AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE，通过自然语言交互简化工作流程；阿里开源Mobile-Agent-v3跨平台代理框架；微信测试AI播客功能，实现双人对话式新闻播报；钉钉推出首款AI硬件录音笔DingTalk A1；苹果拟为Siri引入谷歌Gemini大模型；苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能；Meta获得Midjourney技术授权加强AI图像生成竞争力；谷歌Drive新增Vids视频编辑功能降低制作门槛；夸克发布健康大模型通过12学科主治医师测评；AI小游戏Draw A Fish凭借极简设计引发全球热潮。

AI办公钉钉8.0 自然语言交互
荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

本期AI日报聚焦多项技术突破：阿里通义万相发布Wan 2.2-S2V模型，实现视频音频同步生成；字节跳动研发3D模型生成工具，降低建模门槛；面壁智能推出MiniCPM-V4.5端侧多模态模型；苹果提出RLCF训练法提升模型性能；微软开源VibeVoice-1.5B支持超长语音合成；谷歌Imagen 4正式上线；英伟达发布Jetson Thor机器人计算平台；Genspark推出AI Designer一键生成品牌方案；豆包上线未成年人保护模式。

AI视频生成多模态AI 阿里通义万相
三星推出Galaxy Buds3 FE耳机新品：带来更加智能、时尚的音频新体验

三星电子于2025年8月18日发布新款智能耳机Galaxy Buds3 FE，主打亲民价格与高端性能。新品延续标志性刀锋设计，配备升级版主动降噪(ANC)和Galaxy AI功能，支持跨设备无缝切换和语音交互。通过增强型扬声器实现三频均衡音效，超宽频通话技术确保清晰沟通。耳机采用哑光双色半透明设计，支持与三星生态设备联动，提供智能翻译等AI功能。将于9月5日上市，提供银雾灰、暗羽黑两种配色，进一步扩展三星Galaxy生态体验。

三星Galaxy Buds3FE 智能耳机
钉钉发布8.0版本：推出下一代AI办公应用形态钉钉ONE

今日，钉钉发布8.0版本，推出了下一代AI办公应用形态：钉钉ONE。钉钉ONE被设计为人与AI通过自然语言对话的统一入口，致力于打造全球首个以Agent驱动的工作信息流，让工作处理就像刷短视频一样丝滑。据介绍，这是钉钉对于AI时代办公应用形态的全新定义。

钉钉ONE AI办公自然语言对话
荐泡泡玛特不止一个LABUBU

不可否认，在本周举办的泡泡玛特中期业绩发布会上，LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元，同比增长668%，新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。尽管位列所有IP第一，THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1，泡泡玛特自有IP中有5个收入超10亿，收入过亿的IP更是达到13个，这其中有MOLLY这样历经十数年的�

泡泡玛特 LABUBU THE
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型

今日大家都在搜的词：

热文

3 天
7天

智源团队Aquila2-34B双语对话模型推出Int4量化版本

海尔智家复合增长率34.04%头部企业最高，靠什么？

花费348亿元，可口可乐的“苦”生意，被“瑞幸”们打败

荐王宁掏出迷你版LABUBU

小米张国全回应澎湃OS 3 Beta版是否本月推出：不能说很快！

荐AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源 Mobile-Agent 3

荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

三星推出Galaxy Buds3 FE耳机新品：带来更加智能、时尚的音频新体验

钉钉发布8.0版本：推出下一代AI办公应用形态钉钉ONE

荐泡泡玛特不止一个LABUBU

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

小米汽车8月交付量超3万台全年交付量有望冲击42万

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

零跑汽车8月交付57066台增长超88%

苹果上架翻新版Apple Pencil Pro售价849元

苹果首款折叠iPhone或不会采用屏下指纹将于明年发布

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

站长商机