首页 > 热点 > 关键词  > 正文

智源团队Aquila2-34B双语对话模型推出Int4量化版本

2023-10-23 08:09 · 稿源:站长之家

站长之家(ChinaZ.com)10月23日 消息:智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀,超过了其他全球开源模型,包括 LLama-70B 等。

同时,Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型,仅次于 GPT4。

微信截图_20231023081238.png

为了降低使用大模型的门槛,智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中,从而显著降低了34B 级别大模型的训练和推理所需的资源。

经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。

据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。

项目地址:

https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py

举报

  • 相关推荐
  • 海尔智家复合增长率34.04%头部企业最高,靠什么?

    8月28日,海尔智家发布2025半年报,显示上半年营收1564.94亿元,同比增长10.2%;归母净利润120.33亿元,增长15.6%,创历史新高。面对行业价格战和海外高关税等挑战,公司通过聚焦爆款产品、优化SKU效率、推进多品牌协同及数字化变革实现逆势增长。海外市场收入增长11.66%,欧洲增长24.07%,新兴市场增速显著。数字化助力费率优化0.1个百分点,效率持续提升。

  • 花费348亿元,可口可乐的“苦”生意,被“瑞幸”们打败

    用一瓶肥宅快乐水征服全世界的可口可乐,不想再做“苦”生意了。 Sky News(英国天空新闻)近期发布消息,表示可口可乐公司正在与投资银行Lazard合作,评估出售Costa咖啡,出售标价预估20亿英镑(约合192.3亿元人民币)并且目前已经和私募股权投资机构进行了初步接触。 不少人都有听说过Costa。 它是英国最大的咖啡连锁品牌,在全球拥有超过4000家门店,被誉为“英伦咖啡的�

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 小米张国全回应澎湃OS 3 Beta版是否本月推出:不能说 很快!

    小米集团日前发布了第二季度财报,小米手机系统软件部总监张国全转发了该消息,并表示坚定投入核心技术,连续3个季度超千亿”。 有网友在评论区问到,澎湃OS 3 Beta版是否会在这个月推出,张国全回复称:不能说,很快”。另外,近期国产手机厂商都纷纷接入了12306,可以在系统内方便的展示购票信息。 也有网友问到了澎湃这边什么时候接入,张国全称:本来计划OS3一�

  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 三星推出Galaxy Buds3 FE耳机新品:带来更加智能、时尚的音频新体验

    三星电子于2025年8月18日发布新款智能耳机Galaxy Buds3 FE,主打亲民价格与高端性能。新品延续标志性刀锋设计,配备升级版主动降噪(ANC)和Galaxy AI功能,支持跨设备无缝切换和语音交互。通过增强型扬声器实现三频均衡音效,超宽频通话技术确保清晰沟通。耳机采用哑光双色半透明设计,支持与三星生态设备联动,提供智能翻译等AI功能。将于9月5日上市,提供银雾灰、暗羽黑两种配色,进一步扩展三星Galaxy生态体验。

  • 钉钉发布8.0版本:推出下一代AI办公应用形态钉钉ONE

    今日,钉钉发布8.0版本,推出了下一代AI办公应用形态:钉钉ONE。 钉钉ONE被设计为人与AI通过自然语言对话的统一入口,致力于打造全球首个以Agent驱动的工作信息流,让工作处理就像刷短视频一样丝滑。 据介绍,这是钉钉对于AI时代办公应用形态的全新定义。

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

今日大家都在搜的词: