首页 > 热点 > 关键词  > 正文

智源团队Aquila2-34B双语对话模型推出Int4量化版本

2023-10-23 08:09 · 稿源:站长之家

站长之家(ChinaZ.com)10月23日 消息:智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀,超过了其他全球开源模型,包括 LLama-70B 等。

同时,Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型,仅次于 GPT4。

微信截图_20231023081238.png

为了降低使用大模型的门槛,智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中,从而显著降低了34B 级别大模型的训练和推理所需的资源。

经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。

据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。

项目地址:

https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py

举报

  • 相关推荐
  • 对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

    大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。 在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系�

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • 美团:2024年月均有单骑手336万 高频月收入在6650至9344元

    今日,美团发布2024年ESG报告(企业社会责任报告)。 全面呈现过去一年美团在促进就业、助力商家、保障骑手、绿色发展、服务社会等多方面的社会责任实践。 其中在个体发展篇中提到。 在骑手保障骑手权益方面,美团2024年平台月均有单骑手336万。 其中,美团全国范围内高频骑手的月均收入在6650元至9344元之间。 截至2024年底,共有150多个城市的超1.6万个社区加入骑手�

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 国产高边开关,稳先微推出12/24/48V近百款型号

    随着汽车行业向智能化、电动化发展,传统12V电气系统因功率不足难以满足商用车辆、工业设备等多样化应用场景需求。稳先微电子推出WST6+/WST5+系列智能高边开关芯片,专为24V/48V电控平台设计,具有高精度电流检测(2%精度)、高雪崩耐量(优于竞品20%)、低功耗待机模式(功耗仅为竞品1/40)等技术优势。产品采用单芯片设计,集成驱动、MOSFET、多重保护功能,覆盖单/双/四通道配置,导通电阻10mΩ-140mΩ,兼容多种封装。适用于商用车、工业机器人、无人机等领域,能有效提升系统能效和可靠性,支持自动驾驶功能开发。24V平台相比12V系统可减少线束直径和能量损耗,兼容多种电气设备,满足ASIL-D功能安全标准,未来市场规模将快速增长。

  • 创意无界 声动登场 森海塞尔推出MOMENTUM 4 无线耳机 80 周年纪念版

    森海塞尔推出MOMENTUM 4无线耳机80周年纪念版,由德国涂鸦艺术家Bond Truluv设计。纪念版耳机左耳罩采用Truluv标志性涂鸦风格,右耳罩以音频波形为灵感,融入明黄色调致敬经典HD414耳机。产品延续MOMENTUM 4的核心功能,包括自适应降噪和60小时续航,将于2024年6月中旬上市。森海塞尔1945年创立,80年来专注音频技术创新,此次跨界合作将街头艺术与音频科技融合,重塑经典。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 肖战代言!荣耀400系列部分版本已售空:供不应求

    荣耀终端股份有限公司销售与服务总裁王班介绍,荣耀400系列首销远超预期,部分版本已售空,衷心感谢大家对荣耀400的喜爱与支持。 我们的生产线正在全力运转,加紧生产,努力让大家尽快拿到心仪的手机,我们会持续努力,不负大家的期待。 数据显示,荣耀400系列线上全平台预售1小时同比增长278%,上市首日全渠道销量超越前两代产品。 这项数据证明,荣耀新管理团队

  • 小米15迎来首个安卓大版本更新:安卓16 Beta版上线

    今天,小米15迎来安卓首个大版本更新,基于安卓16定制的澎湃OS 2定向内测版正式上线,版本号为OS2.0.230.6.WOCCNXM Beta,安装包大小是7.3GB。 新版澎湃OS优化了部分场景动效策略,提升系统流畅度;同时新增双指上滑唤起自定义无障碍功能的快捷方式。 需要注意的是,这次更新是安卓跨版本升级,建议用户提前备份个人数据,部分第三方应用可能没有适配安卓16,这一点需要注�