首页 > 业界 > 关键词  > Mozilla最新资讯  > 正文

Mozilla 让人们将 AI LLM 变成单文件可执行文件,简化大型语言模型的分发和运行

2023-12-05 10:50 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 5 日消息:供本地使用的 LLM(大型语言模型)通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整,如果使用不同的版本,则会导致不同的结果。

截屏2023-12-05 上午10.53.02.png

Mozilla 的创新团队最近发布了 llamafile,这是一种开源方法,用于将一组权重转换为单个可在六种不同操作系统(macOS、Windows、Linux、FreeBSD、OpenBSD 和 NetBSD)上运行的二进制文件,无需安装。这大大简化了大型语言模型(LLMs)的分发和运行,并确保特定版本的 LLM 保持一致性和可重现性。

这一成就离不开 [Justine Tunney] 的贡献,他是一次构建、多处运行框架 Cosmopolitan 的创造者。另一个主要部分是 llama.cpp,它在运行自托管 LLM 方面具有重要作用。

有一些使用 Mistral-7B、WizardCoder-Python-13B 和 LLaVA 1.5 LLMs 的示例二进制文件可供使用。需要注意的是,如果您使用的是 Windows 平台,只有 LLaVA 1.5 能运行,因为它是唯一一个符合 Windows 对可执行文件 4 GB 大小限制的模型。如果遇到问题,请查看「常见问题」列表以获取故障排除提示。

llamafile 的发布标志着在大型语言模型的分发和运行方面的进步。这不仅降低了使用这些模型的技术门槛,也使得开发者和研究人员能够更容易地在多种操作系统上使用这些强大的 AI 工具

随着越来越多的 LLMs 的开发和应用,llamafile 提供了一个有效的解决方案,以确保这些模型的有效和一致的使用。

据了解,在这里提到的权重是指在机器学习和人工智能领域中的一个术语。在大型语言模型(LLMs,如 GPT-4)中,权重是模型在训练过程中学习到的参数,用来确定输入数据如何转换为输出结果。这些权重决定了模型如何解释和处理输入的数据。

因此,当说到 LLMs 通常以多个 Gigabyte 的文件形式分发一组权重时,意味着这些文件包含了模型在训练过程中学到的所有必要参数。这些权重文件本身不能直接使用,需要通过特定的软件框架或环境来加载和运行,这使得与其他类型的软件相比,它们的分发和运行更加复杂。

举报

  • 相关推荐
  • 英伟达将首次在美制造 AI 超算、及 Blackwell 芯片

    站长之家(ChinaZ.com) 4月15日 消息:随着 AI 行业的蓬勃发展,英伟达位于美国的人工智能芯片和超 级计算机工厂将创造数千个就业机会。科技巨头英伟达(NVIDIA)宣布,其 AI 超 级计算机将完全在美国本土生产。在全球贸易战的背景下,英伟达这一举动是为了减少对海外市场的依赖,并促进美国国内的生产。英伟达确认,他们已开始在台积电位于美国亚利桑那州凤凰城的工厂生产�

  • 采用Corning® Gorilla® Glass Ceramic 2玻璃陶瓷 三星Galaxy S25 Edge带来超强耐用性体验

    三星电子与康宁公司宣布,即将推出的Galaxy S25 Edge将采用全新Corning® Gorilla® Glass Ceramic2玻璃陶瓷材料。这款创新材料在超薄机身设计中提供突破性防护性能,兼具时尚外观与坚固耐用特性。通过将康宁前沿玻璃科技与三星精密加工工艺相结合,该材料显著提升了屏幕盖板的抗裂能力和耐久性,同时保持高透光率。双方表示,此次合作延续了"以工程创新为本"和"以用户体验为核心"的共同理念,为高端智能手机带来更卓越的产品体验。

  • 微信首个AI助手元宝上线:支持分析公众号文章、文件、图片

    快科技4月17日消息,日前,微信首个AI助手元宝上线,用户可在微信搜索元宝”,添加好友后可进行对话。与元宝AI助手对话无需下载或跳转其他App、小程序,而是以好友的形式出现在通讯录,聊天时甚至还会显示对方正在输入...”,就像与真实好友对话一样。据介绍,元宝AI是腾讯元宝App入驻微信的AI助手,搭载混元和DeepSeek双模引擎,无缝衔接微信生态。元宝AI可一键解析公�

  • 焱融存储蝉联 SDS 文件市场增速 No.1,份额持续攀升

    2025 年 4 月 14 日,国际数据公司 IDC 发布了《中国软件定义存储(SDS)市场季度跟踪报告,2024Q4》。报告数据显示,2024 年度,焱融存储凭借领先的产品性能和广泛的市场落地,在SDS 文件存储市场实现同比增长 48.4%,增速稳居行业第一,市场份额持续攀升。同时,焱融全闪存储一体机在 AI 训练及推理场景中的市场份额大幅提升,在 SDS 全闪市场排名第四,充分凸显其在 AI 场景�

  • 李想AI Talk第二季来了:理想VLA司机大模型是从动物到人类的进化

    在这期间,李想分享了他对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机,App已于12月27日全量上线。

  • 奔驰新款CLA接入豆包大模型

    4月22日,奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构,接入火山引擎大模型,支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈,交互效率提升50%,唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型,结合生成式AI和大数据技术,为中国用户打造更智能的用车体验。

  • 英氏携手金靖:解锁科学养娃,轻松做“chill妈”

    文章讲述了新手妈妈在育儿过程中遇到的喂养难题,以及英氏和金靖合作提出的科学喂养解决方案。核心在于"分阶喂养"理念,将6个月至3岁宝宝划分为5个阶段,根据不同发育阶段的营养需求和感知能力变化,提供针对性辅食支持。通过养花、养鱼等生活类比,生动阐释了抓住宝宝发育黄金期、循序渐进补充营养的重要性。英氏分阶辅食从1阶米粉到5阶辅食,逐步满足宝宝成长需求,帮助妈妈们实现轻松育儿。

  • AI模型横评:回答越简洁,“幻觉率”可能越高!

    你可能喜欢某些聊天机器人的回应,但这并不意味着它的回答是真实的……

  • 从大模型AI基础设施,商汤的反向求解

    大模型落地如火如荼,从上一代AI浪潮中杀出来的商汤,嗅到了这里面新的机会。在最火的具身智能赛道,这两年诞生了许多明星创业公司。这些创业公司的创始人往往拥有技术明星的光环,不少都是在学术界中某个技术领域中响当当的领头人。这些初创公司虽然在某一个单点技术上遥遥领先(大脑、小脑或者本体),但在机器人落地过程中,要突破从单一技术到整体复杂产品

  • 李想:理想VLA司机大模型 就是从动物进化到人类

    预训练相当于人类学习物理世界和交通领域的常识,通过大量高清2D和3D Vision(视觉)数据、交通相关的Language(语言)语料,以及与物理世界相关的VL(Vision-Language,视觉和语言)联合数据,训练出云端的VL基座模型,并通过蒸馏转化为在车端高效运行的端侧模型。