首页 > 业界 > 关键词  > Llama2最新资讯  > 正文

OpenAI大神Karpathy纯C代码打造简化版Llama2 已获2.2K星

2023-07-24 17:52 · 稿源:站长之家

站长之家(ChinaZ.com)7月24日 消息:OpenAI的Andrej Karpathy(其在深度学习领域的贡献而闻名)创建了一个简化版的Llama2模型_Baby-Llama,并展示了在资源受限设备上使用纯C代码运行复杂模型的可行性。

创建Llama2模型

Karpathy测试了开源项目Llama2,他在纯C编程语言中将nanoGPT调整为Llama2架构,并通过开发C代码的推理引擎“run.c”来实现。该项目在GitHub上已经获得了2.2K star。

image.png

Karpathy的方法成功地实现了高度交互率,即使使用包含数百万参数的合理规模模型,并在TinyStories数据集的1500万参数模型上进行训练。他在M1MacBook Air上报告称,Llama2模型的推理速度为每秒约100个标记,在C代码中实现了这一结果,展示了在资源受限设备上运行复杂模型的可行性。

image.png

Karpathy的Baby-Llama方法受到了Georgi Gerganov的项目llama.cpp的启发,该项目几乎与使用C和C++在MacBook上运行第一个版本的LLaMA相同。他的方法涉及使用PyTorch从头开始训练Llama2LLM架构,并将模型权重保存到原始二进制文件中。接着,他写了一个名为“run.c”的500行C文件,加载保存的模型,并使用单精度浮点数(fp32)进行推理。这种简化的方法确保了较低的内存占用,并且不需要外部库,从而在单个M1笔记本电脑上高效执行,无需GPU。

小型LLM的崛起

模型逐渐变小的最大原因是为了在较小的本地设备上进行训练和集成。Karpathy的方法不仅不需要GPU,而且为单设备上的实现提供了案例。此外,Meta与芯片制造商Qualcomm合作,旨在使Llama2在本地硬件上运行,而苹果则推出了为Apple Silicon优化的Transformers架构。Karpathy已经展示了许多可能性。

Karpathy强调这个项目是一个周末实验,并不适用于生产级部署,主要目的是展示在资源受限设备上使用纯C代码运行Llama2模型的可行性,因为长期以来,C语言在机器学习中并不常用,因为它不涉及GPU。

项目网址:https://github.com/karpathy/llama2.c

举报

  • 相关推荐
  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 三星正式向更多Galaxy设备推送Samsung One UI 8更新

    三星电子正式推送One UI 8更新,为Galaxy用户带来增强的多模态AI功能,包括个性化建议、实时窗口、即时简报等智能体验。新系统优化了不同设备形态的交互,结合Knox安全架构保护隐私,并支持实时翻译、游戏辅助等实用工具。9月18日起中国用户可优先升级,年底前将扩展至更多机型。

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • AI日报:腾讯开源图像模型HunyuanImage2.1;​爱诗科技获6000万美元融资;​Freepik上线豆包Seedream4.0图像模型

    本文汇总了AI领域的最新动态:腾讯升级混元生图模型至2.1版,支持2K分辨率与中英文输入;爱诗科技获阿里领投6000万美元融资,聚焦AI视频生成;Freepik上线Seedream 4.0图像模型,提供高分辨率生成选项;阿里千问新模型通过MoE架构提升推理效率10倍;微软在Office 365中集成Anthropic技术,调整AI供应商策略;首款AI Agent浏览器Fellou CE发布,简化工作流程;清华团队开源GUAVA技术,实现

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • Lamett乐迈石晶产品硬核测评:零醛、防水、防霉三大指标重新定义健康家

    北京楼市新政落地,市场活力提升,新房装修需求升温。文章重点指出选购健康安全建材的关键指标:甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验,对比测试了乐迈石晶板等主流建材,结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能,重新定义了健康建材的标准。

今日大家都在搜的词: