首页 > 业界 > 关键词  > Llama4最新资讯  > 正文

LIama 4发布重夺开源!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

2025-04-07 09:11 · 稿源: 量子位公众号

AI不过周末,硅谷也是如此。大周日的,Llama家族上新,一群LIama4就这么突然发布了。这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama4Scout、Llama4Maverick、Llama4Behemoth。最后一个尚未推出,只是预告,但Meta已经毫不避讳地称前两者是“我们迄今为止最先进的型号,也

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 北京车展重磅发布!京东汽车独家线上销售212全民越野车T01 METTA

    在2026北京国际汽车展上,京东汽车与212越野车达成战略合作。京东作为线上独家渠道,销售212全新越野车型T01 METTA和T01 METTA巴丹吉林版,指导价分别为18.99万和21.99万元,京东PLUS会员可享最高3000元购车补贴。双方还发起“全民越野合伙人”招募计划,邀请合作伙伴共拓越野市场。越野文化正走向大众,过去五年中国硬派越野车销量增长超170%。METTA系列定位超越单一产品,提供越野生活方式综合生态服务。

  • 为更多用户带来创新体验 Samsung One UI 8.5登陆更多三星Galaxy机型

    三星正式向更多Galaxy设备推送One UI 8.5更新,此前已在Galaxy S26系列首发获好评。新版本带来个性化设置、全新界面设计(如浮动底部栏、滑动透明模糊效果),以及更多自定义选项(快捷面板、时钟字体、天气闹钟等)。Galaxy AI功能升级,包括“照片助手”实现复杂图片编辑、“创意工作室”快速生成贴纸壁纸,Bixby交互优化支持自然语言和跨应用执行,其他AI功能如即时简报、多截图、同传翻译也更流畅便捷。此次更新覆盖Galaxy S25、Z系列等机型,后续将扩展至更多设备。

  • ​Paradox Interactive将于2026年发行Urban Games旗下名作《狂热运输 3》

    Paradox Interactive宣布与《狂热运输》系列开发商Urban Games达成发行合作,将共同发行系列最新作《狂热运输3》。该作计划于2026年登陆PC、PS5和Xbox Series X|S平台,提供四种环境(温带、沙漠、热带和亚寒带)的运输帝国建设体验,包含超过250种交通工具和新增直升机。双方均强调以玩家为中心的合作理念,但该协议仅涉及发行权,不包括知识产权。

  • 字节迫近Meta,但Reels也追上了TikTok

    张一鸣的“一生之敌”,注定是扎克伯格和Meta。 此前,围绕TikTok,扎克伯格施展多重手段,给张一鸣和字节跳动带来了不小的麻烦。如今,TikTok的纷纷扰扰尘埃落定,但双方的暗战依然没有止歇。 从估值上看,字节已经追了上来。 2020年前后,字节的估值首次突破1000亿美元,同期Meta市值高达8000亿美元,相当于8个字节。六年后,字节估值升至6000亿美元,Meta市值为1.7万亿美

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • 苹果首款智能眼镜要来了! 2027年硬刚Meta

    苹果正计划推出一款智能眼镜,进一步扩大其在可穿戴市场的布局。 与代表空间计算路线的Apple Vision Pro不同,这款产品不具备AR或独立计算能力,更接近Meta的Ray-Ban智能眼镜,主打日常佩戴形态与AI功能,预计最快于2027年推出。 设计上,苹果智能眼镜将采用类似普通眼镜的外观,而非头显设备,强调轻量化与配件属性,主要作为iPhone的辅助设备。 镜框可能略厚于传统眼镜,

  • 腾讯宣布开源Agent Memory:Token消耗直降61% 虾马一键部署

    今日,腾讯云宣布正式开源TencentDB Agent Memory,面向Agent长任务场景提供短期记忆压缩与长期个性化记忆能力。 长期记忆已于上月上线免费使用,本次开源的重点则是短期记忆压缩。 随着Agent在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,大量工具调用、网页内容和中间结果会快速占满上下文窗口,导致Token成本上升、任务状态丢失以及推理稳定性下降。 Agen

今日大家都在搜的词: