首页 > 业界 > 关键词  > Mistral最新资讯  > 正文

刚刚,Mistral AI磁力链放出!8x22B MoE模型,281GB解禁

2024-04-10 14:14 · 稿源: ​新智元公众号

【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。一条磁力链,Mistral AI又来闷声不响搞事情。281.24GB文件中,竟是全新8x22B MOE模型!全新MoE模型共有56层,48个注意力头,8名专家,2名活跃专家。而且,上下文长度为65k。网友纷纷表示

......

本文由站长之家合作伙伴自媒体作者“​新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 真我GT8 Pro预热:Ultra级的产品力

    今天下午,真我举行了七周年直播活动,realme副总裁徐起提前预热真我GT8 Pro。 徐起表示,真我GT8 Pro将是一款大改款旗舰,从外观设计、核心技术、用户体验等维度全方位革新,拥有Ultra级的产品力,而且真我还将带来颠覆想象的影像效果,是真我史上最强旗舰。

  • 问界新M5 Ultra跃影红亮相成都车展,现场上演“人从众”

    成都车展上,问界新M5 Ultra以“跃影红”配色惊艳亮相,成为全场焦点。其外观设计灵感源自极光掠影,流动红色车身搭配黑色运动轮毂,尽显低调张扬气质。新车搭载华为ADS辅助驾驶系统,配备激光雷达与毫米波雷达,提供更智能安全的驾驶体验。四驱版4.3秒破百,增程版续航达1440km,满足年轻用户对性能与续航的双重需求。售价22.98万元起,即日起至10月9日订车可享最高37000元权益。

  • 红魔11 Ultra曝光:首款支持主动散热的骁龙8 Elite 2旗舰

    红魔11 Ultra现身Geekbench跑分网站,首发搭载骁龙8 Elite 2旗舰平台,单核3309分、多核10742分。该芯片采用8核设计,集成Adreno 840 GPU,博主透露量产版频率将提升至4.6GHz左右。新机延续主动散热风扇设计,支持IP68防尘防水,是行业内唯一支持防水的主动散热手机,通过高效散热保证处理器性能稳定释放。新品预计今年第四季度发布。

  • 2025 年 3A 大作畅玩指南:酷睿 Ultra 200HX 游戏本如何破解性能与静音难题

    随着《黑神话:悟空》《赛博朋克2077》等3A大作的流行,玩家对游戏本的要求已从“能运行”升级为高画质流畅、低噪音、长续航。英特尔联合OEM厂商推出搭载酷睿Ultra200HX处理器的AI高静游戏本,通过能效提升、AI算力加持及智能散热控制,在性能释放与续航间找到平衡。推荐机型如雷神ZERO16 Pro和机械革命耀世16 Ultra,兼顾游戏性能与多场景使用,为玩家提供流畅、安静的高品质游戏体验。

  • 雷军:成都车展将首次展出小米SU7 Ultra纽北限量版

    随着8月29日成都车展开幕临近,小米汽车创始人雷军通过短视频提前剧透参展亮点。 此次小米汽车将携全阵容车型亮相西博城展览馆16号馆H1607展台。 在参展车型方面,小米SU7、SU7 Ultra与YU7将集体登场,覆盖不同用户需求。车身颜色选择十分丰富,除了市场反响热烈的YU7流金粉、影青色外,兼具质感与个性的丹霞紫也将亮相。 此次车展最受瞩目的亮点,当属小米 SU7 Ultra纽北

  • 美团也开源了大模型,但我觉得他们的野心是通用生活Agent。

    也有线上体验地址:https://longcat.ai 我自己去体验了一下,整体模型能力,中规中矩,但是快,是真的快,能把560B的模型,在推理的时候搞得这么快,是真的有点牛逼的。 我直接录了个屏给大家看一下。 这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度,他俩都是MoE架构,而且总参数量差不太多。 为了更公平的竞争,用了同一个问题,并关闭了联网搜索来避免搜索干扰�

  • 科龙静省电Ultra上市,跳出空调参数内卷,全能实力重塑用户体验

    空调市场竞争激烈,科龙静省电Ultra以硬核实力破局。产品搭载美芝压缩机、7mm铜管等优质硬件,APF值达6.26超一级能效,实现15秒速冷、30秒速热。四向送风消除温差,防直吹设计提升舒适度。经中家院认证,能效稳定领先,满足年轻消费者对性能、节能与场景适配的全方位需求,引领行业回归实效竞争。

  • 酷睿 Ultra 赋能 AIPC 轻薄本:不止性能飞跃,更懂用户需求的智能新体验

    AI技术正从实验室走向日常生活,AIPC(人工智能个人计算机)成为满足用户多元化需求的关键载体。英特尔酷睿Ultra处理器凭借先进技术布局,突破传统轻薄本性能瓶颈,实现高效多任务处理与强大AI算力融合。华硕灵耀14Air等产品以性能与体验双优特质脱颖而出,不仅提升办公创作效率,更重新定义轻薄本的使用价值。随着技术迭代与生态完善,AIPC正从“小众尝鲜”走向“大众普及”,智能体验将成为未来轻薄本的标准配置。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

今日大家都在搜的词: