首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

激进架构,400万上下文,彻底开源:MiniMax-01有点“Transformer时刻”的味道了

2025-01-15 14:16 · 稿源: ​硅星人Pro公众号

“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么?答案是,一个追平了顶级模型能力、且把上下文长度提升到 400 万token级别的新模型。1 月 15 日,大模型公司MiniMax正式发布了这款预告已久的新模型

......

本文由站长之家合作伙伴自媒体作者“​硅星人Pro公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:对标Cursor!字节推AI编程工具Trae;MiniMax海螺语音全球上线;OpenAI将发布o3-mini

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、MiniMax海螺语音全球同步上线包含T2A-01-Turbo等模型2025年1月20日,上海稀宇科技有限公司旗下的MiniMax推出了全新升级的T2A-01系列语音模型,标志着其在语音合成技术上的又一重要进�

  • AI日报:Kimi发布多模态图片理解模型API;周鸿祎参演AI短剧开拍;MiniMax-01系列模型开源;星火同传语音大模型发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、月之暗面Kimi多模态图片理解模型API发布2025年1月15日,北京月之暗面科技有限公司正式发布了全新多模态图片理解模型moonshot-v1-vision-preview,该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力,旨在帮助Kimi更好地理解世界。通过模块化设计,MiniCPM-o2.6集成了多种强大组件,支持实时处理和多语言功能。

  • •上海AI独角兽MiniMax发布新一代开源模型,创新突破受海内外好评

    日月开新元,万象启新篇。1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。受益于LinearAttention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax以业内极具性价比的价格提供文本模型和多模态理解模型的API服务,标准定价是输入token1元/百万token,输出token8元/百万token。

  • 天玑9400小屏旗舰!OPPO Find X8 mini将配6.3英寸直屏

    知名数码博主数码闲聊站”近日透露了OPPO即将发布的小屏旗舰手机FindX8mini的部分配置信息。根据该博主爆料,OPPOFindX8mini将配备一块6.3英寸的直屏,搭载1.5KLTPO显示技术,支持1-120Hz自适应高刷新率,配备短焦光学指纹识别。OPPOFindX8mini的轻薄机身搭配全能配置,为小屏用户提供了一个性能强劲、便携易用的优质选择,新机有望与OPPOFindX8Ultra一同发布。

  • 掉粉近400万 黄子韬凌晨回应送车事件:即使取关我也感恩

    1月10日晚,黄子韬兑现承诺,在直播间中送出30台宝骏云海纯电500km续航款,并表示其中20台送给网友,10台捐给妇女儿童基金会。直播结束后,黄子韬迅速掉粉,黄子韬称:如果没有抽中所有人都取关的话,说实话我会非常失望伤心。粉丝之所以取关,原因多样,有人觉得和预期相差甚远,只有5年使用权,也不是呼声最高的小米SU7。

  • 雷军直播晒小米食堂酸奶大麻花:mini、Pro、Ultra款都有

    今晚雷军在小米食堂进行元宵直播,品尝了不少美食,除了全国各地的汤圆之外上了小米的网红酸奶大麻花。值得注意的是,这次雷军直播中晒出了四款不同的麻花,传承了手机等产品的命名,除了标准款之外有mini、Pro、Ultra款,尺寸从小到大。此前曾有网友建议小米将食堂的麻花上架商城开卖,雷军对此回应称:我也曾经想过,我说这么多网友喜欢,要不我们大麻花也上架,他们说我们小米没有食品销售许可证,所以只能算了啊。

  • Mistral、AI2 发布新的开源 LLMs:更小,更便宜

    站长之家1月31日消息:MistralAI和Allen人工智能研究所今天发布了新的大型语言模型,它们声称这些模型在各自类别中属于最先进的。Mistral的模型被称为MistralSmall3Allen人工智能研究所发布的则是Tülu3405B。「通过这一发布,我们展示了我们在405B参数规模上应用后训练方法的可扩展性和有效性。

  • 定价最激进的天玑8400手机!真我Neo7 SE下月发

    真我将于2月份推出真我Neo7SE,该机已经获得入网许可,型号是RMX5080。证件照显示,真我Neo7SE正面是直屏,背部是矩阵双摄,闪光灯位于双摄右侧,辨识度较高。按照真我的激进定价策略,真我Neo7SE将会是行业内价格最低的天玑8400系列手机,值得期待。

  • 初代苹果Mac mini诞生20周年:用的还是ATI显卡

    20年前的今天,苹果推出了初代Macmini。初代Macmini的发布代表着苹果首次真正进军低端消费市场,用户无需支付与当时高端产品相当的费用即可踏入苹果生态。Macmini已经发展到外观更小、Thunderbolt5和苹果定制M4芯片,性能和效率实现了巨大飞跃,堪称超紧凑的工作站。

  • OpenAI开启调查:GPT-4o及4o-mini模型性能下降

    据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的

热文

  • 3 天
  • 7天