首页 > 传媒 > 关键词  > MiniMax最新资讯  > 正文

•中国大模型公司提出新架构,解决Context无限长问题,开启Agent时代

2025-01-16 16:26 · 稿源: 站长之家用户

日月开新元,万象启新篇。

1 月 15 日,MiniMax发布并开源新一代 01 系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3. 5 等海外领军模型的基础上,能够有效处理高达 400 万token的输入,可输入长度是GPT-4o的 32 倍,Claude-3.5-Sonnet的 20 倍。

目前,MiniMax- 01 系列开源模型已应用于MiniMax旗下产品海螺AI并在全球上线,企业与个人开发者可前往MiniMax开放平台使用API。

以架构创新实现有效超长文本输入

2017 年,具有里程碑意义的论文《Attention Is All You Need》正式发表,Transformer架构问世并逐步发展成为该领域的主流技术范式。自 2023 年起,自然语言处理领域迎来了一股创新浪潮,对模型架构的创新需求日益增加。

MiniMax- 01 系列模型初次将线性注意力机制扩展到商用模型的级别,并使其综合能力达到全球首先梯队。而受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从Scaling Law、与MoE的结合、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为 4560 亿,其中每次激活 459 亿,能够有效处理高达 400 万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。

MiniMax- 01 模型发布后,在国内外迅速掀起了热议浪潮。海外媒体与AI从业者聚焦该模型,深入探讨其技术内涵与潜在价值,对其所展现出的创新性给予了高度肯定。

性能比肩国际领军模型

在应用创新架构之外,MiniMax大规模重构了 01 系列模型的训练和推理系统,包括更有效的MoE All-to-all通讯优化、更长的序列的优化,以及推线性注意力层的有效Kernel实现,使得模型能力可与全球优质闭源模型相媲美。

在业界主流的文本和多模态理解任务处理表现上,MiniMax- 01 系列模型大多情况下可以追平海外公认先进的两个模型,GPT-4o- 1120 以及Claude-3.5-sonnet-1022。过往的模型能力评测中,Google的自研模型Gemini有着显著的长文优势。而在 01 系列模型参评的长文任务下,相较于Gemini等一众全球优质模型,MiniMax- 01 随着输入长度变长,性能衰减最慢,效果及其出众。

▲ 多项任务评测结果显示,MiniMax- 01 系列模型核心性能稳居全球首先梯队。(图源MiniMax- 01 系列模型技术报告)

▲ MiniMax- 01 系列模型长上下文处理能力全球领先。(图源MiniMax- 01 系列模型技术报告)

加速AI Agent时代到来

2025 年,AI将迎来至关重要的发展节点,AI Agent有望成为新一年最重要的产品形态,引领AI从传统的“工具”角色向更具互动性与协作性的“伙伴”角色转变。AI Agent时代,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升,是AI Agent为各行业带来更为丰富、有效、智能的解决方案的必要条件。

MiniMax在Github上开源了Text- 01 模型、VL- 01 模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”

凭借开放、共享、协作的特点,开源模型激发AI产业的创新活力,正在成为赋能新质生产力发展的关键引擎。受益于Linear Attention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax以业内相当性价比的价格提供文本模型和多模态理解模型的API服务,标准定价是输入token1 元/百万token,输出token8 元/百万token。

论文链接:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • iPad mini对比完败!华为MatePad Mini明天发布 价格曝光 或3999元起

    明天华为要举行新品发布会,除了新的三折叠屏手机外,还有MatePad Mini。 现在,有博主曝光了华为MatePad Mini不同内存版本的价格,具体来说:12GB 256GB售价为3999元;12GB 512GB售价为4499元;12GB 512GB柔光版售价为4999元。 汇总之前曝光的消息,华为MatePad Mini将推出多个版本,包括标准版、柔光版(配备防眩光屏幕,适合手写笔创作)、插卡版(支持5G网络和通话功能)、read版”(�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 华为MatePad Mini外观公布 支持蜂窝网络通话功能

    华为今日正式官宣,将于9月4日推出全新MatePad Mini小尺寸平板,并同步公开产品外观海报。这款被业界称为"大号手机"的新品,采用圆形后摄模组设计,内置双摄像头与闪光灯组件,正面配备侧边单挖孔全面屏,整体造型兼具便携性与辨识度。 海报细节透露关键功能突破——通话界面与信号标识的显示,证实MatePad Mini将支持蜂窝网络通话功能,实现平板与手机的形态融�

  • 华为MatePad Mini官宣9月4日发布

    今日,华为正式对外宣布,其首款旗舰小平板——华为MatePad Mini将于9月4日震撼登场,官方Slogan定为“超强,超Mini”,预示着这款新品将在性能与便携性上实现双重突破。 此前,知名数码博主“数码闲聊站”已提前透露,华为MatePad小平板已顺利入网,并定位为全能轻薄型设备。据进一步爆料,该机将采用8.8英寸小尺寸机身设计,搭配16:9比例的OLED屏幕,为用户带来极致的视觉

  • 34Q9 垂直整合重塑 Mini LED 格局

    2025年9月1日,雷鸟推出34Q9 Mini LED电竞显示器,定价3999元。该产品采用2304分区Mini LED背光和HVA面板,实现1ms响应速度和4000:1对比度,精准切入3000-4000元市场空档。凭借华星光电供应链优势,产品在画质、色域(97% DCI-P3)及多设备兼容性(90W Type-C)上表现突出,覆盖电竞玩家、内容创作者和多设备用户三大群体。业界认为该产品可能重塑中高端显示器市场格局,加速Mini LED技术普及。

  • 8.8英寸超窄挖孔屏 一手可握!华为MatePad Mini真机亮相:全系支持插卡

    华为MatePad Mini将在9月4日正式发布,博主@睿哥玩数码 今天提前晒出了包装和真机上手。 先看背部,与此前曝光过的外观保持一致,HUAWEI logo是横向放置,说明横向使用是华为的主要定义,后摄是家族式的圆环造型。 正面就比较有亮点了,采用了挖孔屏方案,虽然异形屏略微有些影响观感,但带来的好处也是显而易见的超窄边框。 华为MatePad Mini的四边都非常窄,不出意外将�

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 豆包1.5轻量版 vs Gemini 2.5闪存版:生成5000字深度文章,哪个模型更合适?

    AIbase选型工具通过多维度数据对比,帮助用户精准选择AI模型。文章以豆包和Gemini为例,展示平台如何解决模型选型痛点:自动生成对比报告,评估关键指标如术语准确性、本土案例适配度等。实际案例显示,使用该工具后内容团队效率提升40%,编辑成本下降65%。核心价值在于用数据驱动决策,规避局部优势导致的全局误判,实现场景化精准匹配。

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

今日大家都在搜的词: