首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

激进架构,400万上下文,彻底开源:MiniMax-01有点“Transformer时刻”的味道了

2025-01-15 14:16 · 稿源: ​硅星人Pro公众号

“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么?答案是,一个追平了顶级模型能力、且把上下文长度提升到 400 万token级别的新模型。1 月 15 日,大模型公司MiniMax正式发布了这款预告已久的新模型

......

本文由站长之家合作伙伴自媒体作者“​硅星人Pro公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

    6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • 1400万播放背后:AI如何重塑短视频内容生产

    在短视频赛道上,AI不只是加速器,也正在成为内容创作者的“第二大脑”。本文聚焦两个真实案例: 一个是治愈系图文短视频的爆款制造,团队用AI实现选题拆解、图像生成、配音剪辑等全流程提效,仅靠1人操作,即打造出播放量高达1400万的作品;另一个则是“包租婆”IP的虚拟形象再造,通过AI驱动的形象生成与语音合成,强化角色记忆点,轻量化制作节奏拉满。 这些案例�

  • 韦神4秒视频引爆2400万粉丝,一场“知识IP”和平台的合谋?

    一条仅有4秒的视频,掀起了这个夏天最猛烈的一次“知识流量”风暴。 6月4日晚,北京大学助理教授韦东奕在抖音上传了一则极简自我介绍,迅速在全网引爆热度,24小时内粉丝破千万。截至目前,该账号已斩获超过2400万粉丝,成为现象级的出圈案例。 表面看,这是一个“学术清流”偶然踏入流量池的故事。但深入拆解,其背后是用户情绪、高考节点、社交共鸣与平台机制�

  • 百度文库智能PPT月访问量超3400万、位列全球第一,市场份额断崖式领先

    极光旗下月狐数据发布《2025年智能PPT行业市场研究报告》显示,中国智能PPT市场年增速超50%,百度文库智能PPT月访问量超3400万,市场份额断层领先。报告指出,百度文库在六大产品维度均列行业第一,依托海量资源实现分钟级高质量PPT生成,支持多模态输入输出,并持续优化可视化效果。2023年百度文库率先推出全流程智能PPT解决方案,两年间在文本、图表、美化等方面全面提升质量,首创专业布局功能,推动行业从"直接可用"向"专家级"跃迁。目前百度文库AI月活用户达9700万,已推出数百项多模态AI能力,成为AI时代的"超级生产力工具"。