MosaicML和Together推出可商用开源大模型性能不输LLaMA

2023-05-08 09:50 · 稿源：站长之家

站长之家（ChinaZ.com）5月8日消息:虽然Meta的LLaMA已经成为开源AI重要力量，但由于其只可用于研究用途，而且申请麻烦而被业界诟病。现在，MosaicML和Together推出可商用开源大模型，性能不输LLaMA。

MosaicML的MPT系列模型支持84k tokens超长输入，并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。其中70亿参数版在性能测试中与LLaMA打个平手。

除了MPT-7B Base基础模型外还有三个变体。MPT-7B-Instruct，用于遵循简短指令。MPT-7B-Chat，用于多轮聊天对话。MPT-7B-StoryWriter-65k+，用于阅读和编写故事，支持65k tokens的超长上下文，用小说数据集微调。

Together的RedPajama系列模型在5TB的同名开源数据上训练而来，除了70亿参数基础模型外，还有一个30亿参数版本，可以在5年前发售的RTX2070游戏显卡上运行。

据了解，MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办，致力于降低训练神经网络的成本。RedPajama由苹果前高管Vipul Ved Prakash，斯坦福大模型研究中心主任Percy Liang，苏黎世联邦理工大学助理教授张策等人联合创办。

这些开源大模型的推出，标志着开源大模型生态有了寒武纪大爆发的早期迹象。这将有助于降低人工智能技术的门槛，促进人工智能的发展。也将有助于加强人工智能技术的透明度和可解释性，避免人工智能技术被滥用。

（举报）

相关推荐

关键词：

荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

本文汇总AI领域最新动态：美图通过组织变革推动AI应用RoboNeo月活破百万；vivo发布蓝心3B端侧大模型，性能超越8B模型；Gaga AI实现静态照片生成60秒电影级视频；ChatGPT周活用户突破8亿；Figma引入Gemini模型提升设计效率；印度试点AI聊天机器人购物；Figure AI推出第三代家用机器人Figure 03；谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升，加速渗透各行业。

AI原生美图RoboNeo MAU破百万
寒武纪深耕智能芯片技术与软件生态助力大模型应用落地

良好的软件环境能降低AI应用开发门槛，增强用户粘性，对AI芯片发展至关重要。寒武纪专注AI芯片研发，掌握处理器架构、SoC设计等硬件技术及编程框架、编译器、驱动等软件技术。通过芯片、硬件板卡、基础软件三大团队协同，为产品提供全链条技术支持，并构建开发者生态。未来将通过开放生态推动云计算、金融、医疗等行业的智能化升级，以市场为导向保持技术领先。

人工智能芯片软件平台大模型应用
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

Sora2爆火之后，随之而来的AI视频领域的新产品。来自我的好朋友，曹越老师的Sand.ai。凌晨，他们终于上线了他们全新的音画同步视频模型GAGA-1，在人物表演上，我觉得，已经算是现在的TOP级了。

AI视频 GAGA-1 音画同步
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

9月12日，易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”，成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出，易鑫以AI为核心驱动力，通过自研大模型“智鑫多维”等技术，显著提升风控水平与融资通过率，推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构，服务覆盖牧民、基层员工等多元群体，体现技术普惠价值。未来将持续加大科技创新投入，深化国内普惠金融服务，并探索技术出海，助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可，更反映出行业正加速拥抱智能化变革。

AI应用汽车金融金融科技
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
我国首个政务大模型安全国家标准发布百度深度参与制定

日前，我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》（下称《规范》）正式发布。百度作为核心参编单位，凭借其在人工智能安全及政务服务领域的深厚积累，深度参与了该标准的制定工作，为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头，联合百度等国内领先企业共同制定�

政务大模型安全国家标准百度参编
深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

9月28日，悠然大模型BLM-1.0完成迭代升级并全面开源。该模型突破数字与物理世界壁垒，实现跨空间迁移、跨任务学习与跨本体泛化能力，以统一模型覆盖多种机器人平台。在空间理解、推理与执行评估中综合超越同规模SOTA方法，支持工业制造、智慧城市等场景应用，推动空间智能生态共建。

悠然无界大模型 BLM-1.0 开源模型权重

今日大家都在搜的词：

热文

3 天
7天

MosaicML和Together推出可商用开源大模型性能不输LLaMA

荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

寒武纪深耕智能芯片技术与软件生态助力大模型应用落地

荐没想到，音频大模型开源最彻底的，居然是小红书

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

我国首个政务大模型安全国家标准发布百度深度参与制定

深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

今日大家都在搜的词：

热文

微信员工回应好友互删后互动清除：并非新版本特性

AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；

董明珠称格力向特斯拉提供服务已有近14万项专利技术

卢伟冰调侃还有小米6钉子户：小米6机主宣布换机小米17

Windows 10即将“停服”上热搜微软建议用户升级Win 11

库克下月满65岁苹果或迎特努斯时代：有望执掌十年以上

京东回应下场造车：不直接涉及制造三方联合推出

小米第三款车路测谍照曝光雷军测试小米汽车现身盘龙古道

小红书崩了上热搜客服回应：已在尽快处理

谢霆锋成为荣耀未来科技体验官将亮相荣耀Magic8系列发布会

微信员工回应好友互删后互动清除：并非新版本特性

AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；

网易云音乐回应登入李玟账号：已与网友新手机号解绑

董明珠称格力向特斯拉提供服务已有近14万项专利技术

卢伟冰调侃还有小米6钉子户：小米6机主宣布换机小米17

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

Windows 10即将“停服”上热搜微软建议用户升级Win 11

库克下月满65岁苹果或迎特努斯时代：有望执掌十年以上

站长商机

MosaicML和Together推出可商用开源大模型 性能不输LLaMA

今日大家都在搜的词：

热文

站长商机

MosaicML和Together推出可商用开源大模型性能不输LLaMA