MosaicML发布大型语言模型 MPT-7B 可商用

2023-05-11 11:43 · 稿源：站长之家

站长之家（ChinaZ.com）5月11日消息:MosaicML 的 MPT-7B 是一个具有近70亿个参数的大型语言模型，该团队在自己的近万亿个标记的数据集上对其进行了训练。

MosaicML 遵循 Meta 的LLaMA模型的训练方案。培训花费近200，000美元，使用 MosaicML 平台耗时9.5天。

MosaicML表示，MPT-7B 与 Meta 的70亿参数 LLaMA 模型的性能相匹配，使其成为第一个达到该水平的开源模型，领先于OpenLLaMA。与 Meta 的模型不同，MPT-7B 已获得商业使用许可。

除了“MPT-7B Base”模型，MosaicML 还发布了三个变体:MPT-7B-StoryWriter-65k+、MPT-7B-Instruct 和 MPT-7B-Chat。

借助 MPT-7B-StoryWriter-65k+，MosaicML 还发布了一个模型，该模型能够读取和写入上下文长度非常长的故事。为此，使用 books3数据集的子集对 MPT-7B 进行了微调，上下文长度为65，000个标记。OpenAI 最大的 GPT-4变体能够处理32，000个标记。

根据 MosiacML 的说法，该模型可以通过一些优化扩展到超过65，000个token，并且该团队已经在使用 Nvidia A100-80GB GPU 的单个节点上展示了多达84，000个token。但即使有65，000个token，也可以阅读整部小说并写一篇结语。

项目网址：https://github.com/mosaicml/llm-foundry

（举报）

相关推荐

关键词：

GEO排名优化：AI如何重新定义搜索引擎的可见性规则？

文章探讨AI搜索时代下，传统SEO向GEO（生成引擎优化）的转变。核心指出GEO通过多维数据融合与AI理解，构建企业可信数字实体，实现智能推荐。技术决策者需关注从关键词匹配转向实体价值理解的底层逻辑革命，提前布局以抓住AI对话流量入口。

AI搜索 GEO 流量规则
百度正式发布AI搜索APP“梯子AI”：主打无广告智能搜索！

百度旗下的AI搜索AppTizzy.ai”已完成了前期的测试，并正式更名为梯子AI”上架。这款应用最初于8月10日发布，当时名称为Tizzy.ai”，更新后版本号从1.0.0直接跳至1.2.0。据介绍，梯子AI定位为智能搜索助手，依托百度多个大模型能力开发而成，主打无广告智能搜索，整合深度思考、资源检索及影视娱乐功能，致力于为用户提供简单搜索，一触即达”的极致体验。

AI搜索智能助手百度大模型
小米电视怎么无线投屏？怎么搜索到设备？超全教程分享，新老电视都适用

本文介绍小米电视投屏教程，推荐使用当贝投屏软件。详细讲解软件下载安装步骤，支持多种设备连接方式，兼容AirPlay、DLNA等协议。提供常见问题解决方案，如网络连接失败、画面卡顿等。新手也能轻松操作，实现流畅投屏体验，适用于观影、办公等多种场景。

小米电视投屏第三方投屏软件投屏教程
微算法科技（NASDAQ:MLGO）突破性FPGA仿真算法技术助力Grover搜索，显著提升量子计算仿真效率

量子计算迅猛发展，量子算法在搜索和加密领域潜力巨大。然而，量子计算机实现复杂，当前研究重点是在经典平台上高效仿真量子算法。微算科技提出基于FPGA的高效仿真技术，通过硬件仿真而非传统软件方法，显著提升Grover搜索算法仿真速度，实现百倍提速。该技术结合软硬件仿真，优化架构与数据路径，提高效率与资源利用率，为量子算法实际应用提供支持，推动量子计算发展。

量子计算量子算法 Grover搜索算法
罗永浩：叫锤子手机不是故意的国人不知道这个词是干嘛的

在罗永浩第二期视频播客节目中，他请来小鹏汽车创始人何小鹏，两个人聊起了公司起名的事情。何小鹏在节目中表示，在中国一个企业名用老板名字好像很怪。有七八年时间，好多朋友劝自己给小鹏汽车改名。说只要一改名，销量翻一倍。罗永浩也在节目中透露，锤子手机不是故意叫锤子的，品牌名找了一堆好的都注册不上，所以公司名就用了英文的，叫Smartisan，那个在�

罗永浩何小鹏公司起名
顺丰同城(09699)上半年收入净利润双高增，结合AI、无人车优化配送网络效率

顺丰同城2025年上半年业绩亮眼，收入同比增长48.8%至102.36亿元，首次半年营收破百亿；毛利润增长43.8%至6.81亿元，净利润增长120.4%至1.37亿元。增长主要受益于餐饮外卖及即时零售行业快速发展，同城配送订单量增长超50%。公司深化与头部客户合作，覆盖餐饮、商超、医药等多场景，无人车配送和AI技术应用提升运营效率，累计投入超300台无人车覆盖60多个城市。

顺丰同城中期业绩收入增长
企业品牌在AI时代的生存之道:深度解析GEO优化的商业价值

随着传统搜索引擎流量红利见顶，AI生成引擎正成为新的流量洼地。全球超3亿用户使用ChatGPT等AI工具获取信息，企业面临战略转折点。用户行为变革：不再满足搜索结果，而是期望直接、准确的答案。AI依赖语义理解，企业需建立权威性和语义关联，通过高质量内容在AI平台留下印象。GEO优化成为关键，需系统性策略和多平台协同。专业服务商可提供定制方案，助企业抢占AI时代先机。
别被奶粉成分表绕晕！如何选择一款好的奶粉，关键看这几点

文章聚焦宝宝喂养难题，强调肠胃健康对营养吸收的重要性。指出选择奶粉需关注三大关键营养：A2蛋白、OPL结构脂和益生元组合，能有效提升吸收率并呵护肠道。推荐佳贝艾特悦白羊奶粉，其小分子蛋白、高吸收率及低致敏特性，经临床验证可显著改善消化问题，是兼顾吸收与全面营养的优质选择。

宝宝成长喂养难题奶粉选择
刚预售就进抖音搜索TOP5！统帅热水器凭什么抓住年轻人的心？

Leader统帅小音浪F7热水器精准把握年轻人需求，通过智能交互功能解决洗澡痛点：1）搭载超10万条指令语音库，支持99%准确率的语音控制，实现"动口不动手"的便捷操作；2）首创小白瓶净肤科技，99.3%除氯率+99.5%阻垢率，提升沐浴健康体验；3）双胆独立加热系统+780L大容量，兼顾加热效率与用水需求；4）310mm超薄机身适配小户型浴室。产品预售首日即冲上抖音热水器类目搜索TOP5，用户主动搜索超4.5万次，印证了"情绪价值+硬核性能"的创新方向正引领行业变革。

文章搜索核心标签年轻人需求
上海迪士尼将增加更多中间票价等级 10月中旬起优化票务结构

近日，上海迪士尼度假区宣布，自2025年10月中旬起，将对上海迪士尼乐园的票务结构进行优化调整。在现有的六级票价结构基础上，将增加更多中间票价等级，旨在为游客提供更为丰富的票价选择。据悉，此次新增的中间票价等级具体价格尚未确定，将择期公布。届时，游客可通过查看迪士尼门票价格日历获取详细信息。上海迪士尼度假区方面表示，此次优化票务结构，是

上海迪士尼票务调整票价结构

今日大家都在搜的词：

热文

3 天
7天

MosaicML发布大型语言模型 MPT-7B 可商用

GEO排名优化：AI如何重新定义搜索引擎的可见性规则？

百度正式发布AI搜索APP“梯子AI”：主打无广告智能搜索！

小米电视怎么无线投屏？怎么搜索到设备？超全教程分享，新老电视都适用

微算法科技（NASDAQ:MLGO）突破性FPGA仿真算法技术助力Grover搜索，显著提升量子计算仿真效率

罗永浩：叫锤子手机不是故意的国人不知道这个词是干嘛的

顺丰同城(09699)上半年收入净利润双高增，结合AI、无人车优化配送网络效率

企业品牌在AI时代的生存之道:深度解析GEO优化的商业价值

别被奶粉成分表绕晕！如何选择一款好的奶粉，关键看这几点

刚预售就进抖音搜索TOP5！统帅热水器凭什么抓住年轻人的心？

上海迪士尼将增加更多中间票价等级 10月中旬起优化票务结构

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

《亮剑》开播20周年：今日全弹幕重返B站

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

蜜雪冰城上半年净赚27亿：全球门店破5.3万家加速全球化布局

小米澎湃OS 3超级岛适配应用公布加速推进多场景适配

三大运营商回应是否支持eSIM版iPhone：需等待通知

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

抖音升级AI内容标识功能上线两项核心功能

小米汽车8月交付量超3万台全年交付量有望冲击42万

站长商机