全面超越LLaMA2，月下载量超三百万，国产开源大模型如何成为新晋顶流？

2023-09-17 10:15 · 稿源：机器之心公众号

图源备注：图片由AI生成，图片授权服务商Midjourney回想两个月前，LLaMA2的开源，曾以一己之力改变了大模型领域的竞争格局。相比于今年2月推出的第一代 LLaMA，LLaMA2在推理、编码、精通性和知识测试等任务中都实现了性能的大幅提升，甚至可以在某些数据集上接近 GPT-3.5。由于其强

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

国产开源新标杆！20B大模型，性能媲美Llama2-70B，单卡可推理

国产新标杆:免费可商用的200亿参数大模型，来了!书生·浦语大模型20B版本正式发布，一举刷新国内新一代大模型开源纪录。它由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学共同推出。正如林达华所说:这或许才是当下大模型趋势里，大家最应该“卷”的方向。

InternLM 书生·浦语大模型
荐开源标杆！最强中英双语大模型来了，340亿参数，超越 Llama2-70B等所有开源模型

开源界最强的中英双语大模型，悟道·天鹰34B，来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的，正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

Llama2 开源模型
荐20B量级大模型性能媲美Llama2-70B！完全开源，从基座到工具全安排明白了

【新智元导读】国产模型开源纪录，又被刷新了!上海AI实验室等机构开源的InternLM-20B，竟然能和Llama2-70B打个平手?就在刚刚，国内开源模型参数量纪录，又被刷新了!9月20日，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学，正式开源了200亿参数的InternLM-20B模型。项目地址:https://github.com/InternLM/InternLM魔搭社区:https://modelscope.cn/organization/Shanghai_AI_Laboratory这次的200亿参数版书生·浦语大模型，可以说是「加量不加价」，参数量还不到三分之一，性能却可以剑挑当今开源模型的标杆——Llama2-70B。上海AI实验室的「雪中送炭」，必然会让大模型在落地领域发挥出巨大的价值。

模型
几千元训完中文版LLaMA2！Colossal-LLaMA-2把大模型门槛打下来了！

从头预训练大模型被认为需要高达5000万美元的投资，这让很多开发者和中小企业望却步。Colossal-LLaMA-2的出现降低了大模型的门槛。该方案业已应用到多个行业领域，构建垂类大模型并取得良好效果。

Colossal
中文LLaMA-2刷榜，开源可商用！千元预算，训练半天，效果媲美主流大模型

最强中文版LLaMA-2来了!15小时训练，仅需数千元算力，性能碾压同级中文汉化模型，开源可商用。LLaMA-2相较于LLaMA-1，引入了更多且高质量的语料，实现了显著的性能提升，全面允许商用，进一步激发了开源社区的繁荣，拓展了大型模型的应用想象空间。ColossalAI云平台现已开启公测，注册即可获得代金券，欢迎参与并提出反馈。

LLaMA-2 开源大模型
昆仑万维：天工大模型推理能力超过GPT-3.5和LLaMA2

昆仑万维表示，其自研的天工大模型在BenchmarkGSM8K测试中取得了80%的正确率，超过了GPT-3.5和LLaMA2-70B，达到了全球领先水平，接近于GPT-4。天工大模型还在MMLU、C-EVAL、HumanEval等多个数据集上表现出色，准确率均高于其他主流大模型。天工大模型目前仍处于内测阶段，将持续提升技术实力，为用户和企业提供强大的智能化助力。
荐开源大模型正在“杀死”闭源？

“OpenAI不足为惧，开源会慢慢赶上来。”彼时HuggingFace创始人ClemDelangue的一句预言，正在迅速成为现实。这也足以说明，开源还是闭源，或许只是阶段和位置的不同，但可以肯定的是，大模型时代，已经加速进入下一赛段。

大模型
15小时、几千元训完中文版LLaMA2！低成本方案全面开源，包含代码权重，支持商用

训练大模型，几千块就能实现了!现在，15小时、几千块钱、85亿token数据，即可训出中文LLaMA2。综合性能达到开源社区同规模从头预训练SOTA模型水平。更多应用场景、不同领域、不同版本的模型、企业私有化平台部署等正不断迭代。

LLaMA2
荐CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

大语言模型黑盒，居然被CMU等机构的学者打破了?他们发现，LLM内部有可解释的表征，如果撒谎能被测谎仪检测出来!最近，来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型，并不仅仅是黑匣子，或者难以理解的庞大矩阵。在它们内部，具有可解释的内部表征。CMU等机构研究者的探索也告诉我们，人类对于AI系统的理解和控制会越

大语言模型 Llama
Meta悄然发布Llama 2 Long AI模型

Meta最近发布了Llama2LongAI模型，该模型在一些任务上超越了GPT-3.5Turbo和Claude2。通过改进训练方法和编码技术，Meta的研究人员提高了这个AI模型的性能，使其能够更好地处理长文本和复杂任务。强调了合作的重要性，指出不是每个企业都拥有高级的数据工程和数据科学技能，因此需要与具有相关技术和深刻了解整个领域的合作伙伴合作来解决这一问题。

Meta

今日大家都在搜的词：

热文

3 天
7天

全面超越LLaMA2，月下载量超三百万，国产开源大模型如何成为新晋顶流？

国产开源新标杆！20B大模型，性能媲美Llama2-70B，单卡可推理

荐开源标杆！最强中英双语大模型来了，340亿参数，超越 Llama2-70B等所有开源模型

荐20B量级大模型性能媲美Llama2-70B！完全开源，从基座到工具全安排明白了

几千元训完中文版LLaMA2！Colossal-LLaMA-2把大模型门槛打下来了！

中文LLaMA-2刷榜，开源可商用！千元预算，训练半天，效果媲美主流大模型

昆仑万维：天工大模型推理能力超过GPT-3.5和LLaMA2

荐开源大模型正在“杀死”闭源？

15小时、几千元训完中文版LLaMA2！低成本方案全面开源，包含代码权重，支持商用

荐CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

Meta悄然发布Llama 2 Long AI模型

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机