Llama 2 如何成为 IBM 战略的核心：具备潜在成功的所有要素

2023-08-14 17:58 · 稿源：站长之家

站长之家(ChinaZ.com) 8月14日消息:IBM 最近宣布将在 watsonx.ai 托管 Meta 的 Llama 2-chat 700 亿参数模型，并向选择的客户和合作伙伴提供早期访问权限。

IBM

企业现在正在采用生成式人工智能的趋势来增强他们的业务战略。为了有效利用其潜力，他们需要简化的方法来训练和构建自己的 LLM，利用他们多年积累的数据。为了解决这个挑战，包括 AWS 和 Azure 在内的各种云服务提供商已加紧提供帮助。

OpenAI 与微软合作获得了 GPT-4，而 AWS 则通过多 LLM 方法给出了可以选择使用像 AI21、Cohere、Anthropic Claude 2 和 Stability AI SDXL 1.0 等多个模型选项。除了知名云服务外，最近还出现了其他几家服务提供商。

企业寻求可信赖且值得信赖的解决方案。最近，人工智能爱好者已经开发出一些方法来训练和构建 Llama 2 模型，但关键问题仍然是：这些方法是否可以可靠地处理数据？

几天前，AI 专家 Santiago 发推文称「您现在可以在不到 10 分钟内测试 Llama 2」，介绍了 Monster API 这个新工具，它可以轻松访问强大的生成式 AI 模型，如 Falcon、Llama、Stable Diffusion 和 GPT J 等，而无需担心管理这些生成式 AI 模型或扩展它们以处理大量请求。

然而，像这样的新举措对于已经建立起来的公司来说太冒险了，他们还没有证明自己能够扩展业务。

IBM 赢得了客户的信任

IBM 致力于在引入其生成式人工智能功能时优先考虑信任和安全性。例如，在用户使用 watsonx.ai 中的 Prompt lab 中使用 Llama 2 模型时，他们可以激活 AI 护栏功能。这有助于自动过滤输入提示文本和模型生成输出中的有害语言。

IBM 印度及南亚技术首席技术官兼技术销售负责人 Geeta Gurnani 表示，IBM 正在推出一款预计今年晚些时候将正式发布的 AI 治理工具包，该工具包将帮助实施治理以减轻与手动流程相关联的风险、时间和成本，并提供驱动透明可解释结果所需的文档。

她说：「它还将具备保护客户隐私、主动检测模型偏见和漂移，并帮助组织满足其道德标准的机制。」

为什么选择 Llama 2 而不是 GPT-4

Llama 2 在企业中受到了欢迎。这可以通过它在 Amazon Sagemaker、Databricks、Watsonx.ai 甚至是微软 Azure 上都可用来作为专有 LLM GPT-4 的基础来证明。

此外，Meta 与亚马逊、Hugging Face、英伟达、高通、Zoom 和 Dropbox 等多家知名公司以及学术领导者之间的合作伙伴关系强调了开源软件的重要性。

即使是深度学习领域的著名人物 Karpathy 也无法抵挡使用 Llama 2 的诱惑，他创建了 Baby Llama（又称 llama.c），他一直在探索在一台计算机上运行大型语言模型 (LLM) 的概念。此外，他甚至暗示 OpenAI 可能会在不久的将来发布开源模型。

同样，AI 专家 Santiago 表示，Llama 2 具备潜在成功的所有要素：开源、拥有商业许可、成本效益高的 GPU 使用以及对整个利用过程的全面控制。

他表示：「我和两家初创公司交流过，它们正在从专有模型转向 Llama 2。还会有多少公司放弃商业替代品而选择 Llama 2 呢？」

GPT-4 只能通过微软 Azure OpenAI 服务进行访问，但企业也可以购买 OpenAI 提供的 GPT-4 API。然而，GPT-4 的限制在于其闭源性质，用户无法创建自己的模型或尝试修改其代码。与免费商用的 Llama 2 不同，GPT-4 API 是需要付费使用的。收费按照每 1000 个 tokens 计算，输入为 0.03 美元，输出为 0.06 美元。

根据 AIM Research 数据，在稍微复杂一些的应用场景中，一个月使用 GPT-4 API 进行推理可能需要花费 25 万到 30 万美元（16K 上下文长度）。因此，在使用 ChatGPT API 时必须注意标记使用情况并有效管理以控制成本。

最初观察到这一季度公司倾向于 Azure 来获取独占权访问 GPT-4，并进而提升了 Azure 云的收入。然而，当微软与 Meta 合作托管 Llama 2 时，情况发生了有趣的变化。这凸显出开源 LLM 具有独特优势，不容忽视。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
几千元训完中文版LLaMA2！Colossal-LLaMA-2把大模型门槛打下来了！

从头预训练大模型被认为需要高达5000万美元的投资，这让很多开发者和中小企业望却步。Colossal-LLaMA-2的出现降低了大模型的门槛。该方案业已应用到多个行业领域，构建垂类大模型并取得良好效果。

Colossal
Meta悄然发布Llama 2 Long AI模型

Meta最近发布了Llama2LongAI模型，该模型在一些任务上超越了GPT-3.5Turbo和Claude2。通过改进训练方法和编码技术，Meta的研究人员提高了这个AI模型的性能，使其能够更好地处理长文本和复杂任务。强调了合作的重要性，指出不是每个企业都拥有高级的数据工程和数据科学技能，因此需要与具有相关技术和深刻了解整个领域的合作伙伴合作来解决这一问题。

Meta
国产开源新标杆！20B大模型，性能媲美Llama2-70B，单卡可推理

国产新标杆:免费可商用的200亿参数大模型，来了!书生·浦语大模型20B版本正式发布，一举刷新国内新一代大模型开源纪录。它由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学共同推出。正如林达华所说:这或许才是当下大模型趋势里，大家最应该“卷”的方向。

InternLM 书生·浦语大模型
荐20B量级大模型性能媲美Llama2-70B！完全开源，从基座到工具全安排明白了

【新智元导读】国产模型开源纪录，又被刷新了!上海AI实验室等机构开源的InternLM-20B，竟然能和Llama2-70B打个平手?就在刚刚，国内开源模型参数量纪录，又被刷新了!9月20日，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学，正式开源了200亿参数的InternLM-20B模型。项目地址:https://github.com/InternLM/InternLM魔搭社区:https://modelscope.cn/organization/Shanghai_AI_Laboratory这次的200亿参数版书生·浦语大模型，可以说是「加量不加价」，参数量还不到三分之一，性能却可以剑挑当今开源模型的标杆——Llama2-70B。上海AI实验室的「雪中送炭」，必然会让大模型在落地领域发挥出巨大的价值。

模型
中文LLaMA-2刷榜，开源可商用！千元预算，训练半天，效果媲美主流大模型

最强中文版LLaMA-2来了!15小时训练，仅需数千元算力，性能碾压同级中文汉化模型，开源可商用。LLaMA-2相较于LLaMA-1，引入了更多且高质量的语料，实现了显著的性能提升，全面允许商用，进一步激发了开源社区的繁荣，拓展了大型模型的应用想象空间。ColossalAI云平台现已开启公测，注册即可获得代金券，欢迎参与并提出反馈。

LLaMA-2 开源大模型
荐CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

大语言模型黑盒，居然被CMU等机构的学者打破了?他们发现，LLM内部有可解释的表征，如果撒谎能被测谎仪检测出来!最近，来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型，并不仅仅是黑匣子，或者难以理解的庞大矩阵。在它们内部，具有可解释的内部表征。CMU等机构研究者的探索也告诉我们，人类对于AI系统的理解和控制会越

大语言模型 Llama
Meta发布Llama 2-Long模型处理长文本计算量需求减少40%

Meta最新发布的Llama2-Long模型引领着处理长文本的革命。这个模型不仅处理长文本输入在不显著增加计算需求的情况下，保持了卓越性能。它不仅改进了处理长文本的性能通过创新策略为该领域注入了新的活力。

Meta AI头条
Riiid AI模型Sheep-duck-llama-2在HuggingFace排名第一

AI教育解决方案领导者Riiid宣布，其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。HuggingFace开放式大语言模型排名中，Riiid10月提交的最新模型“Sheep-duck-llama-2”获得了74.07分的高分，在全球500多个开源生成式AI模型中位居榜首。Riiid研究人员将继续开发新的模型架构，提升AI模型性能，并以实际数据验证学习影响，在国际AI会议上发表论文。

Riiid HuggingFace
荐全面超越LLaMA2，月下载量超三百万，国产开源大模型如何成为新晋顶流？

图源备注：图片由AI生成，图片授权服务商Midjourney回想两个月前，LLaMA2的开源，曾以一己之力改变了大模型领域的竞争格局。相比于今年2月推出的第一代LLaMA，LLaMA2在推理、编码、精通性和知识测试等任务中都实现了性能的大幅提升，甚至可以在某些数据集上接近GPT-3.5。如何让大模型的能力与业务场景更好结合，同样是当下每一家大模型提供商的重点课题，也需要科技公司、学术机构和开发者共同创造。

LLaMA2 开源大模型 GPT
Meta悄然发布Llama 2 Long AI，在某些任务上击败GPT-3.5 Turbo和Claude 2

MetaPlatforms在9月29日发布了一篇计算机科学论文，介绍了其新发布的Llama2LongAI模型。该模型在某些任务上击败了GPT-3.5Turbo和Claude2，这表明Meta的开源方法在生成人工智能领域取得了重大进展。该模型的开源性也表明，开源方法在这一领域具有竞争力。

Meta Llama2 AI头条

Chat UI:开源代码库，为HuggingChat应用提供动力

chat-ui是一个开源的聊天界面，使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序，为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例，支持多种语言模型和功能，如Web搜索、自定义模型等。

开源聊天应用 SvelteKit

360AI浏览器APP:360AI 浏览器，AI 赋能，秒懂一切。

360AI 浏览器利用人工智能技术，提供智能搜索、PDF、视频、网页总结等功能，旨在帮助用户高效获取知识，提升阅读体验。

智能搜索 PDF 阅读视频播放

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

Llama 2 如何成为 IBM 战略的核心：具备潜在成功的所有要素

今日大家都在搜的词：

热文

站长商机