首页 > 业界 > 关键词  > IBM最新资讯  > 正文

Llama 2 如何成为 IBM 战略的核心:具备潜在成功的所有要素

2023-08-14 17:58 · 稿源:站长之家

站长之家(ChinaZ.com) 8月14日消息:IBM 最近宣布将在 watsonx.ai 托管 Meta 的 Llama 2-chat 700 亿参数模型,并向选择的客户和合作伙伴提供早期访问权限。

IBM

企业现在正在采用生成式人工智能的趋势来增强他们的业务战略。为了有效利用其潜力,他们需要简化的方法来训练和构建自己的 LLM,利用他们多年积累的数据。为了解决这个挑战,包括 AWS 和 Azure 在内的各种云服务提供商已加紧提供帮助。

OpenAI 与微软合作获得了 GPT-4,而 AWS 则通过多 LLM 方法给出了可以选择使用像 AI21、CohereAnthropic Claude 2 Stability AI SDXL 1.0 等多个模型选项。除了知名云服务外,最近还出现了其他几家服务提供商。

企业寻求可信赖且值得信赖的解决方案。最近,人工智能爱好者已经开发出一些方法来训练和构建 Llama 2 模型,但关键问题仍然是:这些方法是否可以可靠地处理数据?

几天前,AI 专家 Santiago 发推文称「您现在可以在不到 10 分钟内测试 Llama 2」,介绍了 Monster API 这个新工具,它可以轻松访问强大的生成式 AI 模型,如 Falcon、Llama、Stable Diffusion 和 GPT J 等,而无需担心管理这些生成式 AI 模型或扩展它们以处理大量请求。

然而,像这样的新举措对于已经建立起来的公司来说太冒险了,他们还没有证明自己能够扩展业务。

IBM 赢得了客户的信任

IBM 致力于在引入其生成式人工智能功能时优先考虑信任和安全性。例如,在用户使用 watsonx.ai 中的 Prompt lab 中使用 Llama 2 模型时,他们可以激活 AI 护栏功能。这有助于自动过滤输入提示文本和模型生成输出中的有害语言。

IBM 印度及南亚技术首席技术官兼技术销售负责人 Geeta Gurnani 表示,IBM 正在推出一款预计今年晚些时候将正式发布的 AI 治理工具包,该工具包将帮助实施治理以减轻与手动流程相关联的风险、时间和成本,并提供驱动透明可解释结果所需的文档。

她说:「它还将具备保护客户隐私、主动检测模型偏见和漂移,并帮助组织满足其道德标准的机制。」

为什么选择 Llama 2 而不是 GPT-4

Llama 2 在企业中受到了欢迎。这可以通过它在 Amazon Sagemaker、Databricks、Watsonx.ai 甚至是微软 Azure 上都可用来作为专有 LLM GPT-4 的基础来证明。

此外,Meta 与亚马逊、Hugging Face、英伟达、高通、Zoom 和 Dropbox 等多家知名公司以及学术领导者之间的合作伙伴关系强调了开源软件的重要性。

即使是深度学习领域的著名人物 Karpathy 也无法抵挡使用 Llama 2 的诱惑,他创建了 Baby Llama(又称 llama.c),他一直在探索在一台计算机上运行大型语言模型 (LLM) 的概念。此外,他甚至暗示 OpenAI 可能会在不久的将来发布开源模型

同样,AI 专家 Santiago 表示,Llama 2 具备潜在成功的所有要素:开源、拥有商业许可、成本效益高的 GPU 使用以及对整个利用过程的全面控制。

他表示:「我和两家初创公司交流过,它们正在从专有模型转向 Llama 2。还会有多少公司放弃商业替代品而选择 Llama 2 呢?」

GPT-4 只能通过微软 Azure OpenAI 服务进行访问,但企业也可以购买 OpenAI 提供的 GPT-4 API。然而,GPT-4 的限制在于其闭源性质,用户无法创建自己的模型或尝试修改其代码。与免费商用的 Llama 2 不同,GPT-4 API 是需要付费使用的。收费按照每 1000 个 tokens 计算,输入为 0.03 美元,输出为 0.06 美元。

根据 AIM Research 数据,在稍微复杂一些的应用场景中,一个月使用 GPT-4 API 进行推理可能需要花费 25 万到 30 万美元(16K 上下文长度)。因此,在使用 ChatGPT API 时必须注意标记使用情况并有效管理以控制成本。

最初观察到这一季度公司倾向于 Azure 来获取独占权访问 GPT-4,并进而提升了 Azure 云的收入。然而,当微软与 Meta 合作托管 Llama 2 时,情况发生了有趣的变化。这凸显出开源 LLM 具有独特优势,不容忽视。

举报

  • 相关推荐
  • 几千元训完中文版LLaMA2!Colossal-LLaMA-2把大模型门槛打下来了!

    从头预训练大模型被认为需要高达5000万美元的投资,这让很多开发者和中小企业望却步。Colossal-LLaMA-2的出现降低了大模型的门槛。该方案业已应用到多个行业领域,构建垂类大模型并取得良好效果。

  • Meta悄然发布Llama 2 Long AI模型

    Meta最近发布了Llama2LongAI模型,该模型在一些任务上超越了GPT-3.5Turbo和Claude2。通过改进训练方法和编码技术,Meta的研究人员提高了这个AI模型的性能,使其能够更好地处理长文本和复杂任务。强调了合作的重要性,指出不是每个企业都拥有高级的数据工程和数据科学技能,因此需要与具有相关技术和深刻了解整个领域的合作伙伴合作来解决这一问题。

  • 国产开源新标杆!20B大模型,性能媲美Llama2-70B,单卡可推理

    国产新标杆:免费可商用的200亿参数大模型,来了!书生·浦语大模型20B版本正式发布,一举刷新国内新一代大模型开源纪录。它由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学共同推出。正如林达华所说:这或许才是当下大模型趋势里,大家最应该“卷”的方向。

  • 20B量级大模型性能媲美Llama2-70B!完全开源,从基座到工具全安排明白了

    【新智元导读】国产模型开源纪录,又被刷新了!上海AI实验室等机构开源的InternLM-20B,竟然能和Llama2-70B打个平手?就在刚刚,国内开源模型参数量纪录,又被刷新了!9月20日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学,正式开源了200亿参数的InternLM-20B模型。项目地址:https://github.com/InternLM/InternLM魔搭社区:https://modelscope.cn/organization/Shanghai_AI_Laboratory这次的200亿参数版书生·浦语大模型,可以说是「加量不加价」,参数量还不到三分之一,性能却可以剑挑当今开源模型的标杆——Llama2-70B。上海AI实验室的「雪中送炭」,必然会让大模型在落地领域发挥出巨大的价值。

  • 中文LLaMA-2刷榜,开源可商用!千元预算,训练半天,效果媲美主流大模型

    最强中文版LLaMA-2来了!15小时训练,仅需数千元算力,性能碾压同级中文汉化模型,开源可商用。LLaMA-2相较于LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步激发了开源社区的繁荣,拓展了大型模型的应用想象空间。ColossalAI云平台现已开启公测,注册即可获得代金券,欢迎参与并提出反馈。

  • CMU华人打破大模型黑盒,Llama 2撒谎被一眼看穿!脑电波惨遭曝光,LLM矩阵全破解

    大语言模型黑盒,居然被CMU等机构的学者打破了?他们发现,LLM内部有可解释的表征,如果撒谎能被测谎仪检测出来!最近,来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型,并不仅仅是黑匣子,或者难以理解的庞大矩阵。在它们内部,具有可解释的内部表征。CMU等机构研究者的探索也告诉我们,人类对于AI系统的理解和控制会越

  • Meta发布Llama 2-Long模型 处理长文本计算量需求减少40%

    Meta最新发布的Llama2-Long模型引领着处理长文本的革命。这个模型不仅处理长文本输入在不显著增加计算需求的情况下,保持了卓越性能。它不仅改进了处理长文本的性能通过创新策略为该领域注入了新的活力。

  • Riiid AI模型Sheep-duck-llama-2在HuggingFace排名第一

    AI教育解决方案领导者Riiid宣布,其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。HuggingFace开放式大语言模型排名中,Riiid10月提交的最新模型“Sheep-duck-llama-2”获得了74.07分的高分,在全球500多个开源生成式AI模型中位居榜首。Riiid研究人员将继续开发新的模型架构,提升AI模型性能,并以实际数据验证学习影响,在国际AI会议上发表论文。

  • 全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?

    图源备注:图片由AI生成,图片授权服务商Midjourney回想两个月前,LLaMA2的开源,曾以一己之力改变了大模型领域的竞争格局。相比于今年2月推出的第一代LLaMA,LLaMA2在推理、编码、精通性和知识测试等任务中都实现了性能的大幅提升,甚至可以在某些数据集上接近GPT-3.5。如何让大模型的能力与业务场景更好结合,同样是当下每一家大模型提供商的重点课题,也需要科技公司、学术机构和开发者共同创造。

  • Meta悄然发布Llama 2 Long AI,在某些任务上击败GPT-3.5 Turbo和Claude 2

    MetaPlatforms在9月29日发布了一篇计算机科学论文,介绍了其新发布的Llama2LongAI模型。该模型在某些任务上击败了GPT-3.5Turbo和Claude2,这表明Meta的开源方法在生成人工智能领域取得了重大进展。该模型的开源性也表明,开源方法在这一领域具有竞争力。