首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta 的人工智能模型 LLaMA 2 对所有人免费:开源将比 OpenAI 等竞争对手更具优势

2023-07-19 08:47 · 稿源:站长之家

站长之家(ChinaZ.com) 7月19日消息:Meta 正在全力推进开源人工智能该公司今天发布了 LLaMA 2,这是他们首款可供任何人免费使用的大型语言模型。

Llama2,Meta,人工智能,大语言模型,AI

自从 OpenAI 于去年 11 月发布了备受瞩目的 AI 聊天机器人 ChatGPT 以来,科技公司一直在争相发布模型,希望能够打破其主导地位。Meta 一直进展缓慢。今年 2 月,当竞争对手微软和谷歌宣布推出 AI 聊天机器人时,Meta 推出了第一个较小版本的 LLaMA,只限于研究人员使用。但他们希望发布 LLaMA 2 并允许任何人在其基础上构建商业产品,以帮助他们迎头赶上。

实际上,该公司发布了一套 AI 模型,其中包括不同规模的 LLaMA 2 版本,以及一种可以构建成聊天机器人的 AI 模型,类似于 ChatGPT。与可以通过 OpenAI 网站访问 ChatGPT 不同,该模型必须从 Meta 的合作伙伴微软 Azure、亚马逊 AWS 和 Hugging Face 下载。

Meta 负责生成 AI 工作的副总裁 Ahmad Al-Dahle 表示:「这使整个 AI 社区受益,并给人们提供了选择,他们可以选择封闭源方法或开源方法,以适应其特定的应用。」他说:「对我们来说,这是一个非常重要的时刻。」

但是仍然存在许多限制条件。根据与《麻省理工科技评论》独家共享的公司研究论文,Meta 没有公布训练 LLaMA 2 所使用的数据集信息,也不能保证其中没有包含受版权保护的作品或个人数据。LLaMA 2 也存在着困扰所有大型语言模型的问题:倾向于产生虚假信息和冒犯性语言。

Al-Dahle 表示,通过将模型发布到公众领域,并允许开发人员和公司进行调试,Meta 将从中学到如何使其模型更安全、更公正和更高效的重要经验教训。

斯坦福大学基础模型研究中心主任 Percy Liang 表示,强大的开源模型如 LLaMA 2 对 OpenAI 构成了相当大的威胁。Liang 是开源竞争对手 Alpaca 的研究团队的一员,该团队开发了 GPT-3 的早期版本。

Liang 表示:「LLaMA 2 并非 GPT-4。」并且在研究论文中,Meta 承认 LLaMA 2 和 GPT-4 之间的性能差距仍然很大,而 GPT-4 现在是 OpenAI 的最先进的 AI 语言模型。他补充说:「但对于许多用例来说,您并不需要 GPT-4。」一个更可定制和透明的模型,比如 LLaMA 2,可能会帮助公司比一个庞大、复杂的专有模型更快地创建产品和服务。

加州大学伯克利分校教授 Steve Weber 表示:「如果 LLaMA 2 能成为领先的开源替代品,这对 Meta 来说将是一次巨大的胜利。」

为了推出 LLaMA 2,Meta 进行了大量的调整,使模型比其前身更安全,更不容易产生有害虚假信息,Al-Dahle 说。

Meta 有很多过去的失误可以汲取教训。他们的科学语言模型 Galactica 在仅三天后就被下线,他们以前的仅用于研究目的的 LlaMA 模型在网上泄露,引发了一系列批评,质疑 Meta 是否充分考虑了 AI 语言模型的风险,如虚假信息和骚扰等。

为了减轻重复这些错误的风险,Meta 应用了一系列不同的机器学习技术,旨在提高 LLaMA 2 的实用性和安全性。

Meta 的研究人员 Sasha Luccioni 表示,相比于一般生成式 AI 模型,训练 LLaMA 2 需要更多步骤。据 Al-Dahle 表示,该模型使用了比其前身多 40% 的训练数据。其中训练数据有两个来源:从在线抓取的数据,以及根据人类标注员的反馈进行微调和调整,以表现出更理想的方式。公司表示 LLaMA 2 没有使用 Meta 用户数据,并排除了已知含有大量个人信息的网站的数据。

尽管如此,LLaMA 2 仍然会产生冒犯、有害和其他问题语言,就像其他竞争对手的模型一样。Meta 表示没有从数据集中删除有害数据,因为将其保留下来可能有助于 LLaMA 2 更好地检测仇恨言论,而删除它可能会意外地筛选掉某些人群。

Luccioni 表示,Meta 的开放承诺令人兴奋,因为它允许像她这样的研究人员能够适当地研究 AI 模型的偏见、道德和效率。

LLaMA 2 作为一个开源模型,也将允许外部研究人员和开发人员对其进行安全漏洞的探索,这将使其比专有模型更安全,Al-Dahle 表示。

Liang 也表示同意:「我非常兴奋地尝试一些东西,我认为这将对社区有益。」

举报

  • 相关推荐
  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • Meta说他们的 Llama 4 偏见少了!但,“虚假对等”才是真偏见

    Meta公司称,相比之前的版本,他们最新的人工智能模型Llama4的政治偏见更少了。其中一部分便是通过允许该模型回答更多带有政治争议性的问题来实现这一点的。下次当你使用Meta的AI产品时,它可能会为“通过服用马用镇静剂来治疗新冠病毒”这种观点说好话!

  • 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

    今天凌晨1点半,Meta生成式AI领导者AhmadAl-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama4质疑进行了官方回应。Ahmad表示,Llama4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。由于关税大战的原因,Meta的股票遭遇重创,他们也需要一个利好消息来拉升股票,现在适得其反。

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 声通科技汤敬华:寻找可信、靠谱的人工智能技术

    声通科技董事长汤敬华在第三届数字化发展大会上表示,人工智能进入商业领域必须可信可靠。该公司专注交互式AI20年,提出"可信AI实现架构",强调AI需根据不同场景设定合理准确度标准(80%-99.9%),而非追求100%完美。他指出可信AI需要技术支撑与综合能力,包括数据训练、平台可信度及持续运营能力。声通科技已形成覆盖智慧城市、金融等领域的全栈式解决方案,并与商创院成立可信AI实验室,推动产学研合作。汤敬华认为,AI发展需平衡安全与创新,重大决策过程必须透明可靠。

  • 刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • 首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

    快科技4月17日消息,今日,OpenAI新款AI模型o3、o4-mini重磅发布,这是OpenAI迄今最强、最智能的模型。据了解,OpenAI o3/o4-mini首次具备真正的视觉推理能力,看图识图已经是小菜一碟了,现在还会看图思考。OpenAI o3/o4-mini能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。通过强化学习,OpenAI训练了o3/o4-mini如何�

  • “十年内就会被人工智能取代”,ChatGPT 们可以取代律师吗?

    每个人都知道直接与律师、医生、会计们交谈,会比找 ChatGPT 更好。但我们仍然更倾向于使用 ChatGPT……

  • 锚定AI技术,艾力斯特深度布局人工智能康复医疗领域

    2025年3月21日,iRest艾力斯特在温州召开"AI+康复与产学研融合创新高峰论坛暨经销商大会"。大会汇聚全球顶尖学者、行业专家及千余名经销商代表,围绕智能康复、人工智能与医疗健康的融合展开深入探讨。公司宣布将重点布局脑机接口技术在康复设备中的应用,并接入DeepSeek AI系统实现个性化健康管理。iRest总裁周玲卫提出三大目标:建立全球无感信息感知优势、打造国际化研发高地、推动科技成果产业化。企业还与浙江省残疾人福利基金会达成战略合作,推动智能康复设备进社区、进家庭。作为中国按摩器具行业领军企业,iRest持续深耕智能康复领域,通过技术创新实现从实验室到家庭医疗场景的全面普及。