首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta悄然发布Llama 2 Long AI,在某些任务上击败GPT-3.5 Turbo和Claude 2

2023-10-03 10:39 · 稿源:站长之家

本文概要:

Meta悄然发布Llama2Long AI模型,该模型在某些任务上击败了GPT-3.5Turbo和Claude2。

Llama2Long是基于Meta的开源Llama2模型,经过改进后能够更好地处理长文本和复杂任务。

Llama2Long的改进主要包括:增加了长文本数据集、修改了位置编码、使用了强化学习。

站长之家(ChinaZ.com) 10月3日 消息:Meta Platforms在9月29日发布了一篇计算机科学论文,介绍了其新发布的Llama2Long AI模型。该模型在某些任务上击败了GPT-3.5Turbo和Claude2,这表明Meta的开源方法在生成人工智能领域取得了重大进展。

AI机器人打游戏

Llama 2 Long是基于Meta的开源Llama2模型,经过改进后能够更好地处理长文本和复杂任务。该模型的改进主要包括:

  • 增加了长文本数据集:Llama2Long的数据集比Llama2大了4000亿个token,其中包括大量的长文本。

  • 修改了位置编码:Llama2Long使用了RoPE编码,该编码能够更好地处理长文本。

  • 使用了强化学习:Llama2Long使用了强化学习来提高其性能。

在测试中,Llama2Long在生成长文本、翻译语言、编写代码等任务上都取得了优异的成绩。例如,在生成长文本的任务中,Llama2Long的表现比GPT-3.5Turbo和Claude2都更好。

Llama2Long的发布是一个重要里程碑,表明Meta在生成人工智能领域取得了重大进展。该模型的开源性也表明,开源方法在这一领域具有竞争力。

举报

  • 相关推荐
  • Meta说他们的 Llama 4 偏见少了!但,“虚假对等”才是真偏见

    Meta公司称,相比之前的版本,他们最新的人工智能模型Llama4的政治偏见更少了。其中一部分便是通过允许该模型回答更多带有政治争议性的问题来实现这一点的。下次当你使用Meta的AI产品时,它可能会为“通过服用马用镇静剂来治疗新冠病毒”这种观点说好话!

  • 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

    今天凌晨1点半,Meta生成式AI领导者AhmadAl-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama4质疑进行了官方回应。Ahmad表示,Llama4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。由于关税大战的原因,Meta的股票遭遇重创,他们也需要一个利好消息来拉升股票,现在适得其反。

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • 刚刚,Llama 4深夜开源击败DeepSeek V32万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • “血亏,我花3000+元用Claude做游戏,结果还不如去「白嫖」Gemini 2.5……”

    作者分享使用AI助手开发拼字游戏的两段经历:首次用Claude花费417美元(约3042元),开发过程充满痛苦,常出现上下文失效、代码错误等问题;第二次用Gemini 2.5 Pro+Cursor完全免费,体验明显改善,能更好理解项目上下文,开发更流畅。对比指出:Claude像健忘的实习生,常搞砸项目;Gemini则像可靠的中级工程师,开发速度快且稳定。但强调AI仍需人类监督测试,无法独立产出完美代�

  • Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟

    Anthropic公司通过分析70万条Claude AI对话数据,发现其AI助手展现出独特的价值观体系。研究显示Claude遵循"乐于助人、诚实无害"的核心价值观,同时能根据不同场景灵活调整回应方式。AI表现出3307种价值观,分为实用性、认知性、社会性等五大类,其中28.2%对话强烈支持用户价值观,3%会明确抵制不当观点。研究还发现高价版AI模型价值观表达更强烈,在学术严谨性和情感�

  • Meta重组仍在继续,Reality Labs部门裁员超百人

    “提高绩效管理的标准,让绩效低下的员工尽快下岗”,扎克伯格在此前的备忘录中如是写道。同时,还敦促员工要提高积极性……

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • Claude终于能Research了,打通谷歌全家桶,工作效率10倍提升

    Anthropic推出Claude两大重磅功能:Research与Google Workspace集成!Research功能让Claude快速检索网络与内部文件,精准回答复杂问题;而与Google Workspace的深度整合,则让用户能无缝调用Gmail、日历和文档信息,轻松完成从行程规划到报告撰写的任务。今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。Anthropic称Research功能是与Claude合作的新方式。它能从多个角度分析