首页 > 业界 > 关键词  > Together最新资讯  > 正文

Together AI 推出 Llama-2-7B-32K-Instruct:扩展上下文语言处理能力

2023-08-22 10:11 · 稿源:站长之家

站长之家(ChinaZ.com)8月22日 消息:Together AI 发布了 Llama-2-7B-32K-Instruct:一项在语言处理中扩展上下文的突破。这项创新具有重大意义,特别是在需要对复杂上下文细微差别有深刻理解的任务中。

该模型通过巧妙地利用 Together Inference API 的能力,成功地处理了长篇指令,同时在短篇情境下表现出色。

image.png

项目地址:https://together.ai/blog/llama-2-7b-32k-instruct

经过一系列严格的步骤,Llama-2-7B-32K-Instruct 的成功得益于多样的数据集,包括对话、人类指令和 Llama-2-70B-Chat 的输出。

模型经过精细调整后,通过在各种任务中的表现进行评估,并与现有基准模型进行比较,如 GPT-3.5-Turbo-16K、Llama-2-7b-chat、Longchat-7b-16k 和 Longchat-7b-v1.5-32k 等。

结果显示,Llama-2-7B-32K-Instruct 在处理长篇指令时表现出色,并在各种基准测试中取得了优异的成绩。这一突破将为语言处理带来新的进展,架起了理解复杂上下文和生成相关回应之间的桥梁。

举报

  • 相关推荐
  • Meta说他们的 Llama 4 偏见少了!但,“虚假对等”才是真偏见

    Meta公司称,相比之前的版本,他们最新的人工智能模型Llama4的政治偏见更少了。其中一部分便是通过允许该模型回答更多带有政治争议性的问题来实现这一点的。下次当你使用Meta的AI产品时,它可能会为“通过服用马用镇静剂来治疗新冠病毒”这种观点说好话!

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

    今天凌晨1点半,Meta生成式AI领导者AhmadAl-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama4质疑进行了官方回应。Ahmad表示,Llama4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。由于关税大战的原因,Meta的股票遭遇重创,他们也需要一个利好消息来拉升股票,现在适得其反。

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • Llama 4五大疑点曝光,逐层扒皮,全球AI进步停滞,NYU教授称Scaling彻底结束

    令人失望的Llama4,只是前奏已。接下来我们恐将看到——全球局势的改变,将彻底阻止AI进步!最近,一位AICEO做出长视频,逐级对Llama4身上的六大疑点进行了扒皮。GaryMarcus正在寻找对开发更可靠替代方法有兴趣的投资者。

  • 刚刚,Llama 4深夜开源击败DeepSeek V32万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • MCP协议是什么?Model Context Protocol模型上下文详解

    在当今快速发展的AI时代,如何高效地将AI助手与各类数据系统连接起来,成为了一个亟待解决的问题。MCP协议应运生,它是由Anthropic公司提出并开源的一种开放标准协议,通过提供一个统一的开放标准,极大地简化了AI系统与数据源之间的连接,使得AI系统能够更可靠地访问所需数据,从产生更相关、更优质的响应。通过与AIbase的紧密结合,MCP协议能够更好地发挥其优势,为AI技术的发展提供更强大的动力。

  • AI日报:阿里新模型Qwen3即将来袭;GitHub开源MCP服务器;Runway发布Gen-4 Turbo

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布,标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好,场景

  • AI革新了电子商务营销:认识AID Lab的PhotoG

    在当今快速发展的消费格局中,全球生活方式市场前所未有地蓬勃发展。在Z时代重视个性化体验的消费者的推动下,从家居装饰到日常必需品的行业正在经历前所未有的繁荣。通过提高创意效率和实现卓越的消费者体验,PhotoG有望重新定义技术、设计和商业之间的交叉点。