首页 > 业界 > 关键词  > Together最新资讯  > 正文

Together AI 推出 Llama-2-7B-32K-Instruct:扩展上下文语言处理能力

2023-08-22 10:11 · 稿源:站长之家

站长之家(ChinaZ.com)8月22日 消息:Together AI 发布了 Llama-2-7B-32K-Instruct:一项在语言处理中扩展上下文的突破。这项创新具有重大意义,特别是在需要对复杂上下文细微差别有深刻理解的任务中。

该模型通过巧妙地利用 Together Inference API 的能力,成功地处理了长篇指令,同时在短篇情境下表现出色。

image.png

项目地址:https://together.ai/blog/llama-2-7b-32k-instruct

经过一系列严格的步骤,Llama-2-7B-32K-Instruct 的成功得益于多样的数据集,包括对话、人类指令和 Llama-2-70B-Chat 的输出。

模型经过精细调整后,通过在各种任务中的表现进行评估,并与现有基准模型进行比较,如 GPT-3.5-Turbo-16K、Llama-2-7b-chat、Longchat-7b-16k 和 Longchat-7b-v1.5-32k 等。

结果显示,Llama-2-7B-32K-Instruct 在处理长篇指令时表现出色,并在各种基准测试中取得了优异的成绩。这一突破将为语言处理带来新的进展,架起了理解复杂上下文和生成相关回应之间的桥梁。

举报

  • 相关推荐
  • Intel Panther Lake首发版本曝光!其它等明年

    快科技5月2日消息,根据最新消息,今年底英特尔将推出PantherLake处理器的首个SKU4P 8E 0LPE 4Xe版本,其他配置版本则要等到2026年初才会发布。4P 8E配置版本与此前传闻的4P 8E 4LPE 12Xe版本有所不同,该版本版本不包含LPE核显,搭配的是4个Xe3GPU核心。该版本TDP为45W,明显高于LunarLake的17W至28W,综合来看,这一配置显然更适合游戏笔记本,因为在这种设备中,集成显卡的重要性相对较低。目前PantherLake已曝光的SKU共有四个,具体如下:4P-Cores 8E-Cores 0LP-ECores 4Xe3Cores(45W)4P-Cores 8E-Cores 4LP-ECores 12Xe3Cores(25W)4P

  • BTC披萨节遇上TRUMP晚宴,HTX送出百万USDT狂欢福利

    HTX交易所为庆祝5月22日比特币披萨节与TRUMP晚宴,推出多重福利活动。活动包括:1)"加密披萨节"主题福利,完成5档任务可抽奖,奖品含HTX周年礼包、披萨券等;2)新老用户参与四重福利活动,瓜分20万美元奖池;3)知识答题赢200 USDT;4)理财享最高10%年化补贴;5)C2C交易瓜分1万USDT;6)KOL专场赢茅台;7)闪兑交易赛瓜分1万USDT。活动覆盖现货、合约、C2C等多场景,�

  • 技术创新驱动Web3新篇章:TRON金牌赞助ETH Beijing黑客松2025

    2025年5月16-18日,ETH Beijing黑客松在北京盛大举行。TRON作为金牌赞助商亮相,展示其公链生态优势:采用DPoS共识机制,3秒出块,理论峰值TPS超2500,零手续费转账。截至2025年5月,TRON链上用户超3.07亿,总交易量破103亿次,TVL达230亿美元。USDT-TRC20流通规模超750亿美元,占全球USDT供应量50%。TRON还布局AI、RWA等领域,设立1亿美元AI基金,并与多米尼加政府合作成为其国家公链。BTTC作为跨链解决方案,支持TRON、以太坊等主流链互操作,交易确认仅2-3秒,成本低于1美分。活动期间,TRON与北京大学区块链协会合作,推动高校与Web3行业深度链接。

  • 技嘉推出 STEALTH ICE 系列 AMD X870/B850 背插主板

    技嘉科技推出Project STEALTH系列,创新采用主板背插设计,将接口移至背面,简化装机布线流程。新一代STEALTH ICE系列包含AMD X870/B850主板与C500全景机箱,主打纯白美学与270度全景视角,兼顾视觉美感与装机便利性。该设计不仅释放机箱内部空间,便于展示水冷和RGB灯效,更与海盗船、分形工艺等10余家厂商合作,推出20余款兼容机箱,拓展用户选择。Project STEALTH通过工艺革新,为追求简约设计或高性能白色主机的用户,提供兼具美观与实用性的DIY解决方案。

  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • Agent真的卷疯了,AI办公Agent也来了。

    ​我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 这玩意就是昆仑万维的Skywork Super Agents。

  • Anthropic 发布 Claude 4 系列 AI 模型,有啥重大突破?

    Anthropic 表示,这两款 AI 模型在多个行业基准测试中表现出色,是目前业内最强的模型之一……

  • 联想ThinkCentre neo Ultra 2025迷你机发布:RTX 5060/Ti桌面版、14999元起

    快科技4月29日消息,在日前的联想Think AI终端2025春季发布会上,联想正式推出了ThinkCentre neo Ultra 2025 AI元启版。这款迷你主机沿用了上一代的外观设计,体积为3.6升,配备了英特尔酷睿Ultra系列桌面处理器和NVIDIA RTX 5060/5060 Ti桌面版显卡。具体配置方面,ThinkCentre neo Ultra 2025目前公布售价的有两个版本:RTX 5060版本:配备英特尔酷睿Ultra 5处理器、32GB内存和1TB固态硬盘,售价为14999元。RTX 5060 Ti版本:配备英特尔酷睿Ultra 7处理器、32GB内存和1TB固态硬盘,售价为19999元。还有英特尔酷睿Ultra 7处理器 RTX 5060

  • 1/8成本比肩Claude 3.7,Mistral Medium 3来了

    欧洲AI公司Mistral发布多模态新模型Mistral Medium 3,主打编程和多模态理解能力,性能达Claude 3.7的90%但成本仅1/8(输入0.4美元/百万token)。该模型在编程和STEM任务表现突出,支持企业级定制部署,已上线多个云平台。同时推出企业聊天机器人服务Le Chat Enterprise,集成第三方工具。尽管因未开源权重引发争议,其高性价比仍获业界关注。公司透露正在开发更大规模模型。

  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。