Abacus AI 推出开放式上下文大语言模型Long Context

2023-08-04 15:38 · 稿源：站长之家

站长之家（ChinaZ.com）8月4日消息:Abacus.AI LLM Context Expansion 是一款能够扩展语境长度的工具，可以帮助用户扩展模型的语境长度，提高模型对长文本的处理能力。该工具基于 Abacus.AI 的 LLM（Language Model for Long-form Content）架构，提供了一系列代码和工具，用于增加模型对长文本的理解能力。通过预训练和微调，该工具可以使模型在处理超过2048个单词的文本时仍然能够保持高效和准确。

项目地址:https://github.com/abacusai/Long-Context

要点:

1、Abacus AI 的研究人员通过多次实验，发现将 LLMs 的上下文长度能力扩展到更长的上下文是可行的。

2、研究人员使用不同的方法对 RedPajama 数据集进行了 fine-tune，并发现线性缩放方法在模型上下文长度上效果良好，而截断和随机化方法在检索任务上效果较差。

3、通过评估模型在不同数据集上的表现，研究人员发现将上下文长度进行缩放可以显著提高模型的性能，进而改进模型的困惑度，并更好地捕捉文档的主题。

4、Abacus.AI LLM Context Expansion 提供了评估脚本和基准任务，用于评估模型在信息检索方面的能力，并提供了重要的实验结果和复现指南，以帮助用户进一步改进和构建自己的模型。

5、Abacus.AI提供预训练模型权重，对于表现最好的模型（线性插值 + 指令微调，在缩放因子为4和16时），该工具提供了预训练模型的权重，方便用户直接使用或进行自己的测试。

（举报）

相关推荐

关键词：

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

StarRocks Connect 2025峰会圆满落幕，聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家，分享StarRocks在复杂业务场景中的实践，探讨技术演进方向。从性能引擎到AI原生平台，StarRocks 4.0将支持多智能体协作框架，提升数据分析效率。多家企业展示应用案例，覆盖电商、金融、旅游等领域，验证了其高性能与成本优势。开源精神推动技术创新，共同探索数据智能的无限可能。

StarRocks 数据分析 AI
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
2025 HarmonyOS Connect伙伴峰会顺利举办，小豚当家携黑科技新品精彩亮相！

2025年9月26日，HarmonyOS Connect伙伴峰会在深圳举行。小豚当家作为鸿蒙智选生态首批伙伴，发布首款搭载鲸瞳影像的户外摄像头鲸瞳Max，实现0.01Lux暗光全彩成像，破解日夜全彩难题。产品集成星瀚AI大模型，具备主动思考与看懂能力，推动家庭安防进入“看懂时代”。同时打通家庭存储，构建全链路安防体系，支持多设备联动与多终端共享。小豚当家与鸿蒙智选合作六年，多款产品完成HarmonyOS适配，实现无缝协同。此次发布标志着家庭安防生态迈出重要一步。

HarmonyOS Connect 鸿蒙智选
声启未来新章 BANG & OLUFSEN 铂傲推出全新Beo grace耳机

Bang & Olufsen推出全新无线耳机Beo Grace，融合纤薄铝制机身与卓越音质，体现品牌对声学创新与永恒设计的追求。耳机灵感源自高级珠宝，采用标志性抛光铝材打造，支持杜比全景声与自适应主动降噪技术，降噪效果较前代提升四倍。配备12毫米钛金属驱动单元，续航达4.5小时（搭配充电盒可达17小时），具备IP57防水防尘。通过NearTap™手势操控与定制电池管理系统，兼顾便捷使用与长效耐用，开启可佩戴声学新纪元。

Bang & Olufsen
性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

百度发布超轻量级文字识别模型PP-OCRv5，仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型，尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别，适用于教育、医疗、法律等多行业数字化需求，累计下载量超900万，是GitHub上唯一Star数超5万的中国OCR项目。

PP-OCRv5 轻量级OCR 文字识别模型
Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

Reviews.ai是一个消费者反馈聚合平台，帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析，通过AI驱动功能（如按需报告、主题分类和智能代理）提升产品与服务。近期从Review Monitor更名后，团队迁移至DigitalOcean云平台，解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成，仅用数周，成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器，支持灵活扩展。未来计划利用GPU Droplets增强AI能力，进一步优化大型语言模型处理效率。

消费者反馈品牌洞察评论分析
ColorOS 16阶段性爆料总结：拥有安卓首个跨级融合编译技术

ColorOS 16将于10月15日正式发布，流畅度、AI、设计、互联四大方面全面升级。系统带来安卓首个无缝架构和芯片级动态追帧技术，确保全场景流畅体验；AI功能全面覆盖相册、便签等日常应用，新增AI人像补光、AI写作等实用功能；设计语言全新升级，图标动画交互全面优化；生态互联支持通知流转、电脑投屏等跨设备协同。目前Beta版已开启招募，支持一加13、Find X8系列等多款机型。

ColorOS16 流畅度 AI功能
荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型

今日大家都在搜的词：

热文

3 天
7天

Abacus AI 推出开放式上下文大语言模型Long Context

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

2025 HarmonyOS Connect伙伴峰会顺利举办，小豚当家携黑科技新品精彩亮相！

声启未来新章 BANG & OLUFSEN 铂傲推出全新Beo grace耳机

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

ColorOS 16阶段性爆料总结：拥有安卓首个跨级融合编译技术

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

OPPO Find X9系列定档：10月16日发布

鸿蒙智行享界S9T上市13天大定破 15000 台

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

iPhone调休闹钟上热搜苹果客服回应：需手动设置

罗永浩替小米说公道话：海报小字是行业陋习

站长商机