首页 > 热点 > 关键词  > 大模型最新资讯  > 正文

360智脑7B参数大模型正式开源 最长支持约50万字输入

2024-04-15 09:03 · 稿源:站长之家

站长之家(ChinaZ.com)4月15日 消息:360公司自主研发的7B参数大模型——360智脑,现已正式上线开源社区,并提供了基础模型以及4K、32K、360K三种不同文本长度的版本。

这一大模型在支持文本长度方面表现出色,最长可处理360K长文本,相当于约50万字的输入内容。令人惊叹的是,仅需3秒钟,它便能读完整部《三体》。

目前,在开源模型领域,360智脑7B无疑是支持文本长度最长的大模型之一。

微信截图_20240415090449.png

为了方便开发者使用,360智脑7B大模型不仅提供了全套的微调训练代码和推理代码工具集,而且实现了开箱即用。这一举措极大地简化了开发流程,让行业无需再为处理长文本而犯愁。

性能评估方面,360智脑7B大模型同样表现出色。通过OpenCompass与国内外同参数模型进行对比,其综合能力排名前三。在C-Eval、MMLU、HellaSwag、LAMBADA等多项能力测试中,360智脑7B均获得了第一的成绩,显示出强大的中英文知识和推理理解能力。即便是面对“弱智吧”贴吧的“刁难”,它也能从容不迫地作出清晰应答。

在LongBench评测中,360智脑7B大模型的长文本处理能力同样令人瞩目。在同等参数模型的测评中,它成功拿下最高分。同时,在中英文360K大海捞针效果测试中,也取得了超过98%的高分。这一成绩的背后,得益于360智脑7B采用的无损压缩技术,它摒弃了传统的滑动窗口attention、跳跃attetion等有损压缩路线,实现了超长文本的无损处理

项目地址:https://github.com/Qihoo360/360zhinao

举报

  • 相关推荐
  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 1024数百场活动致敬鸿蒙开发者,鸿蒙如何与开发者“双向奔赴”

    在1024程序员节之际,华为鸿蒙生态发起"星光不负 码向未来"致敬活动,通过全国超百场开发者交流,展现鸿蒙生态的蓬勃活力。目前HarmonyOS 5终端设备数已突破2300万,上架应用超3万款,鸿蒙游戏超1.2万款,近400款政务应用完成鸿蒙适配。华为每年投入超60亿元激励创新,并启动"鸿蒙天工计划"投入10亿元支持AI生态建设。从HarmonyOS 5到HarmonyOS 6,鸿蒙生态正从"破冰"走向深度融合创新,这离不开千万开发者的智慧与汗水。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 润开鸿重磅发布DAYU300与DAYU600,入选开源鸿蒙面向PC场景及移动智能终端场景主干开发平台

    近日,开源鸿蒙技术大会2025在长沙举办。江苏润开鸿公司发布基于开源鸿蒙的DAYU300和DAYU600开发平台,分别面向PC及移动智能终端场景,支持多样化设备创新。同时,开源鸿蒙6.0版本发布,在ArkUI组件、窗口能力等方面实现突破,提升开发效率与用户体验。润开鸿将持续推动开源鸿蒙生态建设,加速行业应用落地。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • 1:16、160G,以太彩光的新标杆

    本文探讨了以太彩光技术作为园区网全光化的解决方案。随着数字化和AI发展,园区网面临带宽、时延和覆盖密度等挑战。传统以太网和PON方案存在架构复杂或带宽共享问题。以太彩光结合以太网协议与波分复用技术,通过单纤实现点到多点直连架构,提供专属波长和独享带宽。锐捷网络的4.0方案创新实现1:16高收敛比和单端口160G带宽,大幅简化网络结构,降低布线成本和运维复杂度,为未来业务增长奠定基础。

  • 小鹏X9增程版官宣!63.3电+60L大油箱 综合续航1602km

    小鹏汽车董事长何小鹏10月23日宣布,小鹏X9超级增程车型正式发布,定位为面向全球的下一代增程产品。该车作为行业首款超级增程车型,搭载63.3度大电池与60L大油箱,综合续航达1602公里,号称全球续航最长七座车。历经全球复杂环境严苛验证,设计棱角分明,配备主动进气格栅优化风阻。新车长宽高5316*1988*1785mm,轴距3160mm,定位七座MPV,整备质量2750千克。动力采用1.5T增程器,最大功率110千瓦,匹配磷酸铁锂电池包,支持800V高压平台与5C超充技术,纯电续航超450公里,彻底解决里程焦虑。

  • 2025 vivo开发者大会:人文科技铺就信息无障碍之路

    10月10日,vivo在深圳成功举办2025开发者大会,发布全新系统OriginOS 6及自研蓝河操作系统3,搭载AI蓝心大模型,升级信息无障碍功能。聚焦视障与听障用户需求,推出“智能记忆”“实时环境问答”“声音记忆”等创新功能,通过科技赋能改善用户体验。vivo强调“科技向善”,持续投入公益合作,助力无障碍环境建设,推动包容性数字未来。

今日大家都在搜的词: