首页 > AI头条  > 正文

书⽣·浦语2.5——InternLM2.5-7B模型宣布开源 支持处理百万字长文

2024-07-08 08:34 · 来源: AIbase基地

2024年7月3日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.5(InternLM2.5)。

InternLM2.5-7B模型已开源,其他规模的模型也将陆续开源。上海人工智能实验室承诺继续提供免费商用授权,并通过高质量开源模型支持社区创新。

微信截图_20240708083247.png

该模型在以下方面有显著提升:

  1. 推理能力:InternLM2.5的推理能力显著增强,部分维度超越了Llama3-70B模型,特别在数学评测集MATH上实现了100%的性能提升,准确率达到60%,与GPT-4Turbo1106版本相当。

  2. 长文本支持:模型支持高达1M tokens的上下文,即能处理约120万汉字的长文,通过增加上下文长度和合成数据,优化了长文档理解与智能体交互。

  3. 自主规划与工具调用:具备搜索和整合上百个网页信息的能力,通过MindSearch多智能体框架,模拟人的思维过程,有效整合网络信息。

Github链接:https://github.com/InternLM/InternLM

模型链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2_5-7b-chat

书生·浦语主页:https://internlm.intern-ai.org.cn/

  • 相关推荐
  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • 全2.5G网口弱电箱神器!中兴星云MAX主路由小白也能秒懂全屋组网

    中兴星云MAX作为首款2.5G网口全屋主路由,专为国内家庭以信息箱布线场景设计,简化传统复杂组网流程,实现即插即用。其强大性能支持WiFi6/7/8平滑升级,配备自研处理器与双WAN口,可承载多设备高速传输。一体化小巧机身适配标准信息箱,通过有线连接子路由,无需复杂设置即可完成全屋覆盖。同时提供USB接口扩展NAS功能,构建家庭私有云,结合智能App实现远程管理、青少年管控等,兼顾易用性与高性能,首发价269元。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 出国不怕没信号!真我GT8 Pro支持21个5G频段 新增n79频段

    真我GT8系列将于10月发布,将带来真我GT8和真我GT8 Pro两款机型,新机目前已进入预热节奏。 今日,真我副总裁王伟发文称,真我GT8 Pro的信号表现又有新的突破,包括苍穹通信系统全新升级和新增n79频段。 据介绍,真我GT8 Pro将首发苍穹信号芯片S1,能定向增强n78、n41两大核心频段性能,识别并切换到最佳频段,降低弱网环境下游戏延迟。 同时行业首创苍穹电竞五天线,设置�

  • 开源鸿蒙技术大会2025圆满举办,凝聚开源力量勾勒万物智联新未来

    2025年9月27日,开源鸿蒙技术大会在长沙国际会议中心召开。大会由开源鸿蒙项目群技术指导委员会主办,华为承办,多家企业及高校协同支持。会议汇聚了行业专家、开发者及生态伙伴,展示了鸿蒙在技术创新、生态建设及人才培养方面的成果,并发布开源鸿蒙6.0版本,提升系统性能与开发效率。大会聚焦智能化发展,探讨操作系统在数字经济的核心价值,推动产业协同与生态共建。长沙市政府表示将依托鸿蒙生态,加速数字经济发展,共同构建万物智联的坚实底座。

  • 考拉悠然开源悠然无界大模型BLM-1.0,以空间智能引擎驱动产业变革

    9月28日,在成都举行的“2025天府人工智能产业生态大会”上,考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源,同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略,推动空间智能产业生态共建。BLM-1.0突破传统模型局限,具备跨空间、跨任务、跨本体的“三跨”统一能力,在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互,实现工业运维、安装巡检等场景的全程自动化与智能辅助,显著提升效率并降低成本。

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

  • 00后小伙做老房子微缩模型年入百万:200元成本售1万

    ​近日,一位00后小伙凭借其精湛的手艺和独特的创意,在微缩模型领域大放异彩,年收入突破百万大关,成为众人瞩目的焦点。他专门制作老房子的微缩模型,不仅还原度极高,更融入了深厚的文化底蕴和情感记忆,深受市场欢迎。 据悉,这位小伙从小就对传统建筑和手工艺术充满热爱,大学期间更是深入研究微缩模型制作技艺。毕业后,他毅然决然地投身于这一领域,凭�

今日大家都在搜的词: