首页 > AI头条  > 正文

上海 AI 实验室发布科学多模态模型书生Intern-S1-Pro

2026-02-05 08:53 · 来源: AIbase基地

上海 AI 实验室于 2 月 4 日正式发布了全球开源参数规模最大的科学多模态模型 ——“书生 Intern-S1-Pro”。这一突破性的模型基于 “通专融合” 技术架构 SAGE,所拥有的参数数量高达 1 万亿,成为当前开源社区中的一颗耀眼明珠。

“书生 Intern-S1-Pro” 模型的核心科学能力达到了国际领先水平,特别是在高难度综合学科评测中,显示出超强的逻辑推理能力,甚至可以达到奥林匹克竞赛金牌选手的水平。同时,该模型在处理真实科研流程中的智能体能力上,位居开源模型的第一梯队,这无疑为科研人员提供了更加强大的工具。

这款模型采用了混合专家架构(MoE),共配置了 512 个专家,每次调用时仅激活 8 个专家,使用 22 亿个参数。这样的设计不仅使得模型在计算效率上得到了优化,也大大降低了资源消耗。在底层架构上,“书生 Intern-S1-Pro” 实现了两项重要突破。首先,通过引入傅里叶位置编码和重构时序编码器,模型获得了从微观生命信号到宏观宇宙波动的 “物理直觉”,具备了更强的理解能力。其次,采用高效路由机制,解决了训练万亿参数模型时的稳定性和算力效率瓶颈,为超大规模模型的训练奠定了基础。

值得一提的是,“书生 Intern-S1-Pro” 不仅是一个学术模型,更为未来构建开放共享的 AGI4S(人工智能为科学)基础设施打下了坚实的基础。通过原创的模型架构与自主的算力技术,上海 AI 实验室展现了中国在人工智能领域的实力与潜力。

为了让更多的用户体验这一先进模型,上海 AI 实验室还提供了在线体验和开源地址,方便开发者和研究者进行进一步的探索。





  • 相关推荐
  • 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

    今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�

  • 新品发布 | 算力升级 全能进化 铭凡AI X1 Pro 470正式上市

    铭凡AI X1 Pro 470迷你主机全球首发搭载AMD Ryzen AI 9 HX 470处理器,相比前代实现核心性能跨越式提升。AI算力升级至55 TOPS,支持主流大模型本地部署,摆脱云端依赖。扩展能力优化,新增前置USB4接口,支持三M.2 SSD插槽与最高128GB内存。配备HDMI 2.1与DP 2.0接口,支持四屏4K输出,OCuLink接口外接显卡兼容性大幅提升。散热采用相变材料与双纯铜热管,满载温度低于80℃,噪音控制在45dB内。该机兼顾AI开发、高效办公、游戏影音与专业创作,以紧凑机身承载全场景强悍实力。

  • iPhone 18 Pro会让你失望:叫iPhone 17S Pro更贴切

    知名苹果爆料人MarkGurman表示,即将到来的iPhone18Pro和iPhone18ProMax不会有重大更新,可能会让你失望。iPhone18Pro系列更贴切的名字或许应该是iPhone17SPro。对于追求新鲜感的果粉来说,那台能够折叠的iPhone或许才是今年真正的惊喜iPhone18Pro系列则更像是为追求极致稳定的专业用户准备的一份标准答案。

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • 小米发布机器人基座模型Xiaomi-Robotics-0

    小米机器人团队开源发布全新具身智能VLA模型Xiaomi-Robotics-0,参数规模达47亿,具备视觉语言理解与高性能实时执行能力。该模型在三大主流仿真测试中横扫行业标杆,拿下全项SOTA成绩,并在真实机器人上实现流畅动作。其创新点在于能在消费级显卡上实现实时推理,打破高端模型依赖昂贵专业显卡的局限,降低技术落地门槛。小米自研的Mixture-of-Transformers架构为机器人装上“�

  • 唯卓仕发布 AF 50mm F1.4 Pro 等多款新品,夯实全能影像伙伴定位

    在近日举办的2026年首场线上发布会上,国产光学品牌唯卓仕(Viltrox)集中展示了其持续拓宽产品生态的决心。发布会不仅揭晓了品牌加入 L 卡口联盟后的首款力作 AF16mm F1.8L,推出了 Air 系列镜头“雾月银”及闪光灯“新年红”限定配色,更正式为旗下备受瞩目的“Pro”系列镜头阵营增添了 Z 卡口新成员——AF50mm F1.4Pro 自动对焦镜头。此举标志着唯卓仕在高性能镜头领域的布局

  • AI日报:字节发布Seedream5.0Lite;小红书不标AI将限流;美图开拍首批接入Seedance 2.0大模型

    本期AI日报涵盖多项重要动态:字节跳动发布具备视觉推理与实时联网能力的图像创作模型Seedream5.0Lite;小红书要求AI生成内容须显著标识;美图工具“开拍”接入Seedance 2.0大模型以提升视频创作效率;OpenAI在ChatGPT中上线广告业务以应对成本压力;OpenAI与Cerebras合作推出专为实时编程优化的GPT-5.3-Codex-Spark;蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T;Google发布在编程与科研领域实现突破的Gemini 3 Deep Think;同程旅行全面接入腾讯元宝,通过AI实现秒级行程规划与预订。

  • 酷哇发布 WAM 2.0 世界模型,加速构建“自动驾驶+机器人”RoboCity 新基建

    酷哇科技发布通用世界模型底座Coowa WAM2.0,并率先实现年度EBITDA回正。公司已完成从“单点技术”向“城市通用智能”的战略跃迁,构建起“技术底座+商业规模”双轮驱动体系,开启万台级“城市新基建”规模化部署。依托三大业务矩阵(智慧出行、智慧物业、智慧城市管家),酷哇已在全球超50个城市实现商业化落地,累计安全运营里程突破500万公里。其规模化订单市场占有率约80%,一线城市业务占比从2022年的不足2%跃升至2025年的25%,客户长期价值认可度持续提升。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 世界顶尖科学家协会发布OPENSCI项目:探索开放科学基础设施的未来路径

    世界顶尖科学家协会近日发布开放科学基础设施项目OPENSCI,旨在利用区块链与人工智能技术,构建一个去中心化的全球科研协作网络。该项目计划于2026年迪拜世界顶尖科学家峰会期间正式推出,致力于实现科学知识的长期保存、可信验证与跨学科合作。OPENSCI将支持科研成果、假说与数据集的记录与验证,形成透明、可追溯的知识基础,为全球科研提供可持续支撑。

今日大家都在搜的词: