首页 > AI头条  > 正文

上海AI实验室开源InternVL3系列多模态大型语言模型

2025-04-14 08:37 · 来源: AIbase基地

4月11日,OpenGVLab开源发布了InternVL3系列模型,这标志着多模态大型语言模型(MLLM)领域迎来了新的里程碑。InternVL3系列包含从1B到78B共7个尺寸的模型,能够同时处理文字、图片、视频等多种信息,展现出卓越的整体性能。

与前代产品InternVL2.5相比,InternVL3在多模态感知和推理能力上有了显著提升,其多模态能力进一步扩展至工具使用、GUI代理、工业图像分析、3D视觉感知等多个领域。此外,得益于原生多模态预训练,InternVL3系列的整体文本性能甚至优于Qwen2.5系列,后者是InternVL3中语言组件的初始化部分。

微信截图_20250414083602.png

InternVL3系列模型的架构延续了“ViT-MLP-LLM”范式,用随机初始化的MLP projector将全新增量预训练的InternViT与各种预训练的LLM(包括InternLM3和Qwen2.5)集成。

在模型推理方面,InternVL3应用了像素反混洗操作,将视觉标记数量减少到原来的四分之一,并采用动态分辨率策略,将图像划分为448×448像素的图块。从InternVL2.0开始,关键区别在于额外引入了对多图像和视频数据的支持。InternVL3还集成了可变视觉位置编码(V2PE),为视觉标记提供了更小、更灵活的位置增量,从而展现出更出色的长上下文理解能力。

在模型部署方面,InternVL3可以通过LMDeploy的api_server部署成OpenAI兼容API,用户只需安装lmdeploy>=0.7.3,然后使用相关命令即可完成部署。模型调用时,用户可以通过OpenAI的API接口,指定模型名称、消息内容等参数,获取模型的响应。

体验地址:https://modelscope.cn/collections/InternVL3-5d0bdc54b7d84e

  • 相关推荐
  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 国内首个!海尔智家获评TÜV认可智能家电检测免目击实验室

    海尔全球检测中心近日通过TÜV莱茵2025年度认证评审,升级为免目击实验室。这是国内首个在智能家电检测领域获此资质的企业,标志着其检测实力获国际权威认可。该资质可大幅缩短认证周期,提升产品上市效率,助力企业抢占市场先机。海尔还拥有CNAS、UL等多项国际认证,实现检测数据互认,未来将持续创新检测技术,为全球用户提供更优质产品体验。

  • 小猪逃跑狂奔 校方:已送回实验室 是科研动物

    近日,安徽合肥某高校内发生了一起令人忍俊不禁的“猪跑事件”。一只原本用于科研实验的小猪突然从实验室逃脱,在众目睽睽之下于食堂周边区域狂奔,其较快的奔跑速度和颇具戏剧性的场面迅速吸引了大量学生的围观。 事件发生后,校园安保人员迅速介入,经过一番努力,成功将这只“越狱”的小猪捕获。幸运的是,此次事件并未造成人员受伤或校园设施的损坏。校方

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 荣耀年度旗舰上新,火山引擎助力“YOYO助理”多模态智慧再升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,支持图文、语音、视频输入及多样化内容输出,结合火山引擎的豆包大模型技术,提供联网问答、智能识图、创意修图、出行规划等场景服务,实现“有问必答、答则精准”的智慧体验,成为用户贴身的“万能管家”。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 五剑齐发!华为Mate 80系列还有散热风扇版:Mate史上第一次

    博主爆料华为Mate 80系列将推出五款机型,包括标准版、Pro版、RS版及首次搭载主动散热风扇的"风扇版"。该系列采用内置风扇主动散热方案,通过空气交换快速导出热量,相比传统VC均热板效率更高,能保障芯片持续高性能运行。新机预计11月正式发布,将成为华为史上阵容最强的Mate旗舰。

  • 小米手表S4系列推送澎湃OS 3正式版:eSIM版、运动版等五款在列

    10月29日,小米手表S4系列开启澎湃OS 3正式版推送。用户可通过小米运动健康App升级,升级包下载后将自动推送至手表,完成升级并重启。官方提醒确保手表电量在20%以上,升级过程需保持与手机连接,建议将手表放在手机附近并保持App前台运行。此次推送覆盖S4 Sport、S4、S4 eSIM等多款型号。澎湃OS 3于10月15日首批推送,正逐步覆盖更多机型。

  • 耳机、卡片与麦克风:AI硬件掀起了会议室“风暴”

    当代邪修是怎么开会的? 眼睛看着智能屏、耳朵里塞着AI耳机、鼻梁上挂着AI眼镜、手边放着AI录音卡片、桌子中间摆着全向麦克风,以及内置于这些设备的Gemini、GPT、通义千问、文心一言等大模型支持的ARS、TTS、总结、摘要、归纳、代办、提问、实时搜索等功能。 因为AI硬件给办公室装上“数字耳朵”和“AI大脑”,曾经“一次性消耗品”的会议,变成了知识沉淀和积累的生�

今日大家都在搜的词: