首页 > AI头条  > 正文

通义千问推出Qwen3-4B系列小模型 手机也能轻松跑

2025-08-07 09:04 · 来源: AIbase基地

通义千问宣布Qwen3-4B系列模型的发布。这一新模型以其小巧的体积和强大的性能,为人工智能的端侧部署带来了新的可能性。

在前两周相继更新了Qwen3-235B-A22B和Qwen3-30B-A3B的Instruct/Thinking「2507」版本后,研发团队再次发力,推出了更小尺寸的Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507模型。这些新模型在性能上取得了显著提升,特别是在非推理领域,Qwen3-4B-Instruct-2507全面超越了闭源的GPT4.1-Nano,而在推理领域,Qwen3-4B-Thinking-2507的表现更是令人瞩目,其推理能力可与中等规模的Qwen3-30B-A3B(thinking)相媲美。

微信截图_20250807090216.png

研发团队坚信,小型语言模型(SLM)对代理人工智能(Agentic AI)的发展具有极其重要的价值。此次发布的「2507」版本Qwen3-4B模型,不仅体积小,性能强劲,而且对手机等端侧硬件部署极为友好。目前,新模型已在魔搭社区和Hugging Face正式开源,吸引了众多开发者的关注和体验。

Qwen3-4B-Instruct-2507的通用能力得到了显著提升,其表现超越了商业闭源的小尺寸模型GPT-4.1-nano,甚至与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。此外,该模型还覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。更令人惊喜的是,其上下文理解能力扩展至256K,即使是小模型,也能轻松处理长文本。

与此同时,Qwen3-4B-Thinking-2507的推理能力也大幅增强。在聚焦数学能力的AIME25测评中,该模型以4B参数量斩获了81.3分的惊人成绩,这一表现足以媲美中等模型Qwen3-30B-Thinking。此外,其通用能力也显著提升,Agent分数更是超越了更大尺寸的Qwen3-30B-Thinking模型。同样具备256K tokens的上下文理解能力,支持更复杂的文档分析、长篇内容生成以及跨段落推理等场景。

随着Qwen3-4B系列模型的发布,人工智能在端侧应用的前景变得更加广阔。相信在不久的将来,我们会看到更多基于这一模型的创新应用,为人们的生活和工作带来更多便利。

  • 相关推荐
  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

  • 正式上线升级版Qwen3模型!霍涛带领白山云持续赋能AI体验

    白山云在CEO霍涛带领下上线阿里千问Qwen3-235B大模型,该模型在指令遵循、逻辑推理、编程等能力显著提升,在多项评测中超越主流开源和闭源模型。基于全球边缘云架构优势,白山云提供低延迟、稳定的API服务,支持多语言长文本处理。平台已集成DeepSeek、通义千问等多款大模型,部分免费开放。霍涛表示,边缘计算正从"流量节点"向"智能计算单元"进化,白山云依托覆盖60多国的边缘网络,构建日均万亿Token级推理平台,通过"本地推理+云端协同"架构,已渗透工业质检、智能驾驶等20多个垂直场景。

  • 全球 AI 大模型排行榜 2025:GLM‑4.5 vs Qwen3‑235B‑A22B 深度对比

    2025年AI大模型技术进入竞争白热化阶段,中国厂商智谱AI与阿里通义在全球舞台持续发力。GLM-4.5系列和Qwen3系列成为最具代表性的开源模型:GLM-4.5采用MoE架构,综合性能全球第三,在编码任务中胜率超80%,工具调用成功率90.6%;Qwen3-235B采用动态专家路由机制,在长文本处理和中英文任务表现突出。文章通过架构、参数规模、基准测试等维度对比分析,推荐开发者使用AIbase模型广场一站式掌握全球大模型动态。最终结论:追求全面性能选GLM-4.5-X,注重部署效率选Qwen3-235B,轻量场景选Qwen332B。

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • RAZER发布黑寡妇蜘蛛 V4 矮轴超薄游戏键盘系列

    雷蛇发布黑寡妇蜘蛛V4矮轴超薄游戏键盘系列,包含极速版和竞技极速版两款产品。键盘采用全新矮轴机械轴体,触发键程仅1.2mm,配备Razer HyperSpeed无线技术,轮询率1000Hz,支持多设备连接。18.5mm超薄设计搭配人体工学倾斜角度,提供舒适输入体验。键盘采用5052铝合金上盖,内置消音泡棉,按键寿命达8000万次。配备多功能滚轮、专用宏按键和媒体控制键,内置电池续航最高980小时。建议零售价分别为1599元和1399元。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • 铭凡推出N5 Pro高性能NAS主机:搭载AMD AI 9 HX 370处理器、支持144TB容量

    知名迷你PC厂商MINISFORUM推出首款高性能NAS主机N5系列,包含N5和N5 Pro两款型号。N5 Pro搭载AMD锐龙AI9 HX370处理器(12核24线程/5.1GHz)和Radeon 890M核显;N5采用锐龙7H255处理器(8核16线程/4.9GHz)和780M核显。主机支持5个HDD+3个M.2硬盘(含2个U.2企业级接口),最高144TB存储容量,配备双通道DDR5内存(最高96GB)并支持ECC校验。接口方面配备2个USB4、多个USB3.2/2.0、10G/5G网口及HDMI2.1,支持PCIe4.0扩展和OCulink外接显卡。该系列兼具NAS存储与高性能计算能力,适合虚拟化、娱乐等多场景使用,N5售价3749元起,N5 Pro售价6239元起。

今日大家都在搜的词: