首页 > AI头条  > 正文

Ollama 支持全线的 Qwen 3 模型,本地部署Qwen 3 更便捷

2025-04-29 11:27 · 来源: AIbase基地

Ollama官方宣布已全面支持阿里巴巴通义千问最新一代大语言模型系列——Qwen3。这一重要更新进一步丰富了Ollama的开源模型生态,为开发者、企业及AI爱好者提供了更强大的本地化部署选择,显著提升了在多种场景下的AI应用灵活性与效率。  

QQ_1745897247756.png

Qwen3模型:性能与规模并重

Qwen3是阿里巴巴通义千问团队推出的最新一代大语言模型,涵盖从0.6亿到2350亿参数的广泛模型规模,包括高效的混合专家(MoE)模型。据悉,Qwen3系列在编码、数学推理、通用任务等多个基准测试中表现出色,部分性能已媲美DeepSeek-R1及Gemini-2.5-Pro等领先模型。其旗舰模型Qwen3-235B-A22B以卓越的综合能力,为复杂任务提供了强劲支持。  

Qwen3系列的亮点包括:  

  • 多语言支持:覆盖29种语言,包括中文、英文、法语、西班牙语等,适应全球化应用需求。  

  • 长上下文处理:支持高达128K token的上下文长度,适合处理长文本生成、复杂对话等场景。  

  • 专业领域优化:在代码生成、数学推理及结构化数据处理方面显著增强,满足专业化需求。  

  • 灵活的推理模式:默认推推理模式,用户可通过特定提示(如“/no_think”)切换至常规模式,适应不同任务需求。

Ollama集成Qwen3:本地部署更便捷

Ollama作为一个开源的大型语言模型运行框架,以其简单易用和跨平台支持(Windows、macOS、Linux)广受好评。通过本次更新,用户只需一条命令即可在本地运行Qwen3系列模型,无需复杂的环境配置或云端依赖。这种高效的部署方式尤其适合需要数据隐私保护的企业及个人开发者。  

Ollama对Qwen3的支持包括全系列模型,用户可根据硬件条件选择合适的模型规模。例如:  

0.6B至7B模型:适合轻量级设备,如普通PC或边缘设备,最低内存需求仅2GB。  

72B及以上模型:面向高性能计算场景,推荐配备高性能GPU和32GB以上内存。

此外,Ollama还优化了模型量化和硬件加速,支持NVIDIA、AMD GPU以及AVX512指令集的CPU,确保在不同硬件环境下均能实现高效推理。用户还可以通过Ollama的API接口,将Qwen3无缝集成至自定义应用,如智能客服、代码助手或本地知识库系统。  

  • 相关推荐
  • Qwen3深夜正式开源,小尺寸也能大力出奇迹。

    阿里发布通义千问Qwen3大模型系列,包含8个不同规模的模型,从0.6B到235B参数全覆盖。亮点包括:1)全球顶尖模型能力;2)首个开源的混合推理模型;3)支持119种语言;4)部署成本仅为DeepSeek+R1的三分之一;5)支持MCP协议。其中235B旗舰模型性能对标顶级闭源模型,30B-MoE模型激活参数仅3B。所有模型均采用Apache2.0协议开源,支持商用。实测显示Qwen3在代码和写作方面优于DeepSeek

  • 联发科:天玑9400已率先完成阿里Qwen3端侧部署

    阿里巴巴通义千问团队开源发布新一代Qwen3系列混合推理模型,包含2个MoE模型和6个dense模型,参数规模从0.6B到235B。该系列采用前沿的混合专家架构,预训练数据量达36T tokens,在推理、指令遵循、多语言能力等方面显著提升。联发科宣布天玑9400芯片率先完成Qwen3端侧部署,其搭载的第八代AI处理器NPU+890在ETHZ AI Benchmark测试中表现优异。天玑9400凭借强大AI算力,可让用户在手机等终端设备上高效使用Qwen3模型。旗舰模型Qwen3-235B-A22B在编码、数学等基准测试中展现出与DeepSeek、Grok-3等模型的竞争优势,同时部署成本大幅降低,显存占用仅为性能相近模型的三分之一。

  • 魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

    Flyme AIOS2系统引入全新设计的智能助手Aicy,其界面设计更具呼吸感与动态效果,同时搭载升级后的思考引擎,可实现更精准的语义理解和场景响应。值得关注的是,该系统成为业内首家接入阿里云自主研发的Qwen Omni云端到端大模型的操作系统,支持超低延迟的自然语音交互,并覆盖多地

  • 阿里Qwen3发布后 马斯克立刻官宣:下周推出Grok 3.5

    快科技4月29日消息,马斯克刚刚在社交平台X上称,下周将向SuperGrok订阅者推出Grok 3.5,并将该条信息顶置。据马斯克称,Grok 3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同时,Grok可以从第一原理推理并得出互联网上根本不存在的答案。Grok 3.5被马斯克旗下的xAI宣传为全球首个人工智能能从第一性原理推理,生成网络上不存在的答案”。而今年2月18日,xAI正式发布Grok 3,并在两天后把Grok 3免费向所有公众开放,超越ChatGPT,登顶苹果应用商店免费应用下载排行榜第一名。马斯克曾称Grok 3为地球上最聪明的人工智

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

    本期AI日报重点内容: 1. 通义千问发布Qwen3大模型,在代码、数学和通用能力方面表现突出,支持两种思考模式并开源多个模型权重 2. 抖音开放AI搜索能力接口,为第三方应用提供丰富内容资源 3. ChatGPT新增网购功能,通过对话获取个性化商品推荐 4. Suno AI即将推出V4.5版本,提升音乐生成真实度 5. Simular AI登陆macOS,打造本地化智能助手 6. 暗月之面开源Kimi-VL模型,可处理文本、图像和视频 7. UCLA与Meta推出d1框架,提升大语言模型推理速度 8. 通义灵码上线Qwen3编程智能体 9. Gen-4References图像生成技术惊艳亮相 10. Hugging Face推出可编程机械臂SO-101 11. Windsurf推出全新品牌标志 12. Ollama全面支持Qwen3模型本地部署

  • 百利好环球:美股三大指数全线大涨,科技股领涨

    5月13日美股大幅收高,道指涨2.81%,纳指飙升4.35%,标普500涨3.26%。这轮上涨主要受中美经贸高层会谈取得实质性进展推动。两国宣布达成重大经贸协议,双方同步削减额外关税,综合降幅超100%。特斯拉4月出口环比大增,苹果考虑提高新iPhone价格并推出新功能。市场分析认为当前美股估值偏高,科技股虽仍是主线但波动加大。百利好环球凭借严格监管和完善资金保障措施,为投资者提供美股及相关领域投资护航。

  • 联想直营体系赋能技术平权!来酷科技首发大模型极简部署方案

    近日,联想集团旗下智慧零售与智能制造企业来酷科技,运营的全国联想直营店正式推出“DeepSeek R1 模型本地部署服务”。作为联想集团面向终端消费者的直营零售与直营服务窗口,来酷科技以 129 元普惠价面向全网开售该服务,通过“智能识别PC配置+一键轻松安装”的极简方式,将前沿AI大语言模型轻量化部署至本地计算机,实现从“云端依赖”到“端侧自主”的跨越。这不�

  • 开源即支持!基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

    多模态理解领域当前已成了各家AI大模型公司“军备竞赛”的关键点之一,国内外知名AI大模型公司都争相通过发布最先进的多模态大语言模型展现其在多模态理解领域的前沿能力。近期,上海AI实验室推出了其最新的多模态大语言模型InternVL3 系列,相比上一代InternVL2. 5 模型,该模型展现出卓越的多模态感知和推理能力,同时进一步扩展了其工具使用、GUI代理、工业图像分析等

  • 采用Corning® Gorilla® Glass Ceramic 2玻璃陶瓷 三星Galaxy S25 Edge带来超强耐用性体验

    三星电子与康宁公司宣布,即将推出的Galaxy S25 Edge将采用全新Corning® Gorilla® Glass Ceramic2玻璃陶瓷材料。这款创新材料在超薄机身设计中提供突破性防护性能,兼具时尚外观与坚固耐用特性。通过将康宁前沿玻璃科技与三星精密加工工艺相结合,该材料显著提升了屏幕盖板的抗裂能力和耐久性,同时保持高透光率。双方表示,此次合作延续了"以工程创新为本"和"以用户体验为核心"的共同理念,为高端智能手机带来更卓越的产品体验。

今日大家都在搜的词: