首页 > 热点 > 关键词  > 人工智能最新资讯  > 正文

通义千问开源Qwen1.5-32B 模型系列

2024-04-07 09:42 · 稿源:站长之家

站长之家(ChinaZ.com) 4月7日 消息:通义千问团队最新发布了 Qwen1.5-32B 模型系列,其中包括 Qwen1.5-32B 和 Qwen1.5-32B-Chat。

微信截图_20240407094250.png

这些模型在模型架构上与之前的 Qwen1.5系列基本相同,但参数量减少至32B,旨在提供更高效、更经济实惠的解决方案。Qwen1.5-32B 在基础语言模型能力、对话能力多语言能力方面均表现出色,与当前最优的30B 模型相比,性能优秀

此次发布旨在解决14B 模型在智能体场景下能力弱和72B 模型推理成本高的问题。

Qwen1.5-32B:

https://modelscope.cn/models/qwen/Qwen1.5-32B

Qwen1.5-32B-Chat:

https://modelscope.cn/models/qwen/Qwen1.5-32B-Chat

Qwen1.5-32B-Chat-GPTQ-Int4:

https://modelscope.cn/models/qwen/Qwen1.5-32B-Chat-GPTQ-Int4

Qwen1.5-32B-Chat-AWQ:

https://modelscope.cn/models/qwen/Qwen1.5-32B-Chat-AWQ

Qwen1.5-32B-Chat-GGUF:

https://modelscope.cn/models/qwen/Qwen1.5-32B-Chat-GGUF

举报

  • 相关推荐
  • AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

    本期AI日报重点内容: 1. 通义千问发布Qwen3大模型,在代码、数学和通用能力方面表现突出,支持两种思考模式并开源多个模型权重 2. 抖音开放AI搜索能力接口,为第三方应用提供丰富内容资源 3. ChatGPT新增网购功能,通过对话获取个性化商品推荐 4. Suno AI即将推出V4.5版本,提升音乐生成真实度 5. Simular AI登陆macOS,打造本地化智能助手 6. 暗月之面开源Kimi-VL模型,可处理文本、图像和视频 7. UCLA与Meta推出d1框架,提升大语言模型推理速度 8. 通义灵码上线Qwen3编程智能体 9. Gen-4References图像生成技术惊艳亮相 10. Hugging Face推出可编程机械臂SO-101 11. Windsurf推出全新品牌标志 12. Ollama全面支持Qwen3模型本地部署

  • GPTBots 集成阿里通义千问 3.0,持续为企业提供顶尖 AI 服务

    GPTBots.ai平台宣布完成与阿里通义千问3.0系列模型的技术集成,成为企业级AI智能体构建领域的标杆平台。该平台通过混合推理架构和多语言交互技术,支持119种语言服务,覆盖全球主要市场。平台提供双模式智能任务处理:针对复杂业务场景的"深度思考"模式,以及高频咨询的"即时响应"模式。搭载Qwen-3-235B旗舰模型和Qwen-3-30B轻量版,在代码生成、数学推理等核心能力上达到行业顶尖水平。平台实现与企业ERP、CRM等系统的无缝对接,推动数据价值变现。通过标准化流程自动化、全球化服务等核心价值,帮助企业提升运营效率70%、降低客服成本70%,并实现数据驱动的决策升级。

  • 阿里千问3登顶全球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。

  • Qwen3深夜正式开源,小尺寸也能大力出奇迹。

    阿里发布通义千问Qwen3大模型系列,包含8个不同规模的模型,从0.6B到235B参数全覆盖。亮点包括:1)全球顶尖模型能力;2)首个开源的混合推理模型;3)支持119种语言;4)部署成本仅为DeepSeek+R1的三分之一;5)支持MCP协议。其中235B旗舰模型性能对标顶级闭源模型,30B-MoE模型激活参数仅3B。所有模型均采用Apache2.0协议开源,支持商用。实测显示Qwen3在代码和写作方面优于DeepSeek

  • 阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

    阿里巴巴开源新一代通义千问模型Qwen3,采用混合推理架构,集成"快思考"与"慢思考"模式,能根据任务复杂度自动调整计算资源。该模型参数规模235B,在GPQA等权威评测中表现优异,以更小规模实现超越上一代模型的性能。Qwen3包含2款MoE模型和6款密集模型,部署成本大幅降低,仅需4张H20显卡即可运行满血版,显存占用仅为同类模型的三分之一。新模型通过智能分配算力,在简单任务上快速响应,复杂问题上深度思考,显著提升能效比。

  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • 千问3的屠榜,是AI的一小步,也是阿里的一大步

    阿里发布Qwen3大模型,终结"阿里是否AI公司"的讨论。该模型以4张H20显卡即可部署,成本仅为同类产品的30%,覆盖从0.6B到14B全尺寸,适配手机、智能眼镜等多种设备。阿里CEO吴泳铭宣布未来三年投入超3800亿建设云和AI基础设施,相当于阿里近三年累计利润总额。文章指出,中国78%受访者对AI发展持乐观态度,远超美国的35%。阿里通过开源战略和云+AI组合拳,已构建完整AI生态,其千问系列模型不仅助力夸克、钉钉等产品重塑,更成为推动中国产业智能化转型的核心力量。

  • AI日报:阿里新模型Qwen3即将来袭;GitHub开源MCP服务器;Runway发布Gen-4 Turbo

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布,标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好,场景

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • 阿里Qwen3发布后 马斯克立刻官宣:下周推出Grok 3.5

    快科技4月29日消息,马斯克刚刚在社交平台X上称,下周将向SuperGrok订阅者推出Grok 3.5,并将该条信息顶置。据马斯克称,Grok 3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同时,Grok可以从第一原理推理并得出互联网上根本不存在的答案。Grok 3.5被马斯克旗下的xAI宣传为全球首个人工智能能从第一性原理推理,生成网络上不存在的答案”。而今年2月18日,xAI正式发布Grok 3,并在两天后把Grok 3免费向所有公众开放,超越ChatGPT,登顶苹果应用商店免费应用下载排行榜第一名。马斯克曾称Grok 3为地球上最聪明的人工智