通义千问团队发布Qwen1.5 聊天模型性能大幅提升

2024-02-07 10:00 · 稿源：站长之家

站长之家（ChinaZ.com）2月7日消息:在近期几个月的深入探索之后，通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。

Qwen1.5的亮点之一是其丰富的模型系列，涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外，团队还开源了包括Int4和Int8的GPTQ模型、AWQ模型以及GGUF量化模型在内的多种量化版本，以满足不同开发者的需求。

为了提高开发者的使用体验，Qwen1.5的代码已经与Hugging Face Transformers进行了合并。这意味着开发者可以直接使用transformers>=4.37.0版本，而无需信任远程代码。此外，Qwen1.5还得到了如vLLM、SGLang、AutoGPTQ等主流框架的支持，进一步丰富了其生态系统。

相较于之前的版本，Qwen1.5在聊天模型与人类偏好一致性方面取得了显著进步。同时，其多语言能力也得到了全面改善。更令人振奋的是，所有模型现在都支持统一的上下文长度，高达32K。这些改进不仅增强了模型的基础语言质量，还为其在多语言评测中的表现奠定了坚实基础。

微信截图_20240207100206.png

总结亮点

模型多样性:提供6个不同规模的模型以及多种量化版本，满足各种需求。
生态系统融入:与Hugging Face Transformers等主流框架的紧密结合，简化了开发过程。
卓越性能:聊天模型性能的大幅提升，以及在MT-Bench等基准测试中的优秀表现。
统一功能:全系列模型支持32K上下文长度、增强的多语言能力和统一的system prompt等特性。

体验地址:

https://modelscope.cn/studios/qwen/Qwen1.5-72B-Chat-Demo/summary

（举报）

相关推荐

关键词：

荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

AI日报精选：1)百度开源文心大模型4.5系列，含10款新模型，性能优异；2)通义千问发布多模态模型Qwen-VL，支持图文交互；3)阿里开源3亿参数多模态模型Ovis-U1；4)华为开源盘古7B稠密和72B混合专家模型；5)美图MOKI推出AI创意广告功能，一键生成专业视频；6)谷歌Gemini 2.5 Pro API重新免费开放；7)豆瓣上线"深入研究"AI功能；8)小米"AI百宝箱"结束内测；9)北京智研院开源多模态系统OmniGen2；10)知乎升级"直答"知识库功能。

AI日报文心大模型开源模型
荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
极氪接入通义千问3,知识库问答命中率达98%

极氪汽车接入通义千问3大模型，打造专属知识库"极氪知道"，问答准确率达98%。基于阿里云平台调用Qwen3-235B-A22B大模型，构建图文视三位一体的知识呈现系统，可提供标准化文本介绍及多媒体资源。通义千问3的快慢思考融合架构能提供更富逻辑性的车辆对比介绍，提升客户决策体验。极氪车联网、APP等核心业务已运行在阿里云平台。

极氪通义千问3 知识库
荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

【AI日报】今日AI领域重要动态：1.通义千问3大模型全球下载量超1250万，衍生模型13万+；2.即梦图片3.0上线，AI设计进入"零门槛"时代；3.智谱AI发布企业级超级助手Agent CoCo；4.百度推出金融行业大模型"千帆慧金"；5.小红书开源首个大模型dots.llm1，含1420亿参数；6.Hugging Face开源LeRobot项目，降低机器人研发门槛；7.ChatGPT语音功能升级，支持更自然对话翻译；8.Google Gemini应用下载量超ChatGPT但活跃度不足；9.轻量级文档解析模型MonkeyOCR表现优异；10.Google Veo3推出高速视频生成模式；11.Google调整AI Studio政策，限制Gemini2.5Pro免费访问。

AI日报通义千问 AI产品应用
荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

【AI日报】今日AI领域7大突破：1）阿里通义Qwen-TTS实现方言语音合成重大突破；2）Cursor发布Web版AI编程工具；3）字节XVerse技术实现多对象精准图像生成；4）NoteGen跨平台AI笔记工具革新知识管理；5）ManimML动画库可视化Transformer架构；6）TEN+Agent开源语音交互技术降低延迟；7）Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

人工智能语音合成 Qwen-TTS
荐AI日报：MiniMax-M1开源；阿里Qwen3升级版适配苹果MLX架构；月之暗面发布新模型Kimi-Dev-72B

《AI日报》汇总了近期AI领域多项重要进展：1)月之暗面推出开源编程模型Kimi-Dev-72B，在软件工程任务测试中创下新纪录；2)MiniMax开源M1模型，支持超长上下文推理且训练成本低；3)腾讯发布AI音乐模型LeVo，支持音色克隆和分轨生成；4)阿里云Qwen3升级版适配苹果MLX架构；5)豆包推出"AI播客"功能，可将PDF转为对话播客；6)夸克App上线个性化AI家教"夸克老师"；7)松下发布多模态大模型OmniFlow，实现文本/图像/音频自由切换；8)TikTok推出三款AI视频创作工具；9)极氪与火山引擎合作，将豆包大模型接入智能座舱系统；10)Meta的Llama3.1模型在文本记忆方面表现突出；11)Grok上线定时追踪X热门话题功能；12)Gemini2.5Pro即将更新Deep Think功能；13)谷歌地图引入AI技术升级导航和个性化推荐功能。

人工智能开源模型软件工程
荐AI日报：MiniMax发布视频智能体Hailuo Agent；昆仑万维开源 Skywork-SWE-32B；B站接入Qwen 3等模型

本期AI日报聚焦多项AI领域创新：1)MiniMax推出视频Agent工具，支持文本生成高清视频及人脸驱动；2)昆仑万维开源Skywork-SWE-32B模型，提升软件工程任务表现；3)B站接入通义千问模型，推出数据分析智能体InsightAgent；4)ChatGPT深度整合Gmail与日历功能；5)腾讯云发布全链路AI开发平台"AI Builder"；6)HeyGen推出UGC广告数字人功能；7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态，展现AI技术快速发展的多元应用与潜在影响。

AI日报视频生成人工智能
有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行，在多项数学推理任务中性能超越更大规模的通用模型，高考数学题测试得分达98.5分。其训练成本仅2.6万美元，推理性能是DeepSeek+R1的15倍，服务成本低至每百万token0.15美元，大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

子曰3 开源大模型数学教育
荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

【AI日报】今日AI领域热点速览： 1. 夸克APP推出高考志愿大模型，免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式，挑战行业巨头 3. Trae开发者平台月活破百万，累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体"，内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具，支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资，拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

人工智能高考志愿 AI应用
华为云发布盘古大模型5.5，宣布新一代昇腾AI云服务上线，成就行业AI先锋

华为开发者大会2025（HDC2025）在东莞篮球中心开幕，发布多项AI创新成果：1）推出基于CloudMatrix384超节点的新一代昇腾AI云服务，单卡推理吞吐量提升4倍；2）发布盘古大模型5.5，NLP、CV等五大基础模型全面升级，其中718B深度思考模型采用256专家MoE架构；3）推出行业首个统一预测架构Triplet Transformer，覆盖钢铁、水泥等多个工业场景；4）发布300亿参数视觉大模型，支持多维感知分析；5）升级盘古助手Doer，新增6大开发领域专业Agent。华为云宣布开发者突破800万，将构建昇腾、鸿蒙、鲲鹏等技术生态。

华为开发者大会 HarmonyOS 昇腾AI云服务

热文

3 天
7天

通义千问团队发布Qwen1.5 聊天模型性能大幅提升

荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

极氪接入通义千问3,知识库问答命中率达98%

荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

荐AI日报：MiniMax-M1开源；阿里Qwen3升级版适配苹果MLX架构；月之暗面发布新模型Kimi-Dev-72B

荐AI日报：MiniMax发布视频智能体Hailuo Agent；昆仑万维开源 Skywork-SWE-32B；B站接入Qwen 3等模型

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

华为云发布盘古大模型5.5，宣布新一代昇腾AI云服务上线，成就行业AI先锋

热文

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

安克修改召回方案充电宝泡盐水处理后可获赔

董明珠说自己尽量少说话让年轻管理团队走向台前

小米YU7将开启限时改配非准现车锁单用户可参与

小米股票上热搜：盘中股价突破60港元创历史新高

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小米YU7 3分钟大定突破200000台雷军：YU7订单要高于SU7

京东回应外卖员帮扔垃圾每单0.5元：小范围测试未正式上线

雷军说特斯拉确实了不起：引领了行业趋势尤其是FSD

小鹏G7官宣7月3日发布全球首款L3级算力车型

荣耀正式启动A股IPO 获上市辅导备案

安克修改召回方案充电宝泡盐水处理后可获赔

董明珠说自己尽量少说话让年轻管理团队走向台前

站长商机