首页 > 业界 > 关键词  > 正文

阿里云开源通义千问140亿参数模型Qwen-14B、Qwen-14B-Chat

2023-09-25 14:31 · 稿源:站长之家

站长之家(ChinaZ.com) 9月25日 消息:9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。

据悉,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。

微信截图_20230925143325.png

Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。

Qwen-14B-Chat 是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。

目前,用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。

Qwen-14B-Chat

模型链接:https://modelscope.cn/models/qwen/Qwen-14B-Chat

Qwen-14B

模型链接:https://modelscope.cn/models/qwen/Qwen-14B

Qwen-14B-Chat-Int4

模型链接:https://www.modelscope.cn/models/qwen/Qwen-14B-Chat-Int4

举报

  • 相关推荐
  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 正式上线升级版Qwen3模型!霍涛带领白山云持续赋能AI体验

    白山云在CEO霍涛带领下上线阿里千问Qwen3-235B大模型,该模型在指令遵循、逻辑推理、编程等能力显著提升,在多项评测中超越主流开源和闭源模型。基于全球边缘云架构优势,白山云提供低延迟、稳定的API服务,支持多语言长文本处理。平台已集成DeepSeek、通义千问等多款大模型,部分免费开放。霍涛表示,边缘计算正从"流量节点"向"智能计算单元"进化,白山云依托覆盖60多国的边缘网络,构建日均万亿Token级推理平台,通过"本地推理+云端协同"架构,已渗透工业质检、智能驾驶等20多个垂直场景。

  • 全球 AI 大模型排行榜 2025:GLM‑4.5 vs Qwen3‑235B‑A22B 深度对比

    2025年AI大模型技术进入竞争白热化阶段,中国厂商智谱AI与阿里通义在全球舞台持续发力。GLM-4.5系列和Qwen3系列成为最具代表性的开源模型:GLM-4.5采用MoE架构,综合性能全球第三,在编码任务中胜率超80%,工具调用成功率90.6%;Qwen3-235B采用动态专家路由机制,在长文本处理和中英文任务表现突出。文章通过架构、参数规模、基准测试等维度对比分析,推荐开发者使用AIbase模型广场一站式掌握全球大模型动态。最终结论:追求全面性能选GLM-4.5-X,注重部署效率选Qwen3-235B,轻量场景选Qwen332B。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • 大模型对比评测:Qwen2.5 VS Gemini 2.0谁更能打?

    本文对比分析了四款AI大模型:Gemini2.0Flash-Lite(Preview)、Gemini2.0Flash(Experimental)、Gemini2.0Pro Experimental(Feb25)和Qwen2.5Coder Instruct32B。Gemini2.0Flash-Lite适合高并发低延迟应用,Gemini2.0Flash擅长实时多模态推理,Gemini2.0Pro适合复杂编程任务,Qwen2.5Coder在代码任务上性价比突出。建议使用AIbase模型广场进行高效筛选,该平台覆盖上万款AI模型,提供性能、价格等多维度直观对比,支持按任务类型、语言等精准筛选,并持续更新最新模型。

  • AI编程终于“开箱即用”了?Qwen3-Coder或许是那个质变节点

    ​7月23日,阿里通义团队正式发布Qwen3-Coder-480B-A35B-Instruct,这可能是AI编程领域的一个分水岭时刻。该模型采用480B总参数、35B激活的MoE架构,原生支持256K上下文,可扩展至1M token,在Agentic Coding、Browser-Use、Tool-Use三大类基准中多项评测的开源SOTA,性能直接对标Claude Sonnet-4。

  • 美退役飞行员带13岁儿子开飞机坠亡:曾驾驶F18、F14战机

    当地时间8月2日晚间8时左右,一架小型飞机在西班牙马略卡岛坠海。 据悉,驾驶飞机的飞行员此前在美国退役,其年龄约60岁,曾驾驶F18和F14战机,拥有丰富的驾驶经验。

  • 14岁女生解约MCN被索赔家长发声 律师称MCN已涉嫌违法

    ​据小云母亲李丽反映,小云在初二时因“读不进去”执意离家去济南,并于 2023 年 9 月与一家MCN公司签下为期五年的合作协议。合同中详细规定了小云作为主播的工作要求,包括每月直播天数、时长、刷量标准及高额的违约赔偿条款,同时几乎规避了公司的所有法律责任。

  • 跳过14!iQOO 15提前预热:顶级2K屏性能旗舰

    iQOO官方确认,下一代旗舰命名为iQOO 15,跳过14”。 iQOO宣布全网招募iQOO 15首批体验官,8月1日11:00在2025 ChinaJoy iQOO展馆,来参加iQOO王者荣耀5v5惊喜开馆活动,冠军队伍将每人免费获得一台iQOO 15。 博主数码闲聊站爆料,iQOO 15采用2K直屏,搭载高通骁龙8 Elite 2旗舰平台,后置5000万像素大底主摄,还有潜望长焦、百瓦闪充和大容量电池,是iQOO史上最强标准版。 值得注意的是,iQO

热文