首页 > 热点 > 关键词  > 正文

通义千问团队开源首个千亿参数模型Qwen1.5-110B

2024-04-28 08:28 · 稿源:站长之家

站长之家(ChinaZ.com)4月28日 消息:通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和 Chat 评估中表现出色,与其他同类模型相比有显著提升。Qwen1.5-110B 采用了 Transformer 解码器架构,支持多种语言,并且具有高效的分组查询注意力机制。在 Chat 评估中,该模型相较于之前的版本表现更好,显示了更大规模模型的潜力。

微信截图_20240428082933.png

110B 模型的性能提升主要来自于增加的模型规模,而训练方法并未大幅改变。然而,尽管未改变训练方法,模型规模的增加依然带来了更好的 Chat 模型效果,这表明模型规模的扩展在提升性能方面具有重要意义。

Qwen1.5-110B 是通义千问系列中规模最大的模型,也是首个拥有超过1000亿参数的模型。它在与最近发布的 SOTA 模型的性能比较中表现出色,显示出在模型大小扩展方面仍有很大的提升空间。

未来,团队将继续探索模型规模提升和扩展预训练数据规模两种方法带来的优势。

模型链接:

Qwen1.5-110B-Chat:

https://www.modelscope.cn/models/qwen/Qwen1.5-110B-Chat

Qwen1.5-110B:

https://www.modelscope.cn/models/qwen/Qwen1.5-110B

举报

  • 相关推荐
  • GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

    AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 智能问数:让数据 “开口”,让 BI 价值 “焕新”

    在数字经济时代,传统BI模式因技术壁垒使数据价值难以释放。智能问数通过自然语言交互,让非技术人员直接对话数据,快速获取洞察,实现从“为报表而生”到“为决策赋能”的转变。其核心架构融合智能问数、数据洞见与动态分析,支持多轮对话优化可视化呈现,并引入数据洞见能力,助力企业看清过去、把握现在、预判未来,重塑数据驱动增长的新范式。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • vivo Y500 Pro官宣11月10日发布:同档首发2亿HP5主摄

    vivo将于11月10日发布Y500Pro新机,定位“国民小旗舰”。该机搭载三星HP5主摄,配备2亿超高像素与专业防抖技术,主打清晰影像记录。设计采用旗舰同款AG玻璃工艺与超窄边框,首配1.5K护眼屏兼顾显示细腻度与用眼健康。性能方面搭载超百万跑分处理器,支持《王者荣耀》120帧模式,配合新系统承诺五年流畅使用。续航配备7000mAh半固态电池,支持-30℃极端环境使用,并通过IP68/69防水认证,成为行业首款获国标可靠性认证的中端机型。

  • AI+大消费的首个双11,商家借阿里妈妈实现首波爆发

    10月15日晚八点,天猫正式开启了2025年度双11预售,预售首小时,便有35个品牌成交破亿,1802个品牌成交翻倍,破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。淘宝天猫作为双11的主阵地,再一次见证了无数优秀品牌商家的高光时刻。 作为首个AI全面落地的双11,这场品牌生意集体爆发盛景的背后,阿里妈妈对商家经营的赋能作用,已悄然融入每一个关键节点。 在

今日大家都在搜的词: