11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
在今日的2023云栖大会上,阿里云CTO周靖人宣布将在11月开源通义千问720亿参数模型。周靖人表示,通义千问72B将成为参数规模最大的中国开源大模型。阿里云还一同展示了通义星尘、通义灵码、通义晓蜜、通义点金、通义智文、通义法睿、通义仁心等应用模型。
大型语言模型在处理NLP领域的各种下游任务方面已经表现出卓越的能力。GPT-4、ChatGPT等开创性模型已经接受了大量文本数据的训练,使它们具备强大的文本理解和生成能力,能够生成连贯且上下文相关的响应,在各种NLP任务中具有高度通用性。为了评估模型在不同年级数学问题上的解决能力,该研究在K6数据集上测试评估了几种模型的性能,包括:GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B、ChatGLM-6B、ChatGLM2-6B和MathGLM-GLM-10B,结果如下图8所示。