昆仑万维：天工大模型推理能力超过GPT-3.5和LLaMA2

2023-09-18 08:18 · 稿源：站长之家

站长之家（ChinaZ.com）9月18日消息:昆仑万维表示，其自研的天工大模型在 Benchmark GSM8K 测试中取得了80% 的正确率，超过了 GPT-3.5和 LLaMA2-70B，达到了全球领先水平，接近于 GPT-4。

天工大模型还在 MMLU、C-EVAL、HumanEval 等多个数据集上表现出色，准确率均高于其他主流大模型。同样，在中文开源数据集 CMATH 测试中，天工大模型也表现优秀，准确率超过了其他主流大模型。

微信截图_20230918081839.png

昆仑万维表示，天工大模型的优秀表现得益于其对多数据源的高效融合策略、不同语言间的能力迁移以及对基座逻辑推理能力的深入探索。与 GPT-3.5相比，天工大模型的解题思路更为简单、清晰。

天工大模型目前仍处于内测阶段，将持续提升技术实力，为用户和企业提供强大的智能化助力。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测

昆仑万维在2024年4月17日宣布「天工3.0」基座大模型和「天工SkyMusic」音乐大模型开始公测。「天工3.0」拥有4000亿参数，超越了3140亿参数的Grok-1，是全球最大的开源MoE大模型，在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域有突破性性能提升。昆仑万维不断推出前沿大模型产品，构建AI业务矩阵，包括AI搜索、AI音乐、AI视频等，成为国内AI科技企业中�

昆仑万维天工3.0 天工
谷歌推出”自我发现“框架，极大增强GPT-4等大模型推理能力

随着ChatGPT的出现，大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面，面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量，也就是说可以节省很多算力资源。

GPT-4
最强大模型Llama 3正式发布已达GPT4级别

Meta公司宣布了一项重大技术进展，发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B和70B，预计将于今年7月正式面世。MetaAI还整合了搜索功能，可以直接访问网络上的实时信息，无需切换应用。

Llama3 AI头条
昆仑万维AI音乐生成大模型「天工SkyMusic」启动邀测

4月2日，昆仑万维AI音乐生成大模型「天工SkyMusic」开始面向社会免费邀测，邀测将开放1000个免费名额，主要针对行业媒体、专家和音乐从业者。该大模型基于昆仑万维的「天工3.0」超级大模型，是目前国内唯一可用的AI音乐生成大模型。通过这些努力，昆仑万维希望构建一个更加智能、互联、理解和尊重每个人个性的世界。

AI音乐生成天工 SkyMusic
阿里云宣布全方位支持Llama 3训练推理帮助开发者构建自己的大模型

阿里云百炼大模型服务平台近期宣布了一项重要的支持计划，即为Meta公司最新开源的Llama3系列大语言模型提供全方位的支持。这项服务包括限时免费的模型训练、部署和推理服务，旨在帮助企业和开发者在阿里云平台上构建和优化自己的专属大模型。通过结合阿里云强大的云计算资源和Llama3模型的先进性能，企业和开发者将能够开发出更加智能和高效的AI应用，加速AI技术的创

阿里云百炼大模型 AI头条
荐1320亿参数，性能超LLaMA2、Grok-1！开源大模型DBRX

3月28日，著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数，能生成文本/代码、数学推理等，有基础和微调两种模型。Databricks主要提数据智能分析服务，帮助企业、个人用户快速挖掘数据的商业价值。

大模型 DBRX
开源大模型DBRX：1320亿参数，比Llama2-70B快1倍

大数据公司Databricks最近发布了一款名为DBRX的MoE大模型，引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型，成为了新的开源之王。根据Databricks公布的协议，基于DBRX打造的产品，如果月活超过7亿，就必须另行向Databricks提交申请。

DBRX Llama2-70B AI头条
天工SkyMusic体验入口昆仑万维AI音乐生成大模型免费邀测申请地址

天工SkyMusic是一款基于昆仑万维「天工3.0」超级大模型打造的AI音乐生成大模型。它支持高质量AI音乐生成、人声合成、歌词段落控制、多种音乐风格和音乐智能表达等功能。「天工SkyMusic」正式版也将在4月17日随「天工3.0」面向全社会免费开放。

天工SkyMusic
阿里云推出针对Llama 3系列模型限时免费训练、部署、推理服务

Meta公司发布了全新的Llama3系列阿里云魔搭社区迅速响应，将这一系列的四款模型全部上架。阿里云百炼大模型服务平台更是宣布，将提供针对Llama3系列的限时免费训练、部署和推理服务，旨在帮助企业和开发者利用这一强大工具，快速构建属于自己的专属大模型。企业和开发者只需在阿里云百炼模型广场进行申请，一旦通过，便能迅速体验Llama3的卓越性能，并与其他模型进行直观的比较。
荐Llama 3突然来袭！开源社区再次沸腾：GPT-4级别模型可以自由访问的时代到来

Llama3来了!就在刚刚，Meta官网上新，官宣了Llama380亿和700亿参数版本。并且推出即为开源SOTA:Meta官方数据显示，Llama38B和70B版本在各自参数规模上超越一众对手。好在乌龙完了，官方也没拖着，关心开源大模型的小伙伴们，可以造作起来了。

Llama3

ColdCraft:帮助您打造个性化、有效的冷邮件，节省时间并提高回复率。

ColdCraft是一个AI平台，可以帮助您将简单的要点和LinkedIn个人资料转化为有效的冷邮件。它可以节省时间并提高回复率。该插件可以直接在Gmail中将要点转化为完整的冷邮件，并可以从LinkedIn个人资料直接撰写和发送电子邮件。

冷邮件个性化有效

nexai:Nexai是一个AI聊天机器人，可以帮助您进行搜索、提供信息和回答问题。

Nexai是一个基于人工智能的聊天机器人，它可以通过自然语言处理技术理解用户的问题并提供相关信息。它具有快速、准确的搜索能力，可以回答各种问题，并提供实用的建议和指导。Nexai还可以进行智能对话，与用户进行交流和互动。

AI 聊天机器人搜索

Inboxly AI:Inboxly是一个AI邮箱，带有内置的AI助手，可从所有平台整理、优先处理和回复邮件，让您不再错过有价值的新机会。

Inboxly是一个AI邮箱，可以帮助用户整理、优先处理和回复来自各个平台的邮件。它的主要优点是提高工作效率、节省时间和保护隐私。Inboxly适用于个人和小型企业，提供AI助手、自动回复、智能过滤等功能。它是一个具有高影响力的低成本解决方案。

AI邮箱工作效率时间管理

Truva:AI是一款AI助手，为您的应用提供新的工作方式。超越点击，在聊天中完成任务等更多操作。让您的应用从您身上学习，并随着时间的推移变得更好。

TruvaAI是一款AI助手，为软件平台提供智能导航和自动化操作功能，帮助用户更轻松地使用应用程序。通过TruvaAI，用户可以快速定位到正确的工具、功能和信息，并且还可以代表用户执行操作。TruvaAI不仅提高了用户的NPS，还为每个用户提供了个人账户经理的体验，实时可用。TruvaAI还能够根据用户的反馈和行为学习，不断改进自身。

智能导航自动化操作 AI助手

AIMidUs Community:AI Middle of Us Community是一个AI社区，提供最新的AI资金新闻、创新的AI工具和深入的AI见解。

AI Middle of Us Community是一个AI社区，旨在为用户提供最新的AI资金新闻、创新的AI工具和深入的AI见解。它是一个聚集AI爱好者和专业人士的平台，旨在推动人工智能领域的创新和发展。该社区的主要优点包括提供最新的资金新闻、分享创新的AI工具、深入的AI见解和提供有价值的AI免费资源。

AI 人工智能社区

Brainrot Translator:将文本转换成Skibidi。

Brainrot Translator是一个将文本转换成Skibidi的网站。它的主要优点是可以将普通文本转换成具有特殊效果的Skibidi文本，增加了文本的趣味性和创意性。

文本转换创意趣味

BeagleGPT:是一款在Microsoft Teams上可用的最佳生产力工具。

BeagleGPT是一款建立整个工作人员数据习惯的工具，受到F500公司的信任。它能回答各种问题，提供洞察力，并提供个性化的数据建议，帮助用户做出更明智的决策。BeagleGPT具有预测和建议模块，能够回答为什么和怎么样的问题，并为用户制定行动计划。

数据分析人工智能商业智能

GeniusPokerPlanning:使用我们直观的扑克计划应用程序轻松计划和估算项目。

Genius Poker Planning是一个多功能工具，旨在简化和增强敏捷扑克规划会议。它提供了一个用户友好的界面，为团队评估和优先处理任务提供了高效的方法。这个工具赋予敏捷团队协作评估用户故事复杂性的能力，确保更准确和高效的冲刺计划。无论您是一个软件开发团队还是其他敏捷专注的团队，Genius Poker Planning简化了评估过程，使其成为您敏捷工作流程中不可或缺的资产。

敏捷规划项目估算敏捷管理

Uncensored Chat by ModelsLab:第一个ChatGPT的开源替代品。

Uncensored Chat是第一个开源的ChatGPT替代品，它采用了人工智能技术，具有自动生成对话的能力。它的主要优点是开源、可定制、免费使用，并且能够为用户提供智能对话服务。

人工智能 ChatGPT 智能对话

Userscom:一个简单、智能、基于AI的票务软件

Userscom是一个简单、智能、基于AI的票务软件，能够帮助用户更快地建立有意义的客户关系，提高工作效率。它具有清晰的用户界面和智能设计，通过AI生成待办事项、整理工单，并提供内置的跟进工作流程，帮助用户更好地组织工作。此外，Userscom还能自动生成回复，节省用户的时间，提供个性化的客户见解，并支持多种与网站集成的方式。

票务客户关系管理 AI

Quran Stories:通过故事了解古兰经并学习古兰经中的新词汇！

Quran Stories是一个通过故事了解古兰经的学习平台。它利用人工智能生成图像来辅助记忆，通过故事来帮助学习者理解古兰经中的词汇。通过分解复杂的故事为可管理的课程，学习者可以按照自己的节奏进行学习。该平台提供了许多古兰经故事，以及听故事的朗诵，使学习过程更加身临其境。通过提供有趣的学习活动，如测验、单词游戏和重复技巧，使学习过程更有趣并加强记忆。

古兰经故事词汇

Press Ranger:是一款由人工智能驱动的工具包，使新闻工作人员的联系和新闻发布变得快速而简单。

Press Ranger是一款使用人工智能的公关工具，可以轻松构建媒体联系人列表并与记者进行联系。它拥有超过50万名全球记者的网络，您可以与他们进行网络联系，或将我们的公关活动外包给我们的专家团队。

媒体联系公关新闻发布

VetRec:利用人工智能驱动的自动记录宠物临床笔记，让兽医助手和技术员受益。

VetRec是一个使用人工智能驱动的兽医临床笔记自动化解决方案，帮助兽医助手和技术员节省时间。它可以在每次访问后的几秒钟内生成SOAP笔记，让你可以更专注于最重要的宠物和兽医。VetRec可以记录、处理和生成会话笔记，并分析会话以提取关键细节。它还可以根据你的需求定制模板，并保留详细的笔记和咨询记录，方便日后查阅。

兽医临床笔记人工智能

Dreamseer:是一款将数据科学与艺术相结合的平台，通过解读梦境来理解自我和世界。

Dreamseer是一款APP，通过数据科学解读梦境，帮助用户深入了解自己，并实现个人成长和进化。它的主要优点包括提供深入洞察力、推动社区协作、扩展梦境世界等。Dreamseer定位于个人成长和社区合作的领域。

梦境数据科学个人成长

Herodot AI:Herodot是一款AI旅游助手，为你提供关于地图上任何对象的精彩故事。

Herodot是一款AI旅游助手，通过讲述有趣的故事来为用户提供关于地图上任何对象的信息。它使用人工智能技术，可以为用户提供丰富的历史和文化知识，并帮助规划旅行行程。Herodot的主要优点是提供个性化的旅行指南和故事，让用户更好地了解目的地的背景和文化。

旅游历史文化

MarketerGrad by Pangea:匹配高质量的营销人员和设计师，帮助您快速增长。由Pangea AI提供支持。

MarketerGrad是一个提供高质量的营销人员和设计师的平台，通过匹配具有2到10年经验的人才来帮助您快速增长。该平台由Pangea AI提供支持，具有灵活的合同结构，使您能够更快地招聘到合适的人才。

营销设计招聘

Edubrain AI Homework Helper:Edubrain是一个AI作业助手，可以为学生提供个性化解决方案，帮助他们更好地完成作业并节省时间。

Edubrain是一个AI作业助手，通过提供可靠的解决方案来帮助学生解决作业问题。它可以为任何学科和学术水平提供个性化的解答。Edubrain具有无限制的使用次数，完全免费，可以在10秒内生成可靠的答案。

作业助手学习工具教育技术

Learn, Build & Ship SaaS with ShipGPT:构建和交付AI的Next.js模板和教程

SHIPGPT是一个前后端完整的AI模板，提供了各种AI用例的脚手架，使您能够构建自己的AI应用程序或将AI集成到现有技术中，无需雇佣全栈开发人员和AI开发包装器。

AI SaaS 模板

https:创建你的 ComfyUI 工作流程应用，并与他人分享

ComfyFlow 是一个基于 ComfyUI 的工作流程应用创建平台，能够快速创建工作流程应用并与他人分享。它使用稳定扩散（Stable Diffusion）和 ComfyUI 技术构建，具有简单易用、完全托管、免费使用等优点。

ComfyFlow ComfyUI 工作流程应用

AI Experts Top:AI Experts是一家专注于数字营销的AI顾问机构，致力于将人工智能技术应用于业务中，帮助企业提高效率和推动增长。

AI Experts是一家专注于数字营销的AI顾问机构，通过AI驱动的工具，帮助企业高效地生产高质量的内容，并通过数据分析提供有价值的见解，引导业务策略。AI Experts的主要优点包括节省时间和资源、提高内容质量、提供数据驱动的决策支持等。产品背景信息：AI Experts是由真人运营的AI机构，致力于帮助企业将人工智能技术应用于业务中。

昆仑万维：天工大模型推理能力超过GPT-3.5和LLaMA2

今日大家都在搜的词：

热文

站长商机