清华大学提出全新加速训练大模型方法SoT

2023-11-24 09:25 · 稿源：站长之家

要点:
研究人员提出了一种名为“Skeleton-of-Thought（SoT）”的创新方法，旨在加速大型语言模型(LLMs)的生成速度，以解决其处理速度较慢的问题。
与传统方法不同，SoT不对LLMs进行复杂的修改，而是将其视为黑匣子，专注于优化输出内容的组织，通过引入独特的两阶段过程来提高响应速度。
通过对12个不同领域的模型进行测试，使用Vicuna-80数据集，研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升，而不牺牲答案质量。

站长之家（ChinaZ.com）11月24日消息:近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs)生成速度较慢的问题。

尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的不足一直是一个制约因素，特别是在对延迟敏感的应用中，如聊天机器人、协同驾驶和工业控制器。SoT方法与传统的性能提升方法不同，它不对LLMs进行复杂的修改，而是将其视为黑匣子，并侧重于优化输出内容的组织结构。

项目地址：https://github.com/imagination-research/sot/

SoT引入了一个独特的两阶段过程，首先引导LLM构建答案的骨架，然后在第二阶段使LLM同时扩展骨架中的多个要点。这一方法不仅提高了LLMs的响应速度，还在不需要对模型架构进行复杂调整的情况下实现了这一目标。

为了评估SoT的有效性，研究团队对12个不同领域的模型进行了广泛测试，使用了Vicuna-80数据集，其中包含了来自编码、数学、写作和角色扮演等各个领域的问题。

通过使用FastChat和LLMZoo的度量标准，研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升，而且这些提升并没有牺牲答案质量。这表明SoT不仅可以显著提高响应速度，还能够在各种问题类别中保持或提升答案质量。

因此，SoT方法为解决LLMs速度较慢的问题提供了一种有前景的解决方案。研究团队的创新方法将LLMs视为黑匣子，并专注于数据级别的效率优化，为加速内容生成提供了新的视角。通过引导LLMs构建答案的骨架，然后进行并行扩展，SoT有效地提高了响应速度，为人工智能领域的动态思维过程开辟了新的探索方向，鼓励向更高效、更多才多艺的语言模型发展。

（举报）

相关推荐
大家在看

关键词：

大模型

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
清华大学成立人工智能学院图灵奖获得者、院士姚期智任院长

快科技4月27日消息，在113周年校庆到来之际，清华大学成立人工智能学院。我国计算机科学专家、图灵奖获得者、中国科学院院士姚期智任院长。该学院将聚焦人工智能核心基础理论与架构”和人工智能 X”两个重点方向，培养AI顶尖人才，为实现高水平科技自立自强提供有力支撑。据了解，清华大学在人工智能领域拥有悠久的历史和深厚的积累，是国内最早开展人工智能教学和科研的高校之一。早在1978年，该校便设立了人工智能与智能控制”教研组，1985年建立了国内首个智能机器人实验室，并于1990年建成了全国第一个以智能”命名的国家重点实验室。
谷歌AI研究人员提出噪声感知训练方法（NAT）用于布局感知语言模型

在文档处理中，特别是在视觉丰富的文档中，高效信息提取的需求变得越来越关键。VRDs，如发票、水电费单和保险报价，在业务工作流中随处可见，通常以不同的布局和格式呈现类似信息。他们的研究为使普通用户能够访问先进的文档处理功能铺平了道路，标志着该领域迈出了重要的一步。

AI 语言模型 AI头条
中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

中山大学HCP实验室联合SeaAILab和哈佛大学等单位开展的一项研究，成功地让大型人工智能模型通过讲笑话的方式，探索多模态大模型的创造力，并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。这项研究的关键在于使用来自日本的“大喜利”创新响应游戏作为数据源。此次研究的成功，不仅展示了该实验室在AI领域的创新能力，也为未来的人工智能研究提供了新的

大模型梗王 AI头条
中国首个音乐SOTA模型「天工音乐大模型」今日公测

2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!一年前的今天，第一版天工大模型正式对外发布上线，一年来我们不断迭代模型，迭代应用产品，模型和应用都越做越好，以此回报广大用户的支持。「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力，并将在未来加入AI视频功能，对标“超级应用”，成为人工智能时代的“超级大模型”。在“实现通用人工智能，让每个人更好地塑造和表达自我”的公司使命驱动下，昆仑万维将始终致力于AI技术与产品的创新开拓，不断提高AI产品的用户体验，与用户、研究人员、开发者们携手，共创国产大模型的未来。

天工3.0 大模型公测
破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

【新智元导读】大语言模型的「逆转诅咒」，被解开了。来自MetaFAIR的研究人员推出了反向训练大法，让模型从反方向上学到了事实之间的逻辑，终于改进了这个困扰人们已久的问题。36年前的预言1988年，Fodor和Pylyshyn在《认知》刊物上发了一篇关于思维的系统性的文章。

Meta 大模型
清华大学：2023年学生出国出境交流8000余人次创历史最高水平

今天清华大学113周年校庆，官方发表献辞《开新局展新貌奋力谱写高质量发展的清华篇章》。献辞中提到，2023年，清华学生出国出境参加学术和文化交流8000余人次，超过疫情前最高水平。清华大学共设22个学院、59个系，已成为一所设有理学、工学、文学、艺术学、历史学、哲学、经济学、管理学、法学、教育学、医学和交叉学科等12个学科门类的综合性、研究型、开放式大学。

清华大学校庆国际交流
阿里云宣布全方位支持Llama 3训练推理帮助开发者构建自己的大模型

阿里云百炼大模型服务平台近期宣布了一项重要的支持计划，即为Meta公司最新开源的Llama3系列大语言模型提供全方位的支持。这项服务包括限时免费的模型训练、部署和推理服务，旨在帮助企业和开发者在阿里云平台上构建和优化自己的专属大模型。通过结合阿里云强大的云计算资源和Llama3模型的先进性能，企业和开发者将能够开发出更加智能和高效的AI应用，加速AI技术的创

阿里云百炼大模型 AI头条
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练

开源人工智能平台LightningAI宣布与Nvidia合作，发布了名为“Thunder”的下一代AI编译器，旨在加速人工智能模型的训练速度。据LightningAI称，该编译器在实际场景中相比未优化的代码，可将大型语言模型的训练速度提高高达40%。LightningStudios的产品可以按四个定价级别购买:个人开发者免费，工程师、研究人员和科学家专业级;初创公司和团队的团队级别，以及大型组织的企业级别。

LightningAI Thunder AI编译器
全面对标GPT-4 Turbo！商汤发布日日新5.0大模型

商汤科技在中国北京举行新品发布会，正式发布人工智能大模型日日新5.0”。日日新5.0大模型采用了先进的MOE混合专家架构，这一架构的引入，使得模型在处理复杂任务时能够表现出更高的效率和准确性。这一功能在智能客服、智能写作、智能设计等领域具有广泛的应用前景。
开源大模型食用指南官网地址入口详细环境配置、模型部署、高效微调方法教程

开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法，以简化开源大模型的使用和应用，让更多普通学习者能够轻松上手。要获取更多详细信息并开始您的开源大模型之旅，请访问开源大模型食用指南官网。

开源大模型食用指南

Truva:AI是一款AI助手，为您的应用提供新的工作方式。超越点击，在聊天中完成任务等更多操作。让您的应用从您身上学习，并随着时间的推移变得更好。

TruvaAI是一款AI助手，为软件平台提供智能导航和自动化操作功能，帮助用户更轻松地使用应用程序。通过TruvaAI，用户可以快速定位到正确的工具、功能和信息，并且还可以代表用户执行操作。TruvaAI不仅提高了用户的NPS，还为每个用户提供了个人账户经理的体验，实时可用。TruvaAI还能够根据用户的反馈和行为学习，不断改进自身。

智能导航自动化操作 AI助手

AIMidUs Community:AI Middle of Us Community是一个AI社区，提供最新的AI资金新闻、创新的AI工具和深入的AI见解。

AI Middle of Us Community是一个AI社区，旨在为用户提供最新的AI资金新闻、创新的AI工具和深入的AI见解。它是一个聚集AI爱好者和专业人士的平台，旨在推动人工智能领域的创新和发展。该社区的主要优点包括提供最新的资金新闻、分享创新的AI工具、深入的AI见解和提供有价值的AI免费资源。

AI 人工智能社区

Brainrot Translator:将文本转换成Skibidi。

Brainrot Translator是一个将文本转换成Skibidi的网站。它的主要优点是可以将普通文本转换成具有特殊效果的Skibidi文本，增加了文本的趣味性和创意性。

文本转换创意趣味

BeagleGPT:是一款在Microsoft Teams上可用的最佳生产力工具。

BeagleGPT是一款建立整个工作人员数据习惯的工具，受到F500公司的信任。它能回答各种问题，提供洞察力，并提供个性化的数据建议，帮助用户做出更明智的决策。BeagleGPT具有预测和建议模块，能够回答为什么和怎么样的问题，并为用户制定行动计划。

数据分析人工智能商业智能

GeniusPokerPlanning:使用我们直观的扑克计划应用程序轻松计划和估算项目。

Genius Poker Planning是一个多功能工具，旨在简化和增强敏捷扑克规划会议。它提供了一个用户友好的界面，为团队评估和优先处理任务提供了高效的方法。这个工具赋予敏捷团队协作评估用户故事复杂性的能力，确保更准确和高效的冲刺计划。无论您是一个软件开发团队还是其他敏捷专注的团队，Genius Poker Planning简化了评估过程，使其成为您敏捷工作流程中不可或缺的资产。

敏捷规划项目估算敏捷管理

Uncensored Chat by ModelsLab:第一个ChatGPT的开源替代品。

Uncensored Chat是第一个开源的ChatGPT替代品，它采用了人工智能技术，具有自动生成对话的能力。它的主要优点是开源、可定制、免费使用，并且能够为用户提供智能对话服务。

人工智能 ChatGPT 智能对话

Userscom:一个简单、智能、基于AI的票务软件

Userscom是一个简单、智能、基于AI的票务软件，能够帮助用户更快地建立有意义的客户关系，提高工作效率。它具有清晰的用户界面和智能设计，通过AI生成待办事项、整理工单，并提供内置的跟进工作流程，帮助用户更好地组织工作。此外，Userscom还能自动生成回复，节省用户的时间，提供个性化的客户见解，并支持多种与网站集成的方式。

票务客户关系管理 AI

Quran Stories:通过故事了解古兰经并学习古兰经中的新词汇！

Quran Stories是一个通过故事了解古兰经的学习平台。它利用人工智能生成图像来辅助记忆，通过故事来帮助学习者理解古兰经中的词汇。通过分解复杂的故事为可管理的课程，学习者可以按照自己的节奏进行学习。该平台提供了许多古兰经故事，以及听故事的朗诵，使学习过程更加身临其境。通过提供有趣的学习活动，如测验、单词游戏和重复技巧，使学习过程更有趣并加强记忆。

古兰经故事词汇

Press Ranger:是一款由人工智能驱动的工具包，使新闻工作人员的联系和新闻发布变得快速而简单。

Press Ranger是一款使用人工智能的公关工具，可以轻松构建媒体联系人列表并与记者进行联系。它拥有超过50万名全球记者的网络，您可以与他们进行网络联系，或将我们的公关活动外包给我们的专家团队。

媒体联系公关新闻发布

VetRec:利用人工智能驱动的自动记录宠物临床笔记，让兽医助手和技术员受益。

VetRec是一个使用人工智能驱动的兽医临床笔记自动化解决方案，帮助兽医助手和技术员节省时间。它可以在每次访问后的几秒钟内生成SOAP笔记，让你可以更专注于最重要的宠物和兽医。VetRec可以记录、处理和生成会话笔记，并分析会话以提取关键细节。它还可以根据你的需求定制模板，并保留详细的笔记和咨询记录，方便日后查阅。

兽医临床笔记人工智能

Dreamseer:是一款将数据科学与艺术相结合的平台，通过解读梦境来理解自我和世界。

Dreamseer是一款APP，通过数据科学解读梦境，帮助用户深入了解自己，并实现个人成长和进化。它的主要优点包括提供深入洞察力、推动社区协作、扩展梦境世界等。Dreamseer定位于个人成长和社区合作的领域。

梦境数据科学个人成长

Herodot AI:Herodot是一款AI旅游助手，为你提供关于地图上任何对象的精彩故事。

Herodot是一款AI旅游助手，通过讲述有趣的故事来为用户提供关于地图上任何对象的信息。它使用人工智能技术，可以为用户提供丰富的历史和文化知识，并帮助规划旅行行程。Herodot的主要优点是提供个性化的旅行指南和故事，让用户更好地了解目的地的背景和文化。

旅游历史文化

MarketerGrad by Pangea:匹配高质量的营销人员和设计师，帮助您快速增长。由Pangea AI提供支持。

MarketerGrad是一个提供高质量的营销人员和设计师的平台，通过匹配具有2到10年经验的人才来帮助您快速增长。该平台由Pangea AI提供支持，具有灵活的合同结构，使您能够更快地招聘到合适的人才。

营销设计招聘

Edubrain AI Homework Helper:Edubrain是一个AI作业助手，可以为学生提供个性化解决方案，帮助他们更好地完成作业并节省时间。

Edubrain是一个AI作业助手，通过提供可靠的解决方案来帮助学生解决作业问题。它可以为任何学科和学术水平提供个性化的解答。Edubrain具有无限制的使用次数，完全免费，可以在10秒内生成可靠的答案。

作业助手学习工具教育技术

Learn, Build & Ship SaaS with ShipGPT:构建和交付AI的Next.js模板和教程

SHIPGPT是一个前后端完整的AI模板，提供了各种AI用例的脚手架，使您能够构建自己的AI应用程序或将AI集成到现有技术中，无需雇佣全栈开发人员和AI开发包装器。

https:创建你的 ComfyUI 工作流程应用，并与他人分享

ComfyFlow 是一个基于 ComfyUI 的工作流程应用创建平台，能够快速创建工作流程应用并与他人分享。它使用稳定扩散（Stable Diffusion）和 ComfyUI 技术构建，具有简单易用、完全托管、免费使用等优点。

ComfyFlow ComfyUI 工作流程应用

AI Experts Top:AI Experts是一家专注于数字营销的AI顾问机构，致力于将人工智能技术应用于业务中，帮助企业提高效率和推动增长。

AI Experts是一家专注于数字营销的AI顾问机构，通过AI驱动的工具，帮助企业高效地生产高质量的内容，并通过数据分析提供有价值的见解，引导业务策略。AI Experts的主要优点包括节省时间和资源、提高内容质量、提供数据驱动的决策支持等。产品背景信息：AI Experts是由真人运营的AI机构，致力于帮助企业将人工智能技术应用于业务中。

AI 数字营销内容生产

Pongo:是一个语义过滤器，使用1行代码可以将RAG工作流中的LLM幻觉减少80%。

Pongo的语义过滤器可以通过一行代码将RAG工作流中的LLM幻觉减少80%。它利用多种先进的语义相似性模型和专有的排名算法，确保您始终获得正确的信息。Pongo可以与现有的流程集成，并提供快速的响应时间和零数据保留。

语义过滤器 RAG工作流语义相似性

Video To Tweet:将YouTube视频转换为推特/博客内容

Video To Tweet是一个将YouTube视频转换为推特和博客内容的工具。它能够将视频转换成有吸引力的推特和详细的博客文章，帮助您轻松提升在线存在感。通过尝试使用我们的工具，优化您的内容策略，扩大触达更广泛的受众。

社交媒体内容创作数字营销

TextToVideo.Bot:将文本转化为令人惊叹的视频。

TextToVideo是一个AI驱动的工具，可以将文本转化为令人惊叹的视频。它可以帮助用户快速创建YouTube、Instagram和TikTok等平台上的内容，无需等待或支付过高的费用。它提供快速、经济实惠的视频制作解决方案，帮助用户讲述故事，提升品牌影响力。

视频创作工具 AI

今日大家都在搜的词：

热文

3 天
7天

站长商机

广告

商务合作侵权投诉广告服务版权声明招聘

©CopyRight 2002-2020 CHINAZ.COM