清华大学提出全新加速训练大模型方法SoT

2023-11-24 09:25 · 稿源：站长之家

要点:
研究人员提出了一种名为“Skeleton-of-Thought（SoT）”的创新方法，旨在加速大型语言模型(LLMs)的生成速度，以解决其处理速度较慢的问题。
与传统方法不同，SoT不对LLMs进行复杂的修改，而是将其视为黑匣子，专注于优化输出内容的组织，通过引入独特的两阶段过程来提高响应速度。
通过对12个不同领域的模型进行测试，使用Vicuna-80数据集，研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升，而不牺牲答案质量。

站长之家（ChinaZ.com）11月24日消息:近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs)生成速度较慢的问题。

尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的不足一直是一个制约因素，特别是在对延迟敏感的应用中，如聊天机器人、协同驾驶和工业控制器。SoT方法与传统的性能提升方法不同，它不对LLMs进行复杂的修改，而是将其视为黑匣子，并侧重于优化输出内容的组织结构。

项目地址：https://github.com/imagination-research/sot/

SoT引入了一个独特的两阶段过程，首先引导LLM构建答案的骨架，然后在第二阶段使LLM同时扩展骨架中的多个要点。这一方法不仅提高了LLMs的响应速度，还在不需要对模型架构进行复杂调整的情况下实现了这一目标。

为了评估SoT的有效性，研究团队对12个不同领域的模型进行了广泛测试，使用了Vicuna-80数据集，其中包含了来自编码、数学、写作和角色扮演等各个领域的问题。

通过使用FastChat和LLMZoo的度量标准，研究团队观察到SoT在八个模型上实现了1.13x到2.39x的速度提升，而且这些提升并没有牺牲答案质量。这表明SoT不仅可以显著提高响应速度，还能够在各种问题类别中保持或提升答案质量。

因此，SoT方法为解决LLMs速度较慢的问题提供了一种有前景的解决方案。研究团队的创新方法将LLMs视为黑匣子，并专注于数据级别的效率优化，为加速内容生成提供了新的视角。通过引导LLMs构建答案的骨架，然后进行并行扩展，SoT有效地提高了响应速度，为人工智能领域的动态思维过程开辟了新的探索方向，鼓励向更高效、更多才多艺的语言模型发展。

（举报）

相关推荐

关键词：

大模型

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�

美团 AI模型开源
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
AI大模型费用计算器：新手如何避开工具选择的三大坑

文章指出AI初学者常陷入三个陷阱：盲目选择昂贵工具、被华丽宣传迷惑、忽视隐藏成本。建议使用AIbase.cn等专业平台进行系统化评估，通过费用计算器对比主流模型成本，基于实际需求而非营销话术做决策。关键是要先对比分析再试用，找到真正契合业务需求的解决方案，避免资源浪费。
AI大模型费用计算器：新手如何不再为选择工具而头疼

文章探讨了AI工具选择困境，推荐使用AIbase.cn导航站。该站通过分类筛选、标签过滤和对比功能，帮助用户快速找到合适工具，避免信息过载。强调技术应服务于人，好的工具应降低使用门槛，而非增加困惑。
汪喵灵灵亮相亚宠论坛，AI大模型破解异宠医疗资源困局

2025年亚洲宠物展“亚洲小宠生态论坛”近日举办，汪喵灵灵创始人Luke受邀出席，分享AI宠物医疗大模型如何解决行业资源短缺、推动服务普惠化。该平台覆盖20多种宠物诊疗，通过解析海量文献建立健康档案系统，提供免费问诊与科学养护建议，降低养宠门槛。2024年已通过国家算法备案，成为业内首个合规认证的宠物健康大模型，致力于让每只宠物享有平等医疗关怀。

宠物AI医疗亚洲宠物展览会小宠生态论坛
九四智能大模型联络中心：重塑教育行业运营逻辑

文章分析了教培行业面临的获客成本高、人工客服效率低、用户画像不清晰等痛点，指出九四智能通过AI交互引擎提供全场景智能运营服务，覆盖获客、用户运营、业务通知等环节，结合语音识别、大数据分析等技术实现降本增效，并通过典型案例展示了实际应用效果。

教培行业 AI交互引擎降本增效
荐最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

在最近与科隆国际游戏展同期举办的Devcom开发者大会上，AI再次赚足了脸面。微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题，“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。近年来，游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

AI 游戏美术生产效率
降低创作门槛！爱诗科技新一代生成式大模型加速AI视频大众化

爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5，实现秒级高质量视频生成，支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升，覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手，降低使用门槛，用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用，加速行业落地。

AI视频生成 PixVerse V5
将AI大模型费用计算器作为战略工具：企业如何规避AI项目的成本陷阱

AI项目规模化应用面临不可预测的运营成本挑战，尤其是大模型API调用费用难以精准预测，导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移，在项目可行性分析阶段引入AIbase等成本计算工具，实现成本可视化，支持技术选型和预算建模，从被动应对转向主动管理，提升AI应用的经济性和可持续竞争力。

数字化转型人工智能运营成本
容联云「大模型金融质检」重磅升级：懂业务、全场景、高精度

金融强监管下，质检是运营关键但效率低。传统人工质检覆盖不足5%，成本高且漏检率高。容联云推出大模型质检方案，实现100%全量覆盖，准确率达96%，成本降40%。覆盖客服、营销、合同、反欺诈四大场景，将风险从被动补救转向主动预防，助力企业实现精准、高效、可溯源的智能合规管理。

金融质检合规压力人工质检

今日大家都在搜的词：

热文

3 天
7天

站长商机

广告

商务合作侵权投诉广告服务版权声明招聘

©CopyRight 2002-2020 CHINAZ.COM