首页 > 传媒 > 关键词  > 提示工程最新资讯  > 正文

卓世科技提示词压缩专利技术揭秘

2024-10-14 11:34 · 稿源: 站长之家用户

提示工程是一种在机器学习模型,尤其是预训练语言模型中,通过精心设计输入提示(prompt)来引导模型输出期望结果的技术。在大语言模型的使用中,提示词通常是一段文本,用来引导模型生成特定的输出或完成特定的任务。

在多文档搜索、问答系统、文档自动摘要生成以及阅读理解等多样化且复杂的应用场景中,往往会面临输入提示(prompt)长度显著增加的挑战。这种超长prompt不仅加大了大型语言模型(LLM)的推理成本,还显著延长了推理时间,从而严重限制了其在需要即时响应的实时应用场景中的适用性。为了克服这一难题,优化prompt设计,如通过压缩技术精简关键信息、采用更有效的prompt格式或结构,变得尤为关键。这样的策略旨在平衡模型性能与实时性需求,确保LLM能够在复杂多变的场景下依然保持有效、准确的响应能力。

基于以上背景,卓世科技创新的中文提示词压缩技术应运而生。

卓世科技对提示词进行压缩的技术旨在保证推理效果的前提下降低推理成本,提升推理速度。其主要的思路如下:

(1)定义长prompt的结构:

Prompt=instruction+documents/demonstrations+question。

(2)小语言模型和大语言模型的分布对齐

使用小语言模型(small LLM)估计长prompt的各个部分的重要程度,为了缩小大语言模型(LLM)和小语言模型之间的概率分布差距,通过在LLM生成的数据上进行指令微调来有效小语言模型,使得小语言模型更好地模拟LLM的分布。

(3)对documents/demonstrations部分进行两个层次的压缩。

3.1、示例层次的压缩

documents/demonstrations部分中通常包含多个文档/示例,而每个文档/示例包含有多个段落。针对每个文档/示例的每个段落,计算出段落与question的相关性,保留得分前 3 的段落作为该文档/示例的代表上下文x_doc。同时,可计算出该文档/示例中所有段落的平均相关性s_k。

然后根据question部分和文档/示例的代表上下文x_doc计算文档/示例级别的困惑度r_k。最终文档/示例的评分为s1=s_k*r_k。

此时,每个文档/示例计算出三个分数,评分s1、平均相关性s_k以及困惑度r_k。利用这三个分数从长prompt的documents/demonstrations部分中删除部分文档/示例。

3. 2 重排序

由于模型对prompt的不同位置处的信息的敏感度不同,通常模型对prompt首尾位置处的信息敏感度较好,中间位置的敏感度较差。为了确保prompt的效果,可依据评分对保留的文档进行重排序处理,使得评分较高的文档排列在首位,评分较低排列在中间位置。

3. 3 文档/示例压缩率计算

针对重排序后的prompt,用户可自定义在词语层次上的压缩率。按照上述文档/示例的排序,使用[1, 2*Kc]的均匀离散分布,来初始化每个文档/示例的压缩率。

3. 4 词语层次的压缩

在删减文档/示例后的documents/demonstrations部分,可计算每个token的条件困惑度差异。

为了确保压缩后的语义完整,可使用双向比较大匹配分词法,以获取到最长的分词词语。同时,为了适应垂直领域,可结合垂直领域内的专业词汇表进行分词,尽量保留垂直领域内的专业词汇。

然后可基于前述计算出的token的条件困惑度差异以及分词的结果,对每个词语进行打分。假设一个中文词语word_i有k个token组成,按照该中文词语word_i是否属于垂直领域的词汇,使用不同的计算方式对其评分。

最后针对每个文档/示例,利用文档/示例中每个词汇的评分,按照得分高低顺序压缩文档/示例,使得其满足文档/示例的压缩率。

(4)压缩后的prompt可输入至大语言模型中,得到响应。

至此,整个提示词压缩的方案介绍完毕,该技术方案相比于其他压缩方案,更加适配中文的词语粒度,尤其在垂直领域可避免丢失专业词汇,在保证语义完整的情况下删减了冗余信息,可有效降低提升推理效率,节约计算成本。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 卓世科技MCP 技术融合实践白皮书》发布

    本文介绍了AI应用开发中MCP(模型上下文协议)的重要作用。MCP作为标准化AI工具交互协议,允许AI代理根据任务上下文自主发现、选择和编排工具,突破传统预定义工具映射的局限。文章重点展示了卓世科技在医疗健康领域的创新实践:通过MCP整合多源异构医疗知识图谱,构建全栈式健康监测网络,实现诊疗规范、药品信息等动态同步;同时开发智能周报系统,实现多模态内容自动生成与精准推送。MCP架构采用客户端-服务器模式,支持本地高效通信与云端实时交互,为AI应用提供灵活性和互操作性。未来,MCP将与A2A协议互补协作,推动AI从单点工具向系统化智能协同演进。

  • 卓世科技与浙江移动达成创新业务战略合作伙伴关系​

    卓世科技与浙江移动达成战略合作,双方将围绕数字化技术展开深度协同。作为数字化领域创新先锋,卓世科技将发挥在大模型、智能算法等领域的技术优势,结合浙江移动的通信资源与市场布局,共同探索智慧政务、企业服务等场景的创新应用。此次合作将推动"AI普惠"理念在浙江落地,加速区域数字化转型进程,为构建开放共享的数字经济新生态注入动能。

  • 硬盘数据恢复技术揭秘:硬盘格式化后数据丢失如何恢复

    本文介绍了硬盘格式化后数据恢复的方法。格式化分为快速和完全两种:快速格式化仅清除文件索引,数据仍存于扇区;完全格式化会扫描并标记坏扇区,理论上清除更彻底。数据恢复原理是利用硬盘存储特性,通过专业软件扫描重建文件索引。推荐使用转转大师等专业工具,支持多种文件类型恢复,操作简便。其他方法包括:利用系统备份还原、使用Chkdsk命令修复(需技术基础)、求助专业数据恢复机构(费用较高)。注意事项:发现误格式化后立即停止使用硬盘,避免数据覆盖;选择可靠恢复软件;将恢复数据保存至其他存储设备。日常应养成定期备份重要数据的习惯。

  • 京东联合多品牌看“AI浪潮下的中国品牌”:“有技术、有远见、有创新力、有温度”成关键

    中国品牌在AI浪潮下迎来新机遇,华为、小米、联想等品牌凭借AI技术积累和创新,为消费者提供更智能便捷的体验。调研显示超7成消费者认可中国品牌AI应用,44.1%认为AI功能应用快速,3C数码和家电表现突出。AI技术正渗透到手机、电脑、穿戴设备及大小家电等领域,其中AIPC市场增长迅猛,预计2027年中国市场渗透率将突破80%。扫地机器人、洗衣机等智能家电通过AI实现全自动�

  • 专利引领安防新高度 王力安防以技术创新重构行业价值

    "王力杯"乡村振兴返乡创业大学生直播系列活动自4月25日启动以来持续升温。该活动由中国青年报社等单位主办,王力安防作为总冠名方,凭借30年深耕行业积累的千余项专利技术,为活动注入科技基因,树立"专利立企"标杆。当前安防门锁行业正经历从物理防护向智能防护转型的关键阶段,王力安防通过"研发一代、使用一代、储备多代"战略,已申请1000多项国家专利,其中100多项发明专利,专利数量行业领先。2024年公司净利润同比增长154.09%,研发投入达7801.98万元。王力安防组建了超400人的研发团队,与北大、浙大等高校开展创新研究,参与制定60余项行业标准,推动行业安全标准整体提升。作为行业创新标杆,王力安防通过品牌势能助推青年创业,为大学生搭建从理论突破到商业落地的实践平台,助力安防门锁行业向更智能、可持续方向发展。

  • 格创东智CIM AI Insight实现“数据追人”,产能决策时间压缩90%

    半导体制造面临数据迷雾困境:晶圆生产涉及上千道精密工序,良率波动0.1%即可能造成千万级损失。传统数据分析依赖人工跨系统提取数据,效率低下且难实时联动。格创东智推出CIM+AI+Insight解决方案,通过自然语言交互、多智能体协作和动态仪表板三大创新,实现"数据找人"的智能化转型。该系统具备三大核心价值:1)自然语言查询替代SQL编写;2)ChatYMS等智能体自�

  • 小米YU7搭载2200MPa小米超强钢!背后支持大学“技术王牌”揭秘

    小米汽车联合东北大学王国栋院士团队、育材堂共同研发的2200MPa超强钢技术取得突破,应用于小米SU7车型。该钢材抗拉强度较1500MPa热成型钢提升40%,A柱、B柱承载能力分别提升25%和70.5%,四门防撞梁性能显著增强。这项技术由东北大学轧制技术及连轧自动化国家重点实验室(现数字钢铁全国重点实验室)主导研发,该团队曾率先开发出2000MPa级热成型钢。育材堂作为技术转化平台,汇聚了多位钢铁领域专家。此次创新标志着国产汽车钢材达到国际领先水平。

  • 五个关键,解读阿里大文娱焕新「虎鲸文娱」

    阿里巴巴动物园迎来了一位新的伙伴。5月21日,阿里大文娱集团举办焕新发布会,即日起更名为虎鲸文娱集团(以下简称「虎鲸文娱」),旗下阿里影业拟更名为大麦娱乐。 在全员公开信中,虎鲸文娱提到了更名的原因,称「以创业心态进一步聚焦核心业务,以更清晰的形象贴近用户和行业伙伴,是我们必然的选择。」并提到虎鲸身型庞大但灵活聪明,能适应各种复杂环境;�

  • 开创性技术:微算法科技集成模糊分析网络过程和模糊回归方法用于比特币价格预测

    随着比特币等加密货币的崛起,数字资产市场快速发展但波动剧烈。传统金融分析方法难以适应其高波动性和不确定性。微算法科技(NASDAQ:MLGO)开发了集成模糊分析网络过程(FANP)和模糊回归方法的新技术,通过综合考虑市场情绪、技术指标等多重因素,建立模糊预测模型。该技术能提供区间预测而非精确值,更符合加密货币市场特性,帮助投资者制定策略并管理风险。相比传统方法,这种模糊逻辑技术具有更高灵活性和适应性,为数字资产市场提供了更可靠的分析工具。

  • 马上消金揭秘:航班取消“理赔”背后,屏幕共享如何盗走你的钱?

    近期出现新型机票退改签诈骗手段,骗子冒充航空公司客服,以航班取消需办理退款或改签为由实施诈骗。典型案例中,王女士在出行前一天接到"客服"电话,对方准确报出其身份和航班信息后,诱导其下载会议软件并开启屏幕共享功能,最终导致银行卡资金被盗。此类诈骗往往利用受害者出行前的紧张心理,通过非法渠道获取订票信息增强迷惑性,再以"赔偿金"为诱饵诱导开启屏幕共享窃取隐私信息。防范建议:1.通过官方渠道核实航班变动信息;2.警惕陌生链接和二维码;3.不下载不明APP或开启屏幕共享;4.妥善保管个人隐私信息。发现可疑情况应立即报警。