首页 > 业界 > 关键词  > 正文

基于 Transformer 的大模型如何从参数中提取知识

2023-07-26 14:39 · 稿源:站长之家专栏

站长之家(ChinaZ.com)7月26日 消息:最近一项由 Google DeepMind、特拉维夫大学和 Google 研究人员进行的研究,旨在探究基于 Transformer 的大型语言模型(LLMs)如何存储和提取事实关联。研究采用信息流的方法,研究模型如何预测正确的属性,并观察模型在不同层次中的内部表示是如何演变的。

image.png

论文地址:https://arxiv.org/abs/2304.14767

研究发现,模型的关键计算点与关系和主体位置有关。研究人员使用 "阻塞" 策略,阻止最后一个位置在特定层次上与其他位置产生关联,并观察推理过程中的影响。通过分析这些关键点和前面的表示构建过程,研究人员进一步确定了属性提取发生的位置。

研究人员发现了一种基于主体丰富过程和属性提取操作的内部机制。在模型的早期层次中,关于主体的信息在最后一个主体标记中得到丰富,而关系则传递给最后一个标记。最后一个标记使用关系通过自注意力机制从主体表示中提取相应的属性。

这些发现揭示了 LLMs 内部如何存储和提取事实关联的机制。研究人员认为,这些发现可以为知识定位和模型编辑开辟新的研究方向。例如,可以利用这种方法来确定 LLMs 获取和存储偏见信息的内部机制,并开发缓解这种偏见的方法。

总之,这项研究强调了研究 Transformer 模型如何存储和提取事实关联的内部机制的重要性。通过了解这些机制,研究人员可以开发更有效的方法来提高模型性能并减少偏见。此外,这种方法还可以应用于其他自然语言处理领域,如情感分析和语言翻译,以更好地理解这些模型的内部运作。

举报

  • 相关推荐
  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • 没想到,音频大模型开源最彻底的,居然是小红书

    不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源33款、31款各类型大模型。 这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小。

  • 海信G7 Ultra显示器参数公布:1152分区+2000nits亮度,黑曜屏加持领跑3K档

    海信G7 Ultra显示器于9月22日开启预约,定位三千元价位段,主打3A游戏画质体验。搭载1152分区Mini-LED背光,峰值亮度达2000nits,支持99% DCI-P3色域和DP2.1接口,实现4K@160Hz与FHD@320Hz双模切换。采用黑曜屏抗反光技术,结合低蓝光护眼功能,兼顾高对比度与舒适视觉。产品旨在突破电竞显示器画质瓶颈,最终售价将于9月26日发布会公布。

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 从价格混战到价值重塑——科龙静省电Ultra背后的行业转型思考

    2025年空调行业竞争加剧,价格战激烈、产品同质化严重,库存高达6000万套。科龙凭借41年技术积累,以“反内卷”思路推出静省电Ultra系列,通过美芝压缩机、双排7mm紫铜管等核心升级,APF值达6.26,结合AI节能技术再省电45%。产品定位2000-3000元主流区间,以“技术普惠”打破高能效必高价的认知,兼顾用户利益与社会责任,推动行业从价格竞争转向价值创造。

  • 元旦前登场!小米17 Ultra配备2亿像素无损变焦+徕卡增距镜

    小米17系列上市后市场反响热烈,首销两天销量突破百万,成为国产旗舰中的佼佼者。目前三款机型只是开胃菜,真正的旗舰小米17+Ultra预计元旦前发布,影像能力大幅提升,配备2亿像素无损变焦和徕卡增距镜,实现全链路真光变,长焦体验升级。该机搭载高通骁龙8 Elite Gen5平台,配备6.85英寸LTPO OLED 2K屏,边框比iPhone更窄,支持无线快充、防水和大电池。此外,小米NAS将与新机同台发布,主打普及和生态联动,兼容苹果设备,优化相册管理、存储等功能体验。

  • 小米17 Ultra外观曝光:没有背屏 Pro版独占

    小米17系列新品爆料:Ultra版主打专业影像,无背屏设计;Pro系列独享定制化背屏,可同步打车、外卖等实时信息。小米总裁卢伟冰称背屏斥资10亿打造,友商难跟进。Ultra版升级三摄,采用大R角直屏、极窄边框,搭载骁龙8 Gen5平台,支持UWB技术,预计春节前发布。小米与徕卡合作深化,将通过光学、芯片、算法提升移动影像体验。

  • 问界新M5 Ultra VS 小米YU7深度对比,多维解析智能SUV标杆

    在20-30万元新能源SUV市场,问界新M5 Ultra与小米YU7凭借突出的智能属性成为都市精英热门选择。两款车型均以辅助驾驶为核心卖点,但在硬件配置、软件算法及安全理念上存在差异。问界新M5 Ultra搭载三颗4D毫米波雷达和192线激光雷达,配合华为ADS系统,在感知精度和主动安全上更具优势;小米YU7采用单颗4D毫米波雷达和128线激光雷达,侧重被动防护。市场表现方面,问界新M5 Ultra销量稳步提升,叠加最高3.7万元购车权益,成为该价位段的优选车型。建议消费者实地试驾后结合需求理性决策。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

今日大家都在搜的词: