斯坦福提出“统一归因”框架保证大模型输出的真实性和可靠性

2023-12-21 09:23 · 稿源：站长之家

站长之家（ChinaZ.com）12月21日消息:随着大型语言模型在实际业务中的广泛应用，确保其输出的真实性和可靠性成为亟待解决的问题。学术界采用“归因”方法来追踪和证实模型输出的内容。

当前研究领域主要分为两大派系，即协同归因和贡献归因。前者关注验证大模型输出的正确性，后者用于确定训练数据对模型输出的影响程度。在法律、医疗、金融等领域，对内容准确性有高要求的行业，这两种方法至关重要。

论文地址:https://arxiv.org/pdf/2311.12233.pdf

然而，现有的研究方法存在独立进行的问题，为此，斯坦福大学的研究人员提出了“统一归因”框架。这一框架整合了协同归因和贡献归因的主要功能，使开发者能够更方便地对大型语言模型进行安全性和内容验证。

协同归因通过引文生成验证、知识检索验证和事实验证等功能，验证大模型的输出是否正确，并与外部知识进行比较。贡献归因方法通过影响函数验证、数据模拟器验证和数据模型验证等功能，用于确定训练数据对大模型输出的影响程度。

这一“统一归因”框架为开发者提供了更全面、一体化的工具，以验证大模型的输出和训练来源。通过整合两种归因方法，开发者可以更全面地了解模型的行为，提高对模型输出的信任度。因此，这一框架对于保障大型语言模型在各行业应用中的安全性和可靠性具有积极的推动作用。

随着大模型在实际应用中的不断发展，保证其输出的真实性和可靠性是当前亟需解决的问题。斯坦福提出的“统一归因”框架为解决这一问题提供了新的思路和方法，有望推动大模型在各行业中的更广泛应用。

（举报）

相关推荐
大家在看

关键词：

框架

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
斯坦福团队大模型Octopus v2火了：手机就能运行准确性超越GPT-4

斯坦福大学研究人员发布的Octopusv2模型引起了开发者社区的极大关注，其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行，并在准确性和延迟方面表现超越了GPT-4，同时将上下文长度减少了95%。设备端AI智能体时代即将到来，Octopusv2的发布为这一趋势注入了新的活力。

Octopusv2 AI头条
斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火

斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型，这款模型以其在端侧设备上的强大运行能力受到广泛关注。论文:Octopusv2:On-devicelanguagemodelforsuperagent论文地址:https://arxiv.org/abs/2404.01744模型主页:https://huggingface.co/NexaAIDev/Octopus-v2Octopusv2的推出，标志着设备端AI智能体时代的来临。对于那些对AI技术充满热情的开发者和企业来说，Octopusv2无疑提供了一个全新的�

Octopusv2
微软联合Quantinuum推最可靠逻辑量子比特量子计算可靠性提升800倍！

微软联合Quantinuum取得了历史性突破，展示了史上最可靠的逻辑量子比特，解决了量子计算的两大关键问题，可靠性提升了800倍。通过将微软的量子比特虚拟化系统应用于Quantinuum的硬件，在14000多次实验中，量子计算没有出现任何错误，相比于使用物理量子比特，可靠性大幅提升。此次突破标志着量子计算领域迎来新的发展时代，为解锁之前棘手问题的解决方案提供了有力支持�

量子计算 AI头条
荐奥特曼斯坦福演讲：专注当前AI局限性没用，GPT-5让一切努力过时

黄仁勋亲自为OpenAI送来了全球第一台NvidiaDGXH200超级计算机，三人合影引得大家津津乐道。奥特曼也没闲着，现身斯坦福大学的Nvidia礼堂发表演讲，大约超过1000名学生排起了长队。奥特曼表示一年前他们推出的GPT-4曾引发了人们两周的恐慌，人们认为这是一件疯狂的事，世界被永远改变了。

GPT-5
蚂蚁集团等发布开源大模型知识抽取框架OneKE

蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务，为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能，并将相关技术应用到金融、医疗、政务等领域，推动可控生成技术的产业落地。
干货！斯坦福发布《2024 年人工智能指数报告》

斯坦福大学人工智能研究院发布的《2024年人工智能指数报告》提供了对2023年人工智能领域进展的全面分析，覆盖了技术进步、经济影响、政策制定和公众舆论等多个方面。以下是报告的一些关键要点:技术进步:行业研究贡献:行业在AI研究方面发挥了重要作用，2023年贡献了51个重要的机器学习模型学术界仅贡献了15个。报告也强调了需要关注AI的伦理、责任和社会影响，以确保其发展能够造福全人类。

斯坦福大学人工智能 AI头条
谷歌推出”自我发现“框架，极大增强GPT-4等大模型推理能力

随着ChatGPT的出现，大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面，面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量，也就是说可以节省很多算力资源。

GPT-4
荐李飞飞主讲，斯坦福2024 CS231n开课，依旧座无虚席

「这是自Karpathy和我2015年启动这门课程以来的第9个年头，这是人工智能和计算机视觉令人难以置信的十年!」知名AI科学家李飞飞的计算机视觉「神课」CS231n，又一次开课了。总共600多位学生报名，第一堂课的现场座无虚席:从2015年到如今，CS231n已经走到九个年头，也成为了一代计算机视觉专业学生心中的「必修课」:虽然课程代码不变，但可以猜到，2024年的课程相比2021年版本的课程有不少新增内容，这还要归因于视觉生成技术三年来的巨大飞跃。值得注意的是，在CS25课程中，除了基于自然语言处理的演讲内容之外，也覆盖了视觉Transformer的相关内容。

CS231n AI 李飞飞
TOXCL：用于检测和解释隐性有毒言论的统一AI框架

社交媒体上的毒性言论可能会像野火般蔓延，特别是针对个人和边缘化群体。明显的仇恨言论相对容易被发现，但隐含毒性——依赖于刻板印象和编码语言不是明显的侮辱——提出了更为棘手的挑战。但通过谨慎使用，它为赋予边缘化声音权力和遏制网络上的压制性言论提供了一条道路。

TOXCL AI框架 AI头条
荐挑战拯救痴心“舔狗”，我和大模型都尽力了

大模型化身为“痴情男大”，等待人类玩家的拯救。一款名为“拯救舔狗”的大模型原生小游戏出现了。大模型在学习这个世界，也在创造一个AINative的世界，无论是大模型原生小游戏是功能越来越全的大模型对话，都在展现世界内容的互动变革，随着尺度规律的不断发展，下一步会怎样?在这次技术交流日上，商汤最后放出了一段文生视频，一起来看看。

大模型

今日大家都在搜的词：

热文

3 天
7天

斯坦福提出“统一归因”框架 保证大模型输出的真实性和可靠性

今日大家都在搜的词：

热文

站长商机

斯坦福提出“统一归因”框架保证大模型输出的真实性和可靠性