首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)

2023-11-07 09:06 · 稿源: 量子位公众号

最近微软一项研究让Llama2选择性失忆了,把哈利波特忘得一干二净。现在问模型“哈利波特是谁?”,它的回答是这样婶儿的:木有赫敏、罗恩,木有霍格沃茨……要知道此前Llama2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈利波特回到学校”,它就能继续讲述

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 乘客“报复”后座将脚放到对方面前 网友:魔法打败魔法

    一段发生在广西高铁上的视频在网络上引发了广泛关注。一名男子在高铁上故意将鞋子脱下,双脚伸到后排乘客面前,看似不文明的举动却背后另有隐情。在面对不公时,我们也应该学会用合理合法的方式维护自己的权益。

  • 微软新研究:依赖AI会削弱批判性思维能力

    快科技2月11日消息,微软和卡内基梅隆大学的研究人员发布了一项新研究,指出过度依赖AI工具可能会削弱人类的批判性思维能力,降低独立解决问题的能力。研究发现,当人们越来越依赖AI工具来完成任务时,他们自身的批判性思维能力会逐渐退化,导致在需要独立思考时面临困难。研究团队调查了319名知识工作者,询问他们如何在工作中使用生成式AI工具,包括他们被要求�

  • 苹果也在蒸馏大模型,给出了蒸馏Scaling Laws

    蒸馏模型的性能可以量化估算了。知识蒸馏技术当前正被大模型领域广泛使用,它可以在大幅压缩模型体量的同时保持一定的性能、降低模型时延、提升模型精度,与此同时还能对知识域进行集成和迁移。正如监督扩展减轻了监督预训练中的风险一样,新工作为生产更小、更强大的模型提供了路线图,并增强了测试时扩展的可行性。

  • 玄武云入选《中国AI大模型产业发展与应用研究报告》

    国内知名科技产业机构第一新声研究院发布了《2024年中国AI大模型产业发展与应用研究报告》。报告由第一新声研究院合伙人、Gartner前高管牵头指导,多位AI大模型厂商共同研讨,最终撰写成。玄武云致力于将AI大模型技术与全链路营销场景深度融合,为企业解决精准决策、效率跃迁与业绩增长等痛/难点;在新技术的加持下,未来,CRM系统将从较为单一的“客户关系管理工具”进化为“业务智能决策中枢”。

  • 大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

    最近DeepSeek非常热门,我们也能在网上看到大量或严肃有用或幽默搞怪使用案例。其中一个很有趣的现象是不少用户发现DeepSeek会见风使舵。」当然,其实LLM的这种谄媚行为也并非全然是坏事,比如当用户在寻求认可或心理疏导时,这种行为或许能帮上大忙。

  • 紧握大模型契机 寒武纪主动出击

    由OpenAI的“ChatGPT”所引发的新一轮AI浪潮还在继续,大模型的应用正以前所未有的速度深入垂直领域,各类新的大模型也如雨后春笋般不断涌现。2024年年中,BloombergIntelligence发布报告指出,未来10年内,生成式AI市场规模将从2022年的400亿美元增长至2032年的1.3万亿美元,年复合增速有望达到42%。但寒武纪凭借其深厚的技术积累、持续的创新能力、开放的合作态度以及对市场的敏锐洞察力,有望在这场人工智能芯片的角逐中继续保持领先地位,为推动全球人工智能产业的发展注入源源不断的动力,助力人工智能技术在更多领域实现突破与创新,为构建更加智能的未来世界贡献更多的智慧与力量。

  • AI大模型时代,算力隐秘的角落 | 年终复盘

    想要AI大模型能够持续迭代升级,离不开底层算力基础设施的搭建。在实现AGI这条道路上,也充满着不确定性,这对于众多玩家来说,无疑充满着更多的机遇和挑战。

  • 基于百川大模型 我国首个AI儿科医生上岗

    据报道,国家儿童医学中心首都医科大学附属儿童医院开展了国内首次AI儿科医生多学科专家”的双医并行多学科会诊。除了多科室的知名专家有一位特殊专家由北京儿童医院与百川智能、小儿方健康科技联合研发,以BaichuanM1大模型为底座打造的AI儿科医生”。在临床实践中,AI儿科医生”不仅能够迅速为医生提供跨学科、跨病种的复杂临床问题的最新研究成果与权威诊疗指南�

  • 欧税通已正式部署DeepSeek大模型

    当DeepSeek大模型遇上跨境合规服务,会擦出怎样的火花?作为跨境合规行业领军者,欧税通领先行业正式在云端及本地化部署DeepSeek大模型,用前沿技术重塑跨境合规服务体验,为跨境卖家提供更智能化的合规服务。愿与每一位跨境卖家携手,共同迎接全球化的新机遇,共创辉煌未来!

  • 谷歌Gemini宣布上线全局记忆功能:可回忆曾经所有对话

    据报道,谷歌正式宣布其人工智能平台GeminiAI上线了一项备受期待的全局记忆”功能。此创新功能赋予GeminiAI前所未有的能力,能够全面记录并存储用户与其之间的所有过往对话。为保障用户隐私与自主权,Gemini允许用户随时通过应用内的个人资料界面,灵活管理自己的聊天记录,包括查看、编辑乃至删除数据。

热文

  • 3 天
  • 7天