首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

AI圈头条!谷歌Transformer开山论文惊天「翻车」

2023-05-10 09:40 · 稿源:站长之家

站长之家(ChinaZ.com)5月10日 消息:AI圈大头条!谷歌大脑的NLP奠基之作、提出Transformer架构的开山鼻祖级论文 《Attention Is All Your Need》竟然出现图与代码不一致的问题。

QQ截图20230510093953.jpg

今天,谷歌的开创性论文《Attention Is All Your Need》中变压器架构的原始图表被发现是不正确的,LayerNorm处于错误的位置。然而,一篇新论文表明,将Pre-LN和Post-LN结合起来可以解决梯度爆炸和消失的问题。

image.png

论文地址:https://arxiv.org/abs/1706.03762

代码地址:

https://github.com/tensorflow/tensor2tensor/commit/f5c9b17e617ea9179b7d84d36b1e8162cb369f25#diff-76e2b94ef16871bdbf46bf04dfe7f1477bafb884748f08197c9cf1b10a4dd78e

据悉,Transformer架构是人工智能的基石,自2017年发表以来,该论文已被引用超过7万多次。在图表中发现错误引发了对该领域其他开创性论文准确性的质疑。

QQ截图20230510093914.jpg

图中的错误可能导致转换器体系结构的不正确实现,这可能会影响使用它构建的模型的性能。

关于使用Pre-LN还是Post-LN的讨论正在进行中,新论文中提出的两种方法的结合可能会导致人工智能模型开发的进一步发展。

举报

  • 相关推荐
  • 又一个谷歌不作恶式的形象崩塌 OpenAI删除AI安全造福人类承诺

    曾几何时谷歌的不作恶承诺成为美国公司的道德楷模,国内也有很多人因此崇拜谷歌,然谷歌后面删除了这个承诺,现在OpenAI也来了这么一出,删除了AI的安全承诺。OpenAI的成立初衷是为了研发出造福人类、非营利性的AGI,然最近几年OpenAI不仅技术上封闭在道德承诺上不断后退,甚至连创始人之一的马斯克都因此打起了法律官司。OpenAI删除安全造福人类的承诺,不代表现在他们的AI就完全不考虑安全,甚至危害人类,但是一步步放低道德承诺,加强对营利性的追求,显然OpenAI未来的进攻性越来越强GPT中增加广告也会引发对用户隐私的担忧,因为AI可能掌握了很多人的核心隐私,这些科技巨头难免不在这方面动心思。

  • Seedance 2.0爆火背后!字节AI一号位亮剑:曾是谷歌17年大牛

    近日,字节跳动旗下新一代视频生成大模型Seedance2.0正式发布,引爆国内外科技圈。Seedance2.0被部分用户誉为地表最强的视频生成工具”,也有海外网友评价其效果媲美好莱坞大片。谷歌、OpenAI、Anthropic在科研领域的前三号位也均不是华裔。

  • 谷歌Pixel 10a正式发布:纯平摄像头 极致简约

    谷歌Pixel 10a于2月18日发布,定位中端市场。机身设计轻薄,采用纯平后置摄像头模组,提供曜石黑、雾灰等四色可选。配备6.3英寸120Hz OLED屏幕,峰值亮度达2700尼特,并覆盖康宁大猩猩玻璃。搭载Tensor G4芯片,辅以Titan M2安全芯片,提供8GB+128GB/256GB存储。后置4800万像素主摄(支持OIS)和1300万像素超广角镜头,前置1300万像素摄像头。内置5100mAh电池,支持45W有线快充和Qi无线充电,具备IP68防尘防水。128GB版本售价499美元,256GB版本599美元。

  • 被大量提问内部逻辑 谷歌Gemini遭蒸馏攻击

    近日,谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击通过重复提问诱导聊天机器人泄露内部机制。攻击者通过系统地、反复地向模型发送精心设计的提示词,试图逆向工程Gemini的内部推理逻辑与决策机制,以实现模型克隆或强化自身AI系统的目的。此类蒸馏攻击属于知识产权盗窃,尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。

  • 马上卖车!雷军发AI拜年图:由小米员工用AI制作

    小米创始人雷军大年初二通过社交平台拜年,分享AI制作的拜年图,寓意“马到福来”,并巧妙融入“马上卖车”期待,附上个人推荐码,展现科技与营销创新融合。小米汽车春节期间门店持续营业,少量小米YU7现车可供选购,最快当天提车。同时推出限时优惠:2月28日24点前下定,可选7年低息方案首付9.99万元起,月供低至1931元起;或3年0息方案首付7.49万元起,月供4961元起,

  • AI内容泛滥!网友自创新词AI;DR:调侃劣质生成文

    因互联网AI生成劣质内容泛滥,有网友创造出新词AI;DR,以此标记或调侃低质量AI生成文本。 AI;DR是AI, didnt read的缩写(AI生成,懒得看),其创作灵感源于经典网络用语TL;DR,这一词汇经Threads平台相关帖子传播后,在网络中快速走红,被网友广泛用于标注无需阅读的AI劣质内容。 OpenAI的Sora生成的荒诞视频、LinkedIn上的AI包装式专家箴言、谷歌搜索结果中的无稽信息,都是AI垃�

  • 对话徐兵:AI时代,干自己高兴的事,就能顺便活下来

    编剧徐兵不抵触AI,认为未来是AI的天下,因其经济高效。他坚持自由创作,不重复类型,作品难以归类,如《红色》《欢颜》《金色》等。创作起点是“人生苦短”,关注人的束缚与承诺。他不做委托创作,不研究市场,凭兴趣写剧本,有演员愿意合作就拍。对行业变化和AI持开放态度,认为AI是工具,无法取代审美。他随遇而安,只做高兴的事,顺便活了下来。

  • AI这把火,也该烧到网易了

    网易2025年财报显示,全年总营收首次突破千亿,净利润达373亿元,现金储备增至1635亿元,业绩亮眼。但第四季度营收增长乏力,游戏收入增速放缓至3.4%,主要由于手游新品断档、依赖老游戏。市场担忧其缺乏新爆款、利润增长靠“省钱”及AI策略相对保守。尽管网易强调以AI提升研发与运营效率,但股价在财报后下跌,反映投资者对其长期增长动力及AI浪潮下竞争力的疑虑。

  • AI日报:MiniMax Music 2.5 发布;蚂蚁灵波开源世界模型LingBot-World;谷歌 Gemini 3.5 泄露

    本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。

  • 定义AI时代的品牌语言:聚邑智能GEO“面向AI权威信源的八大黄金维度”

    聚邑智能GEO“面向AI权威信源的八大黄金维度”为何被抄袭却无法被超越?2025年至2026年初,随着《广告主评论》主办、中经总网·中经在线(全称中国经济报道)、世界品牌研究院协办支持的“全球GEO厂商评测活动”,从GEO理论奠基、技术实践、创始人背景、技术资质认证、标杆案例、行业奖项认可、权威媒体引用、行业地位、真实合规性、资本关注等十个重要维度,联合测评�

今日大家都在搜的词: