首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

硅谷有了自己的鲁迅!AI大佬LeCun连续暴走,从马斯克到OpenAI,全被怼了个遍

2024-05-29 10:41 · 稿源: ​硅星人Pro公众号

声明:本文来自于微信公众号硅星人Pro(ID:Si-Planet),作者:周一笑,授权站长之家转载发布。

当地时间 5 月 26 日,马斯克旗下的人工智能初创公司xAI宣布完成B轮 60 亿美元融资。主要的投资者包括 Valor Equity Partners、Vy Capital、Andreessen Horowitz、红杉资本等。

xAI2023 年 7 月份成立,不到一年时间估值已达 240 亿美金,是OpenAI( 800 亿美金)三分之一。融资总额也仅次于OpenAI和Anthropic,正式跨入大模型第一梯队。xAI目前已经发布了Grok1(已开源),Grok-1.5(长上下文理解和高级推理能力)Grok-1.5V(xAI首款多模态大模型)。

另外,马斯克还计划在 2025 年秋季建成一座“算力超级工厂”为xAI提供算力支持,预计将使用 10 万块英伟达H100 GPU。

但马斯克的风头却很快被一个人“抢走”。这人就是机器学习之父、图灵奖得主、Meta首席人工智能科学家Yann LeCun。

在xAI融资消息披露之后,马斯克顺势在X上发布了一条xAI招聘技术人员的推文:“如果你相信我们的使命是理解宇宙,并且需要最严格地追求真理,不顾及受欢迎度或政治正确性,那么请加入xAI。”

然后Yann LeCun就出来拆台了,语气毫不客气:

图片

图片

他先是迅速回应了马斯克的招聘帖子:“如果你能忍受这样的老板,请加入xAI:声称你正在研究的东西明年就能解决(毫无压力)。声称你正在研究的东西会毁灭所有人,必须停止或暂停(哇, 6 个月的假期!)。声称要‘最严格地追求真理’,但在他自己的社交平台上散布疯狂的阴谋论。”

LeCun的评论是在讽刺马斯克此前的言论。今年四月份,马斯克声称通用人工智能将在明年到来,以及马斯克上周在“欧洲科技创新展览会”上重申的这一预测,并认为AI有10-20%的可能性会摧毁人类的言论。

而“六个月的休假”指的是马斯克等人曾在去年 3 月发布要求暂停AI开发 6 个月的联名信说。Lecun在当时就对此表示反对:“今年是 1440 年,天主教会呼吁暂停使用印刷机和活字机 6 个月。想象一下,如果平民获得书籍,会发生什么?他们可以自己阅读圣经,社会就会被摧毁。”

最后,这位“AI教父”还讽刺了马斯克在X平台上分享未经证实的言论行为。

图片

在评论区马斯克和LeCun继续“对线”,双方言辞都相当激烈:

先是网友问LeCun为什么不创办自己的AI公司,而是留在Meta还喷别人。

LeCun回复说我是科学家,不是商业或产品领域的人士。

马斯克灵魂拷问:那过去五年你在“科学领域”都做了啥?

LeCun说自己“发了 80 篇Paper”还带上Scholar主页。

马斯克继续回怼:“这算啥,你太松懈了,你得支棱起来啊。”

LeCun也不示弱:“说的你好像是我老板。”

图片

LeCun还反驳了那些轻视学术论文观点,作为“卷积网络之父”,他举例说明卷积神经网络(ConvNets)这一在 1989 年由学术论文引入的技术,已经成为当今几乎所有驾驶辅助系统的核心组成部分。

他进一步强调,技术奇迹并不是凭空出现的,而是建立在多年甚至数十年的科学研究基础之上的。科学研究的想法和成果通过技术论文的形式被分享出来。没有这种科学信息的共享,技术进步将会大幅放缓。

在AI监管问题上,LeCun和马斯克的观点也不一致,前者一直反对过度监管AI,主张AI的开放性和共享性,反对过度的监管限制,两人这次也在这个话题上再次交锋。

图片

LeCun在X上表示目前无需过度担忧AI风险问题,进行监管也为时过早。

马斯克回复:准备好被监管吧。还配上了一个笑哭的表情。LeCun则阴阳了马斯克一句:你对“不要训练超过10^26flops的模型”感到高兴吗?

这是指拜登去年 10 月签署的关于人工智能的行政命令,要求使用具有10^26 FLOPS能力的模型的公司向美国政府报告基础模型训练运行和部署的计划,而马斯克一直在积极呼吁要立法人工智能监管。

句句扎心,LeCun简直成了硅谷自己的鲁迅。

1

Lecun:AI末日论者都别跑

而这也不是这位硅谷鲁迅第一次在互联网上和人针锋相对。

他时常因其直言不讳的风格在网上引发了讨论和争议,尤其是关于AI安全。LeCun对AI末日论持有明确的反对态度,并且对开源和人工智能的未来持乐观态度。

LeCun多次在公开场合和访谈中表示,AI毁灭人类的概率为零,认为 AI 末日论是无稽之谈。并且LeCun似乎会主动找机会,“喷”任何持AI末日论观点的人。

在Geoffrey Hinton携手一众大神关于AGI风险治理的声明,Lecun没有署名,并且直接在X上点名了Sam Altman和DeepMind的Hassabis等人,认为他们试图通过游说监管来巩固自己的行业地位,阻碍开放AI推进。

图片

最近一段时间热议的OpenAI超级对齐团队人员离职,引发对AGI安全问题的隐忧的事件中,LeCun也没有缺席。

先是OpenAI首席科学家兼联合创始人Ilya Sutskever在宣布离职,同一天,“超级对齐”团队的另一名负责人Jan Leike也宣布离开了OpenAI,并表示OpenAI在过去的几年里安全文化和流程被抛到了一边,让位于打造产品,OpenAI必须成为一家安全第一的AGI公司。

图片

马斯克随后进补了一刀:言外之意就是说安全并不是OpenAI的首要任务。

LeCun也再次出来唱反调,表明了他对AI安全问题的立场:

图片

在LeCun对Jan Leike对回复中,他表示当前对AI安全担忧的紧迫感是过度夸张的,类似于在涡轮喷气发动机发明之前,急于解决跨洋飞行的安全问题。所以也难怪OpenAI会边缘化对齐团队。

在他看来,当前的AI还不如猫智能,我们首先需要设计出比家更聪明的系统。并提到,就像飞机技术的发展一样,智能系统的进化需要多年时间,应该通过反复的工程改进逐步提高其智能和安全性,而不是过度担忧未来可能的风险。

图片

关于AI安全和治理问题,Yann LeCun此前与另一位人工智能先驱Yoshua Bengio在网上也进行过激烈辩论。LeCun呼吁信任人工智能可靠性的AI科学家和工程师发声,而Bengio强调开放源AI平台的潜在风险,以及安全和治理的重要性。两人的辩论反映了AI研究者之间对AI潜在风险、现有安全措施的有效性和未来发展路径的重大分歧。

LeCun认为,与其想象灾难性的场景,不如专注于设计安全的AI系统。他相信,通过正确的设计和工程方法,AI系统可以变得安全和可靠。他认为已经有大量的资金投入到确保AI系统安全和可靠的工作中,这表明行业内对AI安全的重视和努力。LeCun强调,AI的设计初衷是为了增强人类智能,而不是造成伤害。他不同意将AI系统比作武器的观点,认为这样的类比是不恰当的。

1

大语言模型无法通向AGI,不要浪费时间

虽然Meta推出了开源大型语言模型Llama,但Yann LeCun作为Meta的首席人工智能科学家及FAIR(Facebook AI Research)负责人,对LLM的不看好却是尽人皆知。

他最近还直接对学生喊话:如果你对下一代人工智能系统感兴趣,不要研究大型语言模型。

在近日与英国《金融时报》的一次访谈中,他反对依赖不断发展的 LLMs 来追求人类级别的智能,因为这些模型只有在被输入正确的训练数据时才能准确回答问题,因此“本质上是不安全的”。

谷歌DeepMind还花了几年时间寻找构建AGI的替代方法,包括强化学习等方法,其中人工智能代理在类似游戏的虚拟环境中从周围环境中学习。

所以他转而专注于一种根本性的替代方法,正在努力开发一个全新的AI系统,希望这些系统能够为机器提供人类级别的智能,尽管他表示这一愿景可能需要 10 年才能实现。

图片

LeCun认为,LLM的自回归性质(根据之前的单词预测下一个单词)从根本上限制了它们实现真正智能的能力。他主张联合嵌入预测架构 (JEPA) 作为一种更有前景的AGI方法。LeCun还批评了当前对基于文本的学习的关注,认为需要观察物理世界并与物理世界互动,以建立对规划和推理至关重要的全面世界模型。

他强调感官输入以及与物理世界的互动对于发展真正的智力的重要性。他指出,接受过大量文本数据训练的LLM缺乏像人类和动物那样推理、计划和理解世界的能力。LeCun建议未来的人工智能系统需要:

1、结合感官输入以更深入地了解世界。

2、与基于文本的学习相比,以更高的带宽处理信息(例如,人脑以每秒约 20 兆字节的速度处理视觉信息)。

3、立足现实,拥有经验知识,展现常识推理。

图片

李飞飞近日和斯坦福哲学教授Etchemendy在《时代(Time)》上刊载文章,指出当前技术路线无法制造有感知能力的AI,该文章也得到了LeCun的转发支持。

尽管Llama最初是由LeCun领导的FAIR开发的,但现在已经转交给了专注于技术和产品开发的GenAI部门,FAIR则专注于更长远的目标:开发能够达到人类智能水平的新AI架构和方法。

许多人认为Yann LeCun喜欢发表一些争议言论,但更重要的背景是目前AI未来发展中产生的问题。作为人工智能领域最知名的人士之一,Yann LeCun在某种程度上有义务站出来,为这个充满争议的领域提供一些清晰的见解。

LeCun说,实现AGI不是一个产品设计问题,甚至不是一个技术开发问题,在很大程度上是一个科学问题。

如果这个说法是成立的,那么在通往探索AGI的道路上,显然我们需要更多他这样的“鲁迅”。

举报

  • 相关推荐
  • 大家在看
  • Partnerplace:合作伙伴管理工具,提升合作效率。

    Partnerplace是一款专为合作伙伴关系管理设计的在线工具,它通过自动化繁琐的任务,如佣金处理,帮助企业高效管理和发展合作伙伴网络。该工具支持定制化合作伙伴计划,实现品牌专业体验,并通过集中化平台提高工作效率。Partnerplace的价值观包括弹性、参与度和连接性,旨在为用户提供一个完全定制化的、参与性强的、连接销售团队和CRM系统的合作伙伴管理系统。

  • Depth Anything V2:先进的单目深度估计模型

    Depth Anything V2 是一个经过改进的单目深度估计模型,它通过使用合成图像和大量未标记的真实图像进行训练,提供了比前一版本更精细、更鲁棒的深度预测。该模型在效率和准确性方面都有显著提升,速度比基于Stable Diffusion的最新模型快10倍以上。

  • OTTO SEO by Search Atlas:革命性的AI SEO工具,简化SEO工作流程。

    OTTO SEO是Search Atlas推出的一款AI驱动的SEO工具,旨在通过自动化技术优化网站,提高SEO效率。它通过添加OTTO像素到网站,能够自动执行网页优化,包括技术修复、内容优化、反向链接建设和内容创作。OTTO SEO的主要优点在于节省时间、提高效率,并帮助营销团队或代理公司实现SEO策略的自动化和优化。

  • AI drafts by Help Scout:提升客服团队效率,实现个性化客户服务。

    Help Scout提供的AI客服平台,通过人工智能技术,帮助客服团队提升工作效率,减少重复性工作,让团队成员能够专注于更复杂和个性化的客户对话。平台特点包括无需编程即可使用、快速回复、提升客户满意度,以及通过AI生成回复草稿等。

  • OpenVLA:开源视觉-语言-动作模型,推动机器人操作技术发展。

    OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。

  • VideoLLaMA 2:视频理解领域的先进空间-时间建模与音频理解模型。

    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在多选视频问答和视频字幕生成等任务上展现了卓越的性能。

  • HumanPlus:人类动作模仿与自主技能学习系统

    HumanPlus是一个研究项目,旨在通过模仿人类动作来训练人形机器人,从而实现自主技能学习。该项目通过模拟强化学习训练低级策略,并将这些策略应用到真实世界中,实现实时跟踪人类身体和手部动作。通过影子模仿技术,操作员可以远程操作机器人收集全身数据,用于学习不同任务。此外,通过行为克隆技术,机器人能够模仿人类技能,完成各种任务。

  • Jace:AI助手,助力高效营销与管理。

    Jace是一款商业领域的AI助手,专注于提升营销效率,无需专业技能即可轻松启动和管理营销活动。其主要优点包括创建针对性的营销活动、实时监控性能和随时优化。

  • ARC-AGI:人工智能通用推理测试集

    ARC-AGI是一个旨在测试人工智能系统是否具备类似人类一般流体智力的抽象和推理能力的数据集。它由400个训练任务和400个评估任务组成,每个任务都以JSON格式存储,包括输入输出对。该数据集可以作为人工智能基准测试、程序合成基准测试或心理测量智力测试。

  • PROTEUS:实时表情生成人类模型

    PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。

  • Warp:AI和协作工具重新定义的终端

    Warp是一款使用Rust语言编写的终端应用程序,它通过集成AI和协作工具,提供了现代化的编辑、命令生成、可复用工作流和知识共享等功能,旨在提升开发者的生产力。Warp的AI功能可以建议正确的命令或解答编程问题,同时保持请求的私密性和安全性。Warp Drive允许用户组织难以记忆的命令,提高个人和团队的效率。此外,Warp还提供了自定义主题和以隐私为设计原则的安全性。

  • TalkWithGemini:一键部署您的私人Gemini应用

    TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

  • PowerInfer-2:专为智能手机设计的高效大型语言模型推理框架

    PowerInfer-2是一个为智能手机特别优化的推理框架,支持高达47B参数的MoE模型,实现了每秒11.68个token的推理速度,比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术,显著减少了内存使用,并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景,以增强数据隐私和性能。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

  • Surface:使用AI提升表单转化率

    Surface是一个基于AI技术的在线表单构建工具,专为营销和需求生成团队、CRO专家以及领英生成团队设计。它提供了一个无代码表单构建器,能够创建与品牌匹配的多步表单,提升转化率并收集部分响应数据。通过AI技术,Surface可以提高潜在客户的筛选过程,确保用户专注于最有希望的潜在客户。此外,它还提供了强大的入站工作流程自动化,以及2000多个集成选项,帮助用户有效地捕获、培养和转化潜在客户。

  • MotionClone:训练无关的运动克隆,实现可控视频生成

    MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。它利用时间注意力机制在视频反转中表示参考视频中的运动,并引入了主时间注意力引导来减轻注意力权重中噪声或非常微妙运动的影响。此外,为了协助生成模型合成合理的空间关系并增强其提示跟随能力,提出了一种利用参考视频中的前景粗略位置和原始分类器自由引导特征的位置感知语义引导机制。

  • Leonardo Phoenix:创新的AI基础模型,提供卓越的提示遵循能力。

    Leonardo Phoenix是Leonardo AI平台推出的一款基础模型,它在提示遵循、图像生成清晰度和AI研究方面取得了突破性进展。该模型通过架构创新,提供了更高质量的图像生成,特别是在人像、横幅、海报和标志的文本生成方面表现出色。此外,它还增强了创造性控制,允许用户通过提示增强和AI提示编辑来轻松获取和快速修改生成内容。尽管目前一些功能如图像引导、元素和照片写实尚未集成,但预计将在不久的将来加入。

  • Uizard Autodesigner 2.0:AI驱动的UI设计生成器,快速实现设计和原型制作。

    Autodesigner 2.0是Uizard公司推出的最新版AI UI设计生成器,它结合了ChatGPT的对话流和Uizard的生成设计能力以及拖放编辑器,使用户能够仅通过文本提示实时设计和迭代。该产品通过AI技术简化了UI设计流程,提高了设计效率,尤其适合产品经理、设计师、市场营销人员、初创公司创始人和开发者等不同背景的用户。

  • KREA AI Enhancer:视频和图像增强工具,提升画质清晰度。

    KREA AI - Enhancer 是一款在线视频和图像增强工具,利用AI技术提升视频和图像的清晰度和质量。它通过实时处理,帮助用户改善视觉内容,适用于需要高质量视觉素材的专业人士和爱好者。产品背景信息显示,KREA AI - Enhancer 通过AI算法优化,能够在短时间内提供高质量的输出,是内容创作者和编辑者的理想选择。

今日大家都在搜的词:

热文

  • 3 天
  • 7天