12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

2024-05-05 22:33 · 稿源：机器之心公众号

声明:本文来自于微信公众号机器之心（ID:almosthuman2014），作者:机器之心，授权站长之家转载发布。

没想到，自2012年 AlexNet 开启的深度学习革命已经过去了12年。

而如今，我们也进入了大模型的时代。

近日，知名 AI 研究科学家 Andrej Karpathy 的一条帖子，让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主 Yann LeCun 到 GAN 之父 Ian Goodfellow，纷纷忆往昔。

到目前为止，该帖子已经有63万 + 的浏览量。

在帖子中，Karpathy 提到:有一个有趣的事实是，很多人可能听说过2012年 ImageNet/AlexNet 的时刻，以及它开启的深度学习革命。不过，可能很少有人知道，支持这次竞赛获胜作品的代码是由 Alex Krizhevsky 从头开始，用 CUDA/C++ 手工编写的。这个代码仓库叫做 cuda-convnet，当时托管在 Google Code 上:

https://code.google.com/archive/p/cuda-convnet/

Karpathy 想着 Google Code 是不是已经关闭了（?），但他在 GitHub 上找到了一些其他开发者基于原始代码创建的新版本，比如:

https://github.com/ulrichstern/cuda-convnet

“AlexNet 是最早将 CUDA 用于深度学习的著名例子之一。”Karpathy 回忆说，正是因为使用了 CUDA 和 GPU，AlexNet 才能处理如此大规模的数据（ImageNet），并在图像识别任务上取得如此出色的表现。“AlexNet 不仅仅是简单地用了 GPU，还是一个多 GPU 系统。比如 AlexNet 使用了一种叫做模型并行的技术，将卷积运算分成两部分，分别运行在两个 GPU 上。”

Karpathy 提醒大家，你要知道那可是2012年啊!“在2012年（大约12年前），大多数深度学习研究都是在 Matlab 中进行，跑在 CPU 上，在玩具级别的数据集上不断迭代各种学习算法、网络架构和优化思路。” 他写道。但 AlexNet 的作者 Alex、Ilya 和 Geoff 却做了一件与当时的主流研究风格完全不同的事情 ——“不再纠结于算法细节，只需要拿一个相对标准的卷积神经网络 (ConvNet)，把它做得非常大，在一个大规模的数据集 (ImageNet) 上训练它，然后用 CUDA/C++ 把整个东西实现出来。”

Alex Krizhevsky 直接使用 CUDA 和 C++ 编写了所有的代码，包括卷积、池化等深度学习中的基本操作。这种做法非常创新也很有挑战性，需要程序员对算法、硬件架构、编程语言等有深入理解。

从底层开始的编程方式复杂而繁琐，但可以最大限度地优化性能，充分发挥硬件计算能力，也正是这种回归根本的做法为深度学习注入了一股强大动力，构成深度学习历史上的转折点。

有意思的是，这一段描述勾起不少人的回忆，大家纷纷考古2012年之前自己使用什么工具实现深度学习项目。纽约大学计算机科学教授 Alfredo Canziani 当时用的是 Torch，“从未听说有人使用 Matlab 进行深度学习研究......” 。

对此 Yann lecun 表示同意，2012年大多数重要的深度学习都是用 Torch 和 Theano 完成的。

Karpathy 有不同看法，他接话说，大多数项目都是在用 Matlab ，自己从未使用过 Theano，2013-2014年使用过 Torch。

一些网友也透露 Hinton 也是用 Matlab。

看来，当时使用 Matlab 的并不少:

知名的 GAN 之父 Ian Goodfellow 也现身说法，表示当时 Yoshua 的实验室全用 Theano，还说自己在 ImageNet 发布之前，曾为 Alex 的 cuda-convnet 编写了 Theano 捆绑包。

谷歌 DeepMind 主管 Douglas Eck 现身说自己没用过 Matlab，而是 C++，然后转向了 Python/Theano。

纽约大学教授 Kyunghyun Cho 表示，2010年，他还在大西洋彼岸，当时使用的是 Hannes SChulz 等人做的 CUV 库，帮他从 Matlab 转向了 python。

Lamini 的联合创始人 Gregory Diamos 表示，说服他的论文是吴恩达等人的论文《Deep learning with COTS HPC systems》。

论文表明 Frankenstein CUDA 集群可以击败10，000个 CPU 组成的 MapReduce 集群。

论文链接:https://proceedings.mlr.press/v28/coates13.pdf

不过，AlexNet 的巨大成功并非一个孤立的事件，而是当时整个领域发展趋势的一个缩影。一些研究人员已经意识到深度学习需要更大的规模和更强的计算能力，GPU 是一个很有前景的方向。Karpathy 写道，“当然，在 AlexNet 出现之前，深度学习领域已经有了一些向规模化方向发展的迹象。例如，Matlab 已经开始初步支持 GPU。斯坦福大学吴恩达实验室的很多工作都在朝着使用 GPU 进行大规模深度学习的方向发展。还有一些其他的并行努力。”

考古结束时，Karpathy 感慨道 “在编写 C/C++ 代码和 CUDA kernel 时，有一种有趣的感觉，觉得自己仿佛回到了 AlexNet 的时代，回到了 cuda-convnet 的时代。”

当下这种 "back to the basics" 的做法与当年 AlexNet 的做法有着异曲同工 ——AlexNet 的作者从 Matlab 转向 CUDA/C++，是为了追求更高的性能和更大的规模。虽然现在有了高级框架，但在它们无法轻松实现极致性能时，仍然需要回到最底层，亲自编写 CUDA/C++ 代码。

（举报）

相关推荐
大家在看

关键词：

Karpathy

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
诺基亚老年机怎么又翻红了：复古设计引发回忆杀

近日，诺基亚面向老年人、学生的3210机型已全部断货，因具备复古质感”拍照功能，这款老年机意外翻红”，吸引一大批年轻人。公开资料显示，诺基亚3210发布于1999年，是一款25年前的产品，在当时被称为诺基亚最小巧简洁的手机之一。新版诺基亚3210搭载的是一颗紫光展锐的芯片，支持中国移动、联通、电信、广电4G双卡双待，并且内置喜马拉雅、咪咕音乐App，并支持支付宝支付等功能，保留经典游戏贪吃蛇游戏。

诺基亚3210 老年机复古质感
OpenAI与Stack Overflow合作，提升ChatGPT编程能力

OpenAI近日宣布与在线编程问答论坛StackOverflow达成技术合作，旨在增强ChatGPT在编程领域的能力。这一合作意味着ChatGPT将能够通过StackOverflow的OverflowAPI访问并回答经过15年验证的真实、可靠的编程答案。随着AI技术的不断发展和成熟，相信未来ChatGPT在编程领域的表现将会更加出色，为开发者提供更加全面的技术支持和解决方案。

OpenAI ChatGPT AI头条
Stack Overflow 用户抗议不愿将其知识用于 AI 训练

StackOverflow用户正在抗议该问答网站与OpenAI的合作，宣布他们宁愿删除自己的帖子并牺牲声誉分数，也不愿让自己的回答被用于训练ChatGPT。本周早些时候宣，OpenAI将能够使用StackOverflow用户在过去15年中贡献的答案和知识来训练AI模型。似乎StackOverflow用户没有任何方式可以选择拒绝其数据用于训练AI模。

StackOverflow AI训练 AI头条
荐多模态GPT-4o来了，最先嗨起来的是一波女性用户

整场发布会最为重磅的发布之一，莫过于OpenAI团队成员对于新模型语音能力的演示，搭载了GPT-4o的ChatGPT，不仅真正实现了实时响应，可以任意打断，更重要的是，ChatGPT第一次拥有了“察言观色”的能力，它能看到用户表情，理解用户语气中的情感变化，同时能够给出不同风格、情绪的回应。更新后的ChatGPT不论是从响应速度上是其他方面，变得更像人了。长期观察用户行为，�

GPT-4o
2024中国香港站 | FOLLOWME交易大赛·年中盛会线下活动，开始正式报名

2024年5月18日，由FOLLOWME主办的交易大赛·年中盛会将在中国香港拉开序幕。2024年，聚势交易，共同成长，做有态度的交易。如今14赛季开赛在即，期待与大家一共见证新一轮的交易赛事盛典。
ThinkPad思考·AI空间揭幕，ThinkPad T14p AI 2024新品亮相

4月23日，联想举办ThinkPadAI春季新品探秘之旅暨ThinkPad思考·AI空间揭幕活动，ThinkPad首席产品官张豪宣布，备受期待的AI高性能专业工程师本——ThinkPadT14pAI2024当日正式开售。ThinkPad首席产品官张豪活动现场，张豪详细介绍了全新ThinkPadT14pAI2024在“高效办公”与“专业创作”方面为用户带来的全新AI体验。联想AIPC旗舰新品ThinkPadT14pAI2024，不仅是联想创新力的集中体现，更让AI技术�
The Color Run首站落下帷幕，快来帆书学习跑步的正确姿势

4月20日，时隔四年，风靡全球的“thecolorrun”世界超级快乐五公里在北京园博园正式开跑，点燃了人们的运动热情。不仅能舒展身体能释放心理压力，在帆书上，有不少与跑步相关的精彩书籍，帮助你学习正确的跑步姿势，提升跑步体验!《运动改造大脑》每个人都知道，运动有益健康，但是能够真正迈开腿的人却并不多，这或许是因为大家对运动的认知还不够全面。无论你是否参赛，只要想运动、想跑步、想享受世界上最快乐的5KM，那么都可以从现在开始跑起来!如果觉得很难开始，或者在跑步过程中遇到了问题，可以在帆书听听相关好书，找找答案。

跑步运动跑步姿势
荐小心，又一波封号潮正在进行

在见实会员群和交流群中，不断有运营团队表示自己名下企微账号被封，且频次越来越频繁。其实早在去年，见实就已发出两篇文章提出预警:只是，如今来看，封号的力度似乎变得越来越大。老铁们在这几天有没有因为使用了工具遇到封号情况?如果要让工具团队做升级，你会希望工具有哪些方面的能力?欢迎你在评论区留下你的想法。

封号
Nothing Phone 1在Nothing OS 2.5.5更新中集成ChatGPT

NothingPhone1终于在NothingOS2.5.5更新中获得了ChatGPT集成。该更新还带来了新功能、修复以及ChatGPT集成。NothingOS2.5.5正在逐步推出，因此，如果在您的设备上未出现，请等待5到6天后再次检查。

NothingPhone1 ChatGPT AI头条
Nothing 宣布其耳机将支持 ChatGPT

Nothing近日宣布，计划将ChatGPT与其智能手机和耳机更深度整合。此举将为公司的客户提供更快速的服务。该博客文章表示:“Nothing还将通过在NothingOS中嵌入系统级入口点到ChatGPT，包括截屏共享和Nothing风格的小部件，改善Nothing智能手机用户体验。

ChatGPT Nothing AI头条

Jovu:AI驱动的代码生成，快速实现从想法到生产。

Jovu是一个AI驱动的代码生成模型，旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码，确保一致性、可预测性，并遵循最高标准。Jovu能够加速开发过程，从概念到部署只需几分钟，提供完全可操作的、健壮的后端服务，准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

AI代码生成快速开发生产就绪

TapScanner:全能扫描仪，AI助力，智能识别与分析。

TapScanner是一款利用人工智能技术，将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档，提供即时洞察力，并通过扫描轻松提升日常交互。

AI 扫描营养

TopicRanker:AI驱动的SERP分析工具，帮助用户发现易于排名的关键词。

TopicRanker是一款AI驱动的搜索引擎排名分析工具，专注于帮助用户通过分析竞争对手的弱点，发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告，AI生成的标题建议，内容大纲，博客文章，以及增强型元描述，帮助用户优化内容创作，提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的，并且已经帮助多个企业在谷歌上排名第一。价格方面，TopicRanker提供三种不同的订阅计划，满足不同用户的需求。

SEO 关键词研究内容创作

Warmy:通过AI引擎提高电子邮件的投递率

Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为，为每个邮箱制定个性化的预热计划，确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器，从而最大化邮件的投递率。此外，Warmy的Adeline AI引擎能够实时分析发送性能，预测最佳发送时间和频率，帮助用户提高参与度，避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能，能够主动识别并标记具有高垃圾邮件风险的邮件，帮助用户避免邮件落入垃圾邮件文件夹，确保重要邮件能够送达接收者。

电子邮件投递 AI优化邮件营销

Glitter AI:将任何流程转化为逐步指南。

Glitter AI是一个创新的在线工具，它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程，使得向同事、客户甚至家人传授技能变得简单快捷。

教育培训流程指南

Tourly Guide:沉浸式音频导览，让每个地标自己说话

Tourly Guide是一款移动应用程序，通过使用人工智能技术，为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时，通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示，它由Roadly, Inc.开发，旨在通过技术提升用户的旅游和学习体验。

AI 教育旅游

SaveDay App:随时随地保存、管理和利用内容

SaveDay是一个智能工具，用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案，支持保存文章、网站、图片、视频等，并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护，不与第三方共享用户内容。

信息管理知识捕捉数据安全

Neurture:通过了解大脑运作制定改变计划的APP

Neurture是一个旨在帮助用户了解大脑如何运作，并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能，帮助用户打破习惯或解决成瘾行为，实现重要的其他目标。Neurture强调隐私和信任，不收集用户数据，不投放广告，不训练模型，旨在为用户提供一个安全、无负担的自我提升环境。

自我提升心理健康习惯改变

AiWatchfulCompanion:革命化的家庭护理方式，从婴儿到老年人。

AiWatchfulCompanion是一款旨在改变我们照顾亲人方式的应用程序，它通过使用人工智能技术，为远离家乡的护理者提供实时的关怀和支持。该应用利用计算机视觉和音频分析，实时响应亲人的需求，提供连续的安全和健康保障。它还具备紧急响应功能，在无法联系到护理者时，能够向紧急服务提供事故位置。

人工智能家庭护理远程监控

Viva:使用的 Sora 同架构视频生成模型

Viva 是一个免费的 AI 生成工具和社区，提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能，以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容，使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型，而且现阶段免费。文生视频单次可以生成一条 5 秒的视频，图生视频是 4 秒视频目前运动幅度最大的视频生成模型，同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好，同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频，目前很多视频模型的演示都是横屏视频，竖屏的表现并不好，但是短视频又是视频内容的大头，所以竖屏视频的生成质量是个很重要的指标。但是一致性有一部分测试中保持的不是很好，同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

今日大家都在搜的词：

热文

站长商机