11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
现有大语言模型的训练和推理速度能再快一点——快多少?2-4倍。各种大模型都在用的FlashAttention今天正式发布第2代并开源,所有Transformer架构的模型都可使用它来加速。OneMoreThing最后,有网友发现,除了FlashAttention-2,最近还有一系列类似成果,包括DeepSpeed的ZeRO、马萨诸塞大学deReLoRA。
在成立“小步亲子”之前,彭琳琳在波士顿咨询公司(BCG China)做了8年的顾问工作,之后在蜜芽宝贝担任战略副总裁及CEO商业助理。她曾在清华大学取得了数学学士和硕士学位,并于2011年在斯坦福GSB获得了MBA学位。
斯坦福的大学生活令人神往,而斯坦福毕业生的高薪工作更是引人嫉妒,有着临近硅谷互联网公司的争抢。面对如此诱人的待遇,学生们该如何抉择?是坚持自己的追求完成一项事业?还是为金钱折腰?让我一起走进斯坦福大学生们的世界。
在斯坦福的华人创业者中,已经涌现出一批佼佼者。他们大多在上世纪90年代末期赴斯坦福求学,很早受到互联网文化的熏陶。
5月10日,主题为“新平台、大未来”的腾讯创业基地公开课在第九届中国互联网创业者大会同期举办,上千名来自全国各地的站长和互联网创业者前往聆听,讲师阵容空前强大:ATA公司CEO孙振耀、易宝支付CEO唐彬以及斯坦福大学商学院大中国区主任Frank Hawke (韩诚)三位嘉宾亲赴现场,为创业者分享创业心得体会。
很多的新创公司都因为缺少优秀的设计人员而被迫关闭。而VC们正不断尝试将天才设计师输送给新创公司,有些甚至为了得到优秀的设计师,直接将整个公司都收购掉。
IT产业到今天为止已经经历了四个十年。第一个十年(1980年~1990年)关键词是硬件,这个阶段的王者是IBM。
在美国,很明显的状况就是,大学校园正在变成创业公司的孵化器,虽然只是课堂的形式, 却激励着无数的梦想家,这也解释了为什么美国很多21岁不到的年轻人就获得了数百万的美元投资。
前几天还跟一个从斯坦福回来的朋友聊创业,其中也有谈到一些辍学创业的。不过看到这条,我觉得更加震撼了,“在斯坦福,如果毕业了,你还没创办一家公司,你就是个失败者。”
国外云存储服务 Box.net 的 CEO —— Aaron Levie ,日前在斯坦福本季度的企业思想领袖讲坛(Entrepreneurial Thought Leaders Lecture)上,分享了他创办 Box.net 的经历。在 2005 年,Levie 发现了互联网云存储的需求和机遇,并且在大学宿舍创建了这一服务。
北京时间5月7日,据国外媒体报道,微软首席执行官史蒂夫·鲍尔默(Steve Ballmer)于周三在美国斯坦福大学施展自己的雄辩口才发表激情演讲,鼓励学生在毕业后创业,缓解他们对未来的忧虑。当然,在当前经济危机全球蔓延的形势下,大学生毕业后创业绝非易事,尤其考虑到
斯坦福大学人工智能研究院发布的《2024年人工智能指数报告》提供了对2023年人工智能领域进展的全面分析,覆盖了技术进步、经济影响、政策制定和公众舆论等多个方面。以下是报告的一些关键要点:技术进步:行业研究贡献:行业在AI研究方面发挥了重要作用,2023年贡献了51个重要的机器学习模型学术界仅贡献了15个。报告也强调了需要关注AI的伦理、责任和社会影响,以确保其发展能够造福全人类。
斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型,这款模型以其在端侧设备上的强大运行能力受到广泛关注。论文:Octopusv2:On-devicelanguagemodelforsuperagent论文地址:https://arxiv.org/abs/2404.01744模型主页:https://huggingface.co/NexaAIDev/Octopus-v2Octopusv2的推出,标志着设备端AI智能体时代的来临。对于那些对AI技术充满热情的开发者和企业来说,Octopusv2无疑提供了一个全新的�
斯坦福大学研究人员发布的Octopusv2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了GPT-4,同时将上下文长度减少了95%。设备端AI智能体时代即将到来,Octopusv2的发布为这一趋势注入了新的活力。
「这是自Karpathy和我2015年启动这门课程以来的第9个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名AI科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。总共600多位学生报名,第一堂课的现场座无虚席:从2015年到如今,CS231n已经走到九个年头,也成为了一代计算机视觉专业学生心中的「必修课」:虽然课程代码不变,但可以猜到,2024年的课程相比2021年版本的课程有不少新增内容,这还要归因于视觉生成技术三年来的巨大飞跃。值得注意的是,在CS25课程中,除了基于自然语言处理的演讲内容之外,也覆盖了视觉Transformer的相关内容。
斯坦福的一篇案例研究表示,提交给AI会议的同行评审文本中,有6.5%到16.9%可能是由LLM大幅修改的这些趋势可能在个体级别上难以察觉。LLM在飞速进步的同时,人类也越来越难以区分LLM生成的文本与人工编写的内容,甚至分辨能力与随机器不相上下。希望这些研究结果能够促进对于LLM在未来信息生态系统中应该如何使用以及可能带来的影响的深入探讨,从推动出台更加明智的政
UMI是斯坦福开发的一个机器人数据收集和策略学习框架,通过手持式夹持器和精心设计的接口进行数据收集。该框架能够将人类在复杂环境下的操作技能直接转移给机器人,无需人类编写详细的编程指令。通过UMI,机器人能够快速学习新任务,提高操作能力,降低学习成本,推动机器人技术在各领域的广泛应用。
【新智元导读】近日,北大、斯坦福、以及PikaLabs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E3近日,北大、斯坦福、以及爆火的PikaLabs联合发表了一项研究,将大模型文生图的能力提升到了新的高度。论文地址:https://arxiv.org/pdf/2401.11708.pdf代码地址:https://github.com/YangLing0818/RPG-DiffusionMaster论文作者提出了一个全新的免训练文本�
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
【新智元导读】在社交媒体上发照片要谨慎了,AI工具一眼就能识破你的位置!随手在网络上发布的一张照片,能暴露多少信息?外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战,网友提供照片,他来猜测照片的具体拍摄地,有些照片甚至还能猜到具体的航班细节。是不是细思极恐?但「照片挑战」也同样抚慰了很多人心中的遗憾,比如拿着一张父亲年轻时候拍的照片,
一群斯坦福大学研究生发布了一个新项目,他们的AI模型经过了10万个随机位置、50万个街景图片以及其他图片的训练。这个模型能够快速准确地找出图片中的位置,目前的准确率达到了92%。所以对于普通用户来说,保护好隐私是至关重要的。
爆火的斯坦福全能家务机器人MobileALOHA,大!翻!!车!!!你以为它擦个红酒轻易举,但实际上却是这样的:全给你弄撒喽,顺带碎个杯子……你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底:MobileALOHA的翻车大合集还不止这些。例如刚才炒完虾的锅,哎呦喂,一不小心没拿住:即使小哥一个箭步冲上去也没阻止“悲剧”的发生。除了这两家,李飞飞团队也一直在跟进,其名为VoxP
阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。Meta发布生成式AI调试工具HawkEyeMeta发布了一款名为HawkEye的生成式AI调试工具,旨在解决机器学习模型在生产中面临的挑战。它能够帮助模型更好地理解和分析图像内容。
斯坦福华人团队开发的炒虾机器人MobileALOHA成为了全网的热议话题。这个机器人能够炒菜、洗碗等各种复杂任务,仅用50个演示就能够让机器人始终如一地完成一项任务。整个机器人的设计成本仅为22万元,相比其他类似机器人的价格要低廉许多。
斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。WikiChat的成功表明,维基百科数据在大模型训练中发挥了重要作用,通过检索增强生成的方法,可以有效解决大模型的幻觉问题�
【新智元导读】谷歌放出的Gemini,在对标GPT的道路上似乎一直处于劣势,Gemini真的比GPT-4弱吗?最近,斯坦福和Meta的学者发文为Gemini正名。Gemini的推理能力,真的比GPT-4弱吗?此前,谷歌憋出的重磅复仇神器GeminiPro,被发现在常识推理任务中落后于OpenAI的GPT模型。这表明模型已经掌握了空间关系和物理后果,具备了类似人类认知的复杂视觉信息能力。
随着ChatGPT的出现以及广泛应用,通过文本生成文本、视频、音频等内容,成为实现技术民主化的关键手段。在3D模型领域通过文本生成并不成熟,多数方法是通过图片。这样通过不断地优化,网格表面的颜色信息会逐渐跟多视角图片越来越接近,从实现纹理的提升。
【新智元导读】最近,一位斯坦福小哥用ChatGPT、DALL·E3和Midjourney联合生成了一款游戏,要求人类扮演AI,从AI那里骗取代码来拯救人类。由AI开发的AI游戏来了!最近,这款由ChatGPT、DALL·E3和Midjourney等AI联合生成的游戏,震惊了网友。相信不久后,Ramón会用「ThusSpokeZaranova」给我们带来新的惊喜。
随着ChatGPT等大模型被广泛应用在实际业务中,其输出内容的真实、可靠、安全性成为了重点。学术界则使用“归因”来表示追查、证实内容。斯坦福便是将协同归因和贡献归因的主要功能,整合在一个框架中方便开发者对大模型进行各种安全、内容验证。
随着大型语言模型在实际业务中的广泛应用,确保其输出的真实性和可靠性成为亟待解决的问题。学术界采用“归因”方法来追踪和证实模型输出的内容。斯坦福提出的“统一归因”框架为解决这一问题提供了新的思路和方法,有望推动大模型在各行业中的更广泛应用。