首页 > 业界 > 关键词  > AI最新资讯  > 正文

AI教母李飞飞创业!成立“空间智能”公司,已完成种子轮

2024-05-04 22:03 · 稿源: 量子位公众号

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:明敏 克雷西,授权站长之家转载发布。

AI教母李飞飞创业了!

最新消息,斯坦福大学教授李飞飞正在建立一家AI公司,已完成种子轮融资

公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示,这将是该技术的一次飞跃。

投资方包括硅谷风投a16z和Radical Ventures。

作为AI领域影响力最大的女性和华人,李飞飞长期对学术界和工业界贡献斐然。她在斯坦福拿下终身教职,曾担任谷歌云AI首席科学家、推动Google AI中国中心成立、并长期统筹谷歌云AI、谷歌大脑以及中国本土团队工作。

但躬身创业,这是头一回

目前,李飞飞及相关投资方对于这一新消息尚未做出回应。

但李飞飞的领英页面上已经多了一条新履历。

title是“新手”,介绍只写了“something new”,确定是全职,从2024年1月开始,现在已经进行5个月。

图片

计划“让AI实现高级推理”

汇总各方信息,目前比较有迹可循的线索是参投的加拿大风投Radical Ventures。

去年,李飞飞去年以科学合伙人的身份加入了这家基金。

更多蛛丝马迹,可以从李飞飞近期的公开活动看起。

上个月,李飞飞在温哥华举行的TED大会中发表了主题演讲,内容正是与空间智能相关。

演讲中,李飞飞对“空间智能”的描述是从物体之间的关系中获得预测和洞察力的能力。

她表示,AI对空间智能理解的进步,正在催化机器人学习,使我们更接近让AI能与世界互动的目标。

为了解释“空间智能”,她展示了一张猫咪伸出爪子要把玻璃杯推向桌子边缘的照片。

她表示,人类大脑在这一瞬间可以评估玻璃杯的几何形状、它在3D世界中的位置、它与桌子、猫和其他东西的关系,并且能预测接下来会发生什么,采取行动制止。

大自然创造了这种由空间智能驱动的视觉和行为的良性循环。

同时,她表示自己的团队在实验室中也正在尝试如何教会电脑在3D世界中行动。

比如通过大语言模型,让一个机器人手臂执行任务,打开一扇门、做一个三明治以及对人类的口头指令做出反应等。

这里提到的工作应该是和去年发布的具身智能成果VoxPoser有关。

这个项目可以让人类给机器人下达指令,如“打开上面的抽屉,小心花瓶!”

然后大语言模型+视觉语言模型就能从3D空间中分析出目标和需要绕过的障碍,帮助机器人做行动规划。

并且在真实世界中,机器人在未经“培训”的情况下,就能直接执行这个任务。

除此之外,近期李飞飞也参与了一系列学术成果的发表,涉足领域包括计算机视觉、机器人、智能体等。

比如一些的便携式的动作数据收集系统。

图片

还有一些与Agent相关。

比如上个月发布的一项涉及1000多种人类日常活动的具身智能Benchmark,李飞飞就有参与其中。

图片

在3D空间方面,李飞飞团队也在今年年初发布了一款隔空3D建模模型,可以透过遮挡物建模出人物的动作。

图片

此外,她还与来自微软、斯坦福、UCLA等机构的15名研究人员共同发布了一份关于Agent AI的立场文件。

文件中明确了Agent AI的基本概念,并提出了Agent AI基础模型,即利用多模态预训练模型构建的通用Agent系统。

文件中指出,这些模型可以处理来自机器人、游戏等领域的交互式多模态数据。

图片

另外,李飞飞的斯坦福主页显示从今年年初到2025年末,她将处于“部分休假”状态。

这一起始时间,刚好与李飞飞领英页面中“newbie”履历的开始时间重合。

AI教母李飞飞

如今,李飞飞已经成为AI领域内最具影响力的女性和华人之一。

对应AI教父的称号,大家称她为AI教母。

她的传奇经历一直为人津津乐道——

33岁成为斯坦福计算机系终身教授,44岁成为美国国家工程院院士,现任斯坦福以人为本人工智能研究院(HAI)院长。

她是计算机视觉领域举足轻重的领军人物,一手创立的ImageNet成为推动计算机视觉识别领域前进的标杆成果。

其门下高徒颇多,比如先后在OpenAI、特斯拉任职的Andrej Karpathy、目前在英伟达的Jim Fan等,也都是AI领域内颇具影响力的人物。

后来李飞飞曾短暂进入工业界,出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了谷歌AI中国中心正式成立,这是Google在亚洲设立的第一个AI研究中心。并带领谷歌云推出了一系列有影响力的产品,包括AutoML、Contact Center AI、Dialogflow Enterprise等。

最新大模型趋势里,李飞飞团队聚焦于具身智能,将大模型接入机器人,无需额外数据和训练即可把复杂指令转化成具体行动规划,开辟新一轮浪潮中的重要方向。

一直以来,李飞飞都是AI领域风向标一样的存在。

最近,李飞飞的个人回忆录《我看到的世界》正式发表。在这本书中,李飞飞自述了自己如何从北京到成都再到美国,如何在AI变革中逐渐找到自己的使命,并且分享了自己对AI发展的看法。

由此,一个更加立体的李飞飞被勾勒出来。

她说自己不是开源派也不是毁灭派,她希望人类能和AI和平相处。

她分享,谷歌云的经历让她意识到,引领AI技术发展需要肩负起相应的责任。

她也表示,如果你追求时髦算法,那么这肯定不是最好的科研。

毕竟她曾经也做过冷门项目——不听同行导师建议,用数年时间标注了用于训练ImageNet的1400万张图片。

……

李飞飞坦言,自己非常害羞,不敢讲自己的故事。

才四十多岁就写回忆录?我不是爱因斯坦。

而在写完自己前40年后,李飞飞给自己掀开了一个人生新章程。

正如她所说的,文明就像是一艘大船,我们在黑暗中航行。

科学家李飞飞,如今有了新故事。

举报

  • 相关推荐
  • 大家在看
  • Jovu:AI驱动的代码生成,快速实现从想法到生产。

    Jovu是一个AI驱动的代码生成模型,旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码,确保一致性、可预测性,并遵循最高标准。Jovu能够加速开发过程,从概念到部署只需几分钟,提供完全可操作的、健壮的后端服务,准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

  • TapScanner:全能扫描仪,AI助力,智能识别与分析。

    TapScanner是一款利用人工智能技术,将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档,提供即时洞察力,并通过扫描轻松提升日常交互。

  • TopicRanker:AI驱动的SERP分析工具,帮助用户发现易于排名的关键词。

    TopicRanker是一款AI驱动的搜索引擎排名分析工具,专注于帮助用户通过分析竞争对手的弱点,发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告,AI生成的标题建议,内容大纲,博客文章,以及增强型元描述,帮助用户优化内容创作,提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的,并且已经帮助多个企业在谷歌上排名第一。价格方面,TopicRanker提供三种不同的订阅计划,满足不同用户的需求。

  • Warmy:通过AI引擎提高电子邮件的投递率

    Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为,为每个邮箱制定个性化的预热计划,确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器,从而最大化邮件的投递率。此外,Warmy的Adeline AI引擎能够实时分析发送性能,预测最佳发送时间和频率,帮助用户提高参与度,避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能,能够主动识别并标记具有高垃圾邮件风险的邮件,帮助用户避免邮件落入垃圾邮件文件夹,确保重要邮件能够送达接收者。

  • Glitter AI:将任何流程转化为逐步指南。

    Glitter AI是一个创新的在线工具,它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程,使得向同事、客户甚至家人传授技能变得简单快捷。

  • Tourly Guide:沉浸式音频导览,让每个地标自己说话

    Tourly Guide是一款移动应用程序,通过使用人工智能技术,为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时,通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示,它由Roadly, Inc.开发,旨在通过技术提升用户的旅游和学习体验。

  • SaveDay App:随时随地保存、管理和利用内容

    SaveDay是一个智能工具,用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案,支持保存文章、网站、图片、视频等,并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护,不与第三方共享用户内容。

  • Neurture:通过了解大脑运作制定改变计划的APP

    Neurture是一个旨在帮助用户了解大脑如何运作,并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能,帮助用户打破习惯或解决成瘾行为,实现重要的其他目标。Neurture强调隐私和信任,不收集用户数据,不投放广告,不训练模型,旨在为用户提供一个安全、无负担的自我提升环境。

  • AiWatchfulCompanion:革命化的家庭护理方式,从婴儿到老年人。

    AiWatchfulCompanion是一款旨在改变我们照顾亲人方式的应用程序,它通过使用人工智能技术,为远离家乡的护理者提供实时的关怀和支持。该应用利用计算机视觉和音频分析,实时响应亲人的需求,提供连续的安全和健康保障。它还具备紧急响应功能,在无法联系到护理者时,能够向紧急服务提供事故位置。

  • Viva:使用的 Sora 同架构视频生成模型

    Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

  • 大模型之家:提供全面的人工智能大模型产业信息和创新价值研究。

    大模型之家是一个专注于人工智能大模型产业的平台,提供行业报告、技术创新动态、专家评测和奖项荣誉等信息。它通过整合行业资源,推动人工智能技术的创新和应用,帮助企业和个人更好地理解和利用大模型技术。

  • Productboard AI:利用人工智能增强产品团队的决策力和效率

    Productboard AI 是一款集成到产品管理平台中的人工智能工具,它通过分析和理解大量的用户反馈和数据点,帮助产品团队做出更明智的决策,提高工作效率,并加速产品从概念到市场的整个生命周期。它由 OpenAI 提供支持,确保数据安全和隐私保护,同时提供无与伦比的数据组合和针对产品管理工作的微调优化。

  • UserCall:人工智能语音用户访谈代理,深入洞察客户需求。

    UserCall是一款利用人工智能技术进行用户访谈的网站,它通过AI采访员与用户进行一对一的语音通话,从而收集高质量的用户反馈和洞察。这种技术可以大规模地进行用户访谈,提供比传统调查更深入的定性见解,同时节省时间和资源。UserCall的优势在于无需专业用户研究技能,能够自动进行智能跟进提问,帮助企业更好地理解客户需求,改进产品和业务。

  • VideoToPage:将视频或音频内容快速转换成结构化网页摘要的多功能工具。

    VideoToPage是一个高效的在线工具,它能够将视频或音频内容转换成结构化的网页摘要,支持多达96种语言,并具有98.5%的高准确率。用户无需订阅即可使用,特别适合需要将视频内容转换成文字资料、教程、博客文章、标准操作程序(SOP)等多种形式的个人和企业。产品提供快速的转录服务,支持长达5小时的视频,且5分钟以内的文件完全免费。此外,还提供内容的语义层次构建、内容类型定义、语义互连、富文本编辑、多语言理解等功能,使得内容的创建、编辑和发布变得简单快捷。

  • Fiskl:现代AI自动化全球会计解决方案,专为小型企业设计。

    Fiskl是一个多货币的全球会计平台,为小型企业、创业者、开发者和自由职业者提供全面的财务管理工具。它支持170多种货币和21,000多家银行,利用人工智能技术简化银行对账流程,实现零接触Stripe支付和银行对账。Fiskl的主要优点包括实时现金流和财务概览、自动化银行同步、全球支付能力、AI驱动的对账节省高达80%的对账工作量。Fiskl的定价策略包括特别优惠,例如年度订阅可享受50%的循环折扣,并提供30天免费试用期。

  • reap.video:一键将长视频转换为社交媒体短视频的工具。

    reap是一款基于人工智能的视频再利用工具,它能够将长视频内容一键转换成适合社交媒体的短视频。它通过先进的AI分析自动提取视频中最吸引人的片段,生成能够吸引观众的短片。reap支持多种语言,并提供了智能字幕生成、品牌模板定制等功能,帮助内容创作者提高内容的吸引力和可访问性,加速增长和变现。

  • 稀土掘金大模型子站:一站式AI资讯平台,连接开发者与AI技术的最新动态。

    掘金大模型子站是一个专注于AI领域的技术社区平台,提供从基础设施到最终应用的全景图,旨在帮助个人开发者和企业更好地理解和应用大语言模型技术。该平台通过提供资讯、工具和资源,促进AI技术的创新和应用,推动整个AI生态的发展。

  • Cubox:为学习而生的AI阅读器,高效筛选优质内容,提升阅读和学习效率。

    Cubox是一款专业的AI阅读器,旨在通过智能技术帮助用户筛选和整理阅读内容,提升阅读效率和学习效果。它具备自动高亮精彩内容、一键解读网页文章、专业级标注等功能,适用于需要大量阅读和学习的用户。产品背景信息显示,Cubox深受全球专业人士青睐,并且用户阅读的文章总数达到了23,325,802篇,显示了其广泛的用户基础和影响力。

  • InsideAI:实时分析工具,助你洞察竞品用户反馈。

    Inside AI 是一款基于人工智能技术的实时分析工具,它能够帮助用户追踪竞品的用户反馈和市场动态。该工具通过实时网络连接,分析用户评论,依托专有技术,为用户提供可操作的见解。它适用于独立开发者、初创公司、企业、分析师和风险投资公司等,帮助他们节省研究时间,找到正确的产品开发方向。

  • Glato AI:使用人工智能快速生成高质量产品视频

    Glato人工智能是一个通过人工智能技术快速生成高质量产品视频的平台。该产品能够自动生成引人入胜的短视频广告,帮助用户提高投资回报率,并节省创作者招聘等待时间。价格合理,定位于帮助企业提升市场营销效率。

今日大家都在搜的词: