首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

智平方打通具身智能核心痛点:将AGI拓展到物理世界

2024-07-25 16:25 · 稿源: 站长之家用户

近日,清华大学五道口金融学院“金融PLUS系列产业峰会2024·人工智能赋能千行百业”盛大举办。智平方(深圳)科技有限公司(以下简称智平方)创始人兼CEO郭彦东博士受邀出席,并与工信部原副部长杨学山,中国科学院院士、清华大学人工智能研究院名誉院长张钹,百川智能创始人兼CEO王小川,易显智能创始人兼董事长马宏等参会嘉宾一道,同探讨人工智能赋能实体经济、推动实体经济高质量发展之路。

第三代人工智能的发展趋势是从数字世界AGI到物理世界AGI

大语言模型问世标志着第三代人工智能时代大幕开启,人工智能从特定领域、特定算法、完成特定任务,迈向了在开放领域内完成多种任务、不受领域限制的新范式。具身智能是人工智能领域继大语言模型后的下一个需求爆发点,已经成为行业共识。

郭彦东博士领先行业敏锐预判出大模型的范式会从语言拓展到更多模态,并通过智能硬件在物理世界中完成感知与交互。基于这一判断,郭博士创立智平方之初就构建了四大技术底座:基于大模型的通用感知,基于生成式模型的端到端泛化操作,多源数据融合,以及软硬垂直整合。

郭彦东博士拥有硬核AI研发与智能硬件行业的复合背景,产业经验横跨中美。作为国家 级创新领军专家(未来智能终端方向),郭彦东博士毕业于美国普渡大学,曾担任美国微软总部研究员,早期的AI研发为微软AIaaS,必应搜索,互联互通车等产品提供了重要支持。此后,郭博士在国内顶 尖智能硬件企业担任AI首席科学家与高 级研发管理。他主导了大规模量产智能汽车、数亿台智能移动终端的AI研发。

在本次产业峰会上,张钹院士就第三代人工智能进行了精彩分享。在上一个人工智能时代,人工智能取得快速发展,但也遭遇了通用性不足、泛化性不够的巨大挑战。

张钹院士在产业峰会上演讲

大语言模型的出现为解决这一问题带来曙光,开启了第三代人工智能时代。大语言模型展现出强大的开放与多样性能力,并可通过快速微调来完成下游任务,在数字应用方面率先发力。张钹院士认为,多模态感知会成为继语言之后,第三代人工智能的下一个技术发力点。

作为全球通用具身智能领域领军企业,智平方深耕通用具身智能这一未来重点发展方向,针对行业痛点进行技术突破,并已经取得快速进展。智平方全栈自研的感知基础模型在保有通用性的前提下,更加符合机器人操作与导航的稠密需求;并且创新设计、打磨的端到端生成式架构达到操作端的真正泛化与数据驱动式迭代。通过多源数据融合引擎AI2R Data与系统性的软硬垂直整合技术,智平方打造了通用具身系统AI2R Brain,并与智能硬件深度融合,最终将AGI从数字世界拓展到物理世界。

目前,具身智能被认为是大语言模型后的下一个需求爆发点,正在开启产业化进程。从全球横向对比看来,具身智能是在中国市场较具优势,也是最有希望领跑全球的细分领域。

对此,郭彦东博士表示,这是由我国经济结构、发展优势以及新质生产力的进程等因素共同决定的。他认为,我国人工智能产业蓬勃发展,特别是在具身智能这一细分领域具有独特优势。从需求侧统计数据来看,我国工业机器人的采购量远高于欧美,无论是现实使用量还是使用意愿上,我国都是全球最 大的市场。从供给层而言,与具身机器人相关的主流供应链绝大部分都在我国,这为具身智能在我国的高速可持续提供了丰厚土壤。

全新品类通用智能机器人Alpha Bot助力新质生产力有效落地

在会上,张钹院士呼吁,具身智能不应将发展重点放在硬件形态上,比如现在市场讨论热度很高的双足还是某种硬件形态。具身智能的关键是“智能的通用性”,而不是“硬件的通用性”。这是由于,不同类型市场对于硬件的个性化需求非常明显,多样性的硬件种类才能满足市场。在硬件和使用场景各不相同的情况下,通用的智能才能实现跨行业、跨任务、跨硬件的准确执行。

这与智平方打造全新品类的通用智能机器人Alpha Bot的逻辑不谋而合。在AI2R Brain驱动下,智平方以场景定义硬件的思维,设计选用行业领先的硬件,根据场景搭载不同形态的移动底盘、夹具等模组,推出全新品类的通用智能机器人Alpha Bot。Alpha Bot能够在高度灵活、柔性、多样的场景中准确感知世界,仿人自然交互,完成多种任务执行,为千行百业、千家万户提供全场景、高可靠的服务。

全新品类通用智能机器人Alpha Bot

在“人工智能未来展望”的圆桌对话环节,郭彦东博士表示,目前具身智能的主要应用场景分为三类,以物流为中心的应用场景、以工厂为中心的应用场景、以家庭为中心的应用场景。特别地,以工厂为中心的应用场景是我国新质生产力实现的最主要的方向。

据媒体报道,工信部公布的数据显示,我国目前已经培育了421家国家 级智能制造示范工厂,万余家省级数字化车间和智能工厂,人工智能企业数量超过4500家。同时,经过人工智能改造的工厂研发周期缩短了约20.7%、生产效率提升了约34.8%。

郭彦东博士补充表示,通用智能机器人在工业场景能够完成以往工业机器人做不到的高柔性、更灵活多样的任务,比如总装场景的产线预加载、产线融合、总体装配,特种场景带操作的复杂检视等,这些任务繁琐、枯燥,更重要的是,部分严酷的物理环境(如高温、潮湿等)会对人的健康产生影响,全新品类通用智能机器人Alpha Bot正是能够把工人从这些任务场景中解放出来。

“人工智能未来展望”的圆桌对话

从+AI到AI+,我国人工智能领域已经得到快速发展。放眼未来,AI+作为一种泛在性技术,可以实现人工智能与各行各业的深度融合,创造新的发展生态。在“人工智能未来展望”的圆桌论坛上,百川智能创始人兼CEO王小川分享了AI+在医疗领域的创新与未来空间,易显智能创始人兼董事长马宏也详细介绍了AI+在智能驾培领域的应用和产业化实践。工信部原副部长杨学山展望提出,人工智能可以赋能千行百业,我们要通过不断的探索创新和快速的落地实践,为走向智能时代努力。在问答环节,清华大学五道口金融学院学生、现场观众与参会嘉宾互动热烈,就人工智能领域的产品、投资以及落地等内容进行了充分讨论。

作为一家成立仅一年的AGI创业公司,智平方的产品与技术已经获得行业的广泛认可,荣获BEYOND Awards2024“消费科技创新大奖”,极客公园2024年中国较具价值AGI创新机构TOP50等奖项。郭彦东博士表示:“非常感谢各界朋友对于智平方的认可。未来,智平方致力于打造全球领先的通用具身智能系统和多形态终端产品,将AGI从数字世界拓展到物理世界。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 开拍:AI视频剪辑工具,提升视频质量,增强创作体验。

    开拍是一款利用人工智能技术提供视频剪辑服务的在线平台,通过AI算法优化视频画质、消除水印、自动生成字幕等,旨在帮助用户提升视频制作效率和质量。产品背景信息显示,开拍致力于解决视频创作过程中的常见问题,如画质不清晰、水印去除困难、字幕添加繁琐等,通过技术手段简化视频编辑流程,让视频创作更便捷、高效。

  • 即刻动态开盒Bot:分析即刻动态,了解朋友的趣味成分。

    即刻动态开盒Bot是一个在线工具,通过分析用户上传的即刻动态截图,揭示用户的兴趣爱好和社交行为。它利用人工智能技术,对图片中的文字和图像进行分析,从而得出用户的个性标签。这个工具不仅增加了社交媒体互动的趣味性,也帮助用户更深入地了解自己和他人。

  • 你和狗的区别:探索你和狗的相似与不同,发现更多趣味互动。

    这是一个提供趣味互动和娱乐内容的网站,通过轻松幽默的方式让用户探索与狗的相似之处,同时提供其他多种娱乐功能,如星座运势、歌词接龙等,旨在为用户带来轻松愉快的体验。

  • FineChatBI:AI驱动的对话式业务分析工具

    FineChatBI是帆软推出的一款AI驱动的对话式业务分析工具,它利用Text2DSL技术将用户的自然语言问题转化为可理解、可干预的指令,从而提供可控、结果可信、分析闭环、交互友好的业务分析体验。该产品基于企业级BI能力底座,结合AI技术,大幅降低业务分析门槛,提升企业决策效率。

  • Pony Diffusion:多功能文本到图像扩散模型,生成高质量非真实感图像。

    Pony Diffusion V6 XL是一个文本到图像的扩散模型,专门设计用于生成以小马为主题的高质量艺术作品。它在大约80,000张小马图像的数据集上进行了微调,确保生成的图像既相关又美观。该模型采用用户友好的界面,易于使用,并通过CLIP进行美学排名,以提升图像质量。Pony Diffusion在CreativeML OpenRAIL许可证下提供,允许用户自由使用、再分发和修改模型。

  • TarotCard.Art:AI算法融合古老智慧,生成个性化塔罗牌。

    TarotCard.Art——AI个性化塔罗牌生成器是一款结合了古老塔罗智慧与现代AI技术的在线工具,旨在为用户提供个性化的塔罗牌解读体验。用户可以通过输入问题或描述,利用AI算法生成独特的塔罗牌,并获得相应的解读。该产品不仅为塔罗爱好者提供了一种新颖的体验方式,也为寻求指导和灵感的用户提供了一个有趣的平台。

  • AI Describe Pictures:AI技术快速生成图片描述

    AI Describe Pictures是一个利用人工智能大模型构建的平台,能够快速为图片生成详细或简要的描述。它通过AI技术,不仅能够描述图片中的场景和人物,还可以根据用户的需求提供定制化的描述方式。该产品通过AI技术的应用,极大地提高了图片描述的效率和准确性,对于视觉障碍人士、内容创作者和需要图片描述的各类场景都具有重要的意义。

  • AI回复生成器:AI辅助,快速生成个性化回复。

    AI回复生成器是一款革命性的沟通工具,旨在帮助用户创建个性化、符合上下文的回复。无论是撰写电子邮件、回应客户咨询还是生成内容,我们的AI系统确保您的信息清晰、简洁且针对您的受众量身定制。

  • Tools-AI.xyz:探索2024最佳AI应用

    Tools-ai.xyz 是一个致力于探索和分享2024年最佳AI应用的平台,它提供了一个全面的AI应用列表,这些应用覆盖了写作、图像、视频、编程、设计等多个领域。该平台由GPT-4o每天不间断更新,确保用户能够获取到最新的AI工具信息。

  • 小红书MBTI人格测试:通过大数据分析,揭示你的MBTI人格特质。

    小红书MBTI人格测试是一个基于大数据分析的在线测试工具,它通过分析用户在小红书上的行为和内容,为用户提供个性化的MBTI人格分析。这种分析可以帮助用户更好地了解自己的性格特点、优势和潜在的发展方向。产品通过幽默风趣的语言和个性化的分析结果,增强了用户体验,同时也为用户提供了自我探索和自我提升的机会。

  • AI Headshot Generator Free:使用AI技术,免费生成专业头像。

    AI Headshot Generator Free是一款利用人工智能技术为用户提供专业级头像生成服务的网站。用户只需上传自己的自拍照片,AI技术便能在约20分钟内自动调整光线、去除背景并增强面部特征,生成高质量的头像。这项技术特别适合需要在LinkedIn、简历或任何专业档案中展示形象的用户。产品背景信息显示,它由一家位于英格兰的公司创立,注重用户隐私。

  • Patched:自动化代码审查、文档和补丁的开源工作流自动化框架。

    Patched是一个开源的工作流自动化框架,专为开发团队设计,通过集成大型语言模型(LLMs)来自动化代码审查、文档生成、补丁生成等开发任务。它通过提供预设的patchflows或允许用户自定义patchflows来加速日常开发工作。Patched支持与现有的开发和安全解决方案集成,如Gitlab、GitHub、Jira等,使得开发人员能够构建复杂的多步骤工作流。Patched强调隐私优先,支持在用户自己的基础设施内部署,并使用自己的LLM API密钥。

  • AI Signature Generator.com:免费创建个性化签名

    AI Signature Generator是一个在线工具,使用人工智能技术帮助用户创建个性化的签名。用户只需输入全名或首字母,AI即可生成多种风格的签名供用户选择。这项技术简化了签名设计过程,使得用户无需具备专业设计技能即可获得美观且专业的签名。该工具完全免费,适合需要快速生成电子签名的用户,无论是个人使用还是商业场合,都能提供便利。

  • AI Fill Image:利用AI技术无缝扩展图像

    AI Fill Image是一个免费的在线图像填充工具,它使用先进的AI技术来自动填充图像周围的空白区域,同时保持原始风格和内容。这项技术的重要性在于它能够无缝地扩展图像,为设计师和摄影师提供了一种创新的方式来增强他们的创意项目。产品背景信息显示,AI Fill Image适合所有类型的图像,尤其是那些具有清晰图案和结构的图像。

  • Brat Generator:创造Charli XCX专辑风格的图片

    Brat Generator是一个在线工具,允许用户创建具有Charli XCX专辑风格的图片。它提供了一个简单易用的界面,用户可以通过选择不同的背景颜色来个性化他们的图片。这个工具特别适合那些想要快速生成具有特定艺术风格图像的用户。

  • RAGLAB:模块化研究导向的检索增强生成统一框架

    RAGLAB是一个模块化、研究导向的开源框架,专注于检索增强生成(RAG)算法。它提供了6种现有RAG算法的复现,以及一个包含10个基准数据集的全面评估系统,支持公平比较不同RAG算法,并便于高效开发新算法、数据集和评估指标。

  • 01 App:将智能设备控制权交到您手中。

    01 App是一个基于iOS和Android的应用程序,它通过简单的按键对讲界面,允许用户从世界任何地方控制Mac、Windows和Linux机器。该应用代表了一种新型的计算平台,专注于软件而非硬件,通过提供更好的SDK、集成语音模型、提高教学模式的可靠性和增加多模态功能来增强用户体验。01 App的推出,是为了让用户能够更便捷地体验到01平台的智能设备控制能力,同时避免了制造硬件所带来的复杂性和成本。

  • 分歧终端机pingli.app:让AI帮你解决分歧

    分歧终端机是一个在线平台,通过AI技术帮助用户解决日常生活中的分歧和争议。它通过模拟裁判的方式,让用户提交问题并由AI进行投票,从而得出一个相对客观的结果。这种技术的应用不仅增加了决策的趣味性,也提高了决策的效率,尤其适合在朋友之间或小团体内部解决小争议。

  • Alorica:实时语音语言翻译解决方案

    Alorica ReVoLT是Alorica Clear解决方案的一部分,属于其革命性的多语言客户体验产品套件。这项技术通过实时语音语言翻译,帮助客户提升品牌影响力,优化客户服务体验。Alorica ReVoLT在2024年AI突破奖中被评为最佳基于AI的客户服务解决方案,凸显了其在客户体验管理(CXM)领域的领先地位。

  • Chai-1:先进的多模态基础模型,用于分子结构预测。

    Chai-1是一个用于药物发现的多模态基础模型,能够预测蛋白质、小分子、DNA、RNA、共价修饰等的分子结构。它在PoseBusters基准测试中达到了77%的成功率,与AlphaFold3相当。Chai-1无需多序列比对即可运行,保持了大部分性能,并且能够更准确地折叠多聚体结构。此外,Chai-1可以与实验室数据结合,提高预测性能。该模型旨在将生物学从科学转变为工程,推动AI在生物学研究中的应用。

今日大家都在搜的词:

热文

  • 3 天
  • 7天