首页 > 传媒 > 关键词  > 正文

具身智能、多模态大模型……盘点杭州亚运会上的五大“最黑”科技

2023-10-09 10:27 · 稿源: 站长之家用户

“与历届亚运会相比,杭州亚运会很可能是最智能的一届。”是亚奥理事会代理总干事维诺德在接受媒体访问时的评价。

杭州亚运会于 10 月 8 日晚正式闭幕。中国队以 201 枚奖牌创下新纪录,相较 201 枚奖牌,杭州亚运期间的各类智能应用和科技范儿也同样闪耀。

据亚运会官方数据,本届亚运会有近 20 项首推、首创、首用的应用和科技,接下来我们将介绍其中最为突出的五个科技应用及其背后的技术细节。

一、最“暖”黑科技--智能爱心辅助助手“未名”

杭州亚运会举办期间,在杭州市的一些亚运会志愿者服务点,有一款机器人外观的智能体在为视力障碍人士服务。

“未名”来自未名湖畔的北京大学。在北京大学黄铁军教授及仉尚航研究员的指导下,北京大学庄棨宁学生团队打造了具身智能机器人软件服务系统“未名”,用于亚运会期间的导航指引与帮助服务,还获得了人民日报的“点名”。

“未名”和以往所有的传统机器人不同,它基于庄棨宁学生团队自研的感知生成一体化多模态大模型,能够准确地感知与理解场馆内外的视觉场景,生成准确丰富的语言描述,实现从人类复杂指令到具体行动的转化,并基于端云协作大小模型的协同有效微调,提升模型的泛化性,使其可以快速适应新场景。

据悉,这套系统可以为观众提供导览服务,协助视障人士进行引领和导航,解析视障人士需求并完成相应任务,帮助视障人士捡拾掉落的物品等。

二、最“显眼包”黑科技——捡铁饼机器狗

在杭州亚运会田径赛场,几只来来回回运送铁饼的机器狗成为赛场“显眼包”。

这是在亚运会上运输铁饼的“机器狗”。每只狗的背上都装有卡槽,可以负重1- 2 公斤重的铁饼,在预先设定好的线路上迅速运送体育设备,完成任务之后,机器狗们会“趴”在场边等待指令。此外,个头较小的机器人还可以完成前扑、坐下、作揖等动作。

据了解,机器狗每次往返的平均距离约120m,按照一场比赛往返 60 次来计算,相当于以往铁饼比赛中工作人员超过7000m的工作量,有了机器狗往返运输,就可以大大解放工作人员了。

三、最“私人定制”黑科技--高速运动AI 解说系统

亚运赛场不仅有机器狗捡铁饼,还有AI做赛事解说。

这套由北京大学棨宁学生团队打造的高速运动AI 解说系统,通过高速摄像机的脉冲信号检测场景物体和运动员,将能够捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据,基于多模态大模型算法和深度学习模型对这些运动数据进行分析,基于分析结果,系统再生成提供实时的个性化解说服务,从而为各个语种的观众都能提供个性化的体验。

以乒乓球赛事解说生成为例,画面中两个人正在打乒乓球,系统可以捕捉和理解运动员的3D 姿态、也可以对球的轨迹做分析,并生成准确描述。

更值得一提的是,这是多模态大模型技术首 次在国际大型综合性体育赛事中的落地和尝试。

四、最“快”黑科技——AI智能剪辑

众所周知,本届杭州亚运会核心系统实现了100 %上云,这意味着同一场比赛,通过云平台可以生成不同版本,更重要的是,一种全新的视频剪辑方式也有了实现的可能。

据了解,亚运会媒体中心使用的阿里云AI智能剪辑,可以一键自动剪接多角度镜头,添加字幕转场等效果。

举例来说,原本剪辑100 米自由泳比赛集锦视频需要在全景、近景、特写镜头之间来回切,现在只要选中选手就能一键生成多轨合一的镜头,再根据背景音乐加入慢动作的特写镜头、校对 AI 生成的字幕,一条又快又好的视频就完成了。

五、最正直黑科技——AI裁判

传统的人类裁判可能会因为视角、视线遮挡或是瞬间的判断失误而错过某些行为,而AI裁判则可以通过多个角度和高帧率的摄像头实时捕获细节,确保决策更加准确。

据官方披露,本届亚运会引入了AI裁判评分技术,为比赛提供了更公正、准确的判罚。

AI裁判系统通过AI红外追踪技术,配合自动生成的打分系统,为每位选手进行打分。AI裁判还会会对选手的各项身体参数和动作角度进行分析,根据国际标准完成打分,

AI裁判不受情感、压力或任何外部因素的影响,完全基于事实和预定规则进行判决,堪称最“正直”的科技。

期待这些黑科技产品逐渐渗透到普通用户的生活中,为我们的生活带来更多便利、效率和可持续性。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 多模态和Agent成为大厂AI的新赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI的新赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • 字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

    5月13日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了5款模型和产品,包括豆包・视频生成模型 Seedance1.0lite、升级后的豆包1.5・视觉深度思考模型,以及新版豆包・音乐模型。同时,Data Agent 和 Trae 等产品也有了新进展。

  • UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成

    复旦大学与美团研究者提出UniToken框架,首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码,有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略(视觉语义对齐、多任务联合训练、指令强化微调),UniToken在多个基准测试中性能超越专用模型。其创新性体现在:1)统一的双边视觉编码

  • 业界唯一!百度网盘上线多模态AI笔记 效率提升10倍

    快科技5月2日消息,过往,用户在通过视频学习并记录笔记时,总免不了要不停切换平台软件,暂停、截屏、记录、插图、批注、切换返回视频过程繁琐而低效。为了应对这种情况,百度网盘和百度文库联合研发上线了AI笔记”,支持全自动学习、半自动学习、辅助学习三种模式。如今只要在网盘里面任意打开一个学习视频,在右侧就能看到AI笔记”功能,用户可以自主输入内容,也可以让其直接生成图文并茂、结构清晰的笔记。而且每个重要知识点旁会有时间戳,点击时间戳即可跳转到视频中对应位置,实现视频和笔记内容的顺滑关联。此外AI笔记”还可以帮

  • 免登录AI聚合站!当贝AI宣告新一轮技术迭代:五大模型9种形态

    当贝AI宣布完成新一轮技术迭代,整合DeepSeek-R1671B和DeepSeek v3大模型,推出覆盖办公、娱乐、生活等多场景的智能解决方案。此次升级从单一工具向"超级AI中枢"转型,以隐私安全、技术普惠与场景融合为核心,新增9种模型形态,支持语音播报、附件上传、知识库等功能。平台首创"无痕模式"实现端侧数据处理,保障隐私安全;个人知识库支持本地文档智能解析。�

  • AI日报:腾讯AI智能编程插件CodeBuddy;字节推Seed1.5-VL多模态模型;Manus母公司否认15亿美元融资传闻

    《AI日报》今日聚焦多项AI领域突破:腾讯推出CodeBuddy 3.0编程助手,深度整合微信小程序开发工具;字节跳动发布仅20B参数的Seed1.5-VL多模态模型,性能达行业领先;通义千问上线"Deep Research"智能研究系统,免费开放体验。此外,苹果推出革命性3D建模工具Matrix3D,Anthropic即将发布Claude Neptune新模型,清华与面壁智能联合推出端侧GUI智能体AgentCPM-GUI。谷歌搜索正测试"AI Mode"新功能,或将取代传统"手气不错"按钮。

  • DeepSeek+物流行业,AI大模型破解五大场景效能困局

    文章探讨了AI大模型在物流行业的应用现状与挑战。以DeepSeek为代表的AI技术正通过重构业务流程、优化资源配置、提升决策效率等方式,成为推动行业降本增效的核心引擎。但成功应用AI大模型需要企业具备数字化基础、业务流程标准化和数据治理能力,而非简单技术堆砌。G7+易流梳理出五大核心应用场景:工作效能辅助、经营数据分析、安全审查、智能客服和知识管理。这些

  • 大模型时代的智能营销,从“玩具”到“工具箱”

    百度在Create大会上强调AI应用创造真正价值,发布智能营销一体化应用"客悦·ONE"。李彦宏指出,没有应用场景的芯片和模型毫无价值。百度智能云升级后整合文心、DeepSeek等大模型能力,实现从数据洞察到智慧触达的闭环营销体系。该产品在金融等行业已落地见效,自助解决率达93%以上,支持多模态交互和全渠道管理。百度通过全栈自研AI架构降低开发成本,推动行业智能化转型。

  • 金蝶征信“金融风控大模型”斩获数字中国创新大赛智能科技一等奖

    2025数字中国创新大赛总决赛在福州落幕,金蝶征信凭借"基于知识图谱增强与动态推理的智能金融风控大模型"项目从全国千余支队伍中脱颖而出,斩获一等奖。该项目通过AI+信用数据赋能产业链风控与智能获客,已成功应用于网商银行、京东科技等头部金融机构。以京东科技"企业主贷"场景为例,模型上线后审批通过率从8%提升至30%,户均融资额增长216%。金蝶征信依托740万企业云服务场景与财税数据积淀,已助力200余家金融机构服务400万家小微企业,促成1800亿元数字信贷精准投放。未来将持续深化AI与信用科技融合应用,推动普惠金融高质量发展。