首页 > 传媒 > 关键词  > 正文

具身智能、多模态大模型……盘点杭州亚运会上的五大“最黑”科技

2023-10-09 10:27 · 稿源: 站长之家用户

“与历届亚运会相比,杭州亚运会很可能是最智能的一届。”是亚奥理事会代理总干事维诺德在接受媒体访问时的评价。

杭州亚运会于 10 月 8 日晚正式闭幕。中国队以 201 枚奖牌创下新纪录,相较 201 枚奖牌,杭州亚运期间的各类智能应用和科技范儿也同样闪耀。

据亚运会官方数据,本届亚运会有近 20 项首推、首创、首用的应用和科技,接下来我们将介绍其中最为突出的五个科技应用及其背后的技术细节。

一、最“暖”黑科技--智能爱心辅助助手“未名”

杭州亚运会举办期间,在杭州市的一些亚运会志愿者服务点,有一款机器人外观的智能体在为视力障碍人士服务。

“未名”来自未名湖畔的北京大学。在北京大学黄铁军教授及仉尚航研究员的指导下,北京大学庄棨宁学生团队打造了具身智能机器人软件服务系统“未名”,用于亚运会期间的导航指引与帮助服务,还获得了人民日报的“点名”。

“未名”和以往所有的传统机器人不同,它基于庄棨宁学生团队自研的感知生成一体化多模态大模型,能够准确地感知与理解场馆内外的视觉场景,生成准确丰富的语言描述,实现从人类复杂指令到具体行动的转化,并基于端云协作大小模型的协同有效微调,提升模型的泛化性,使其可以快速适应新场景。

据悉,这套系统可以为观众提供导览服务,协助视障人士进行引领和导航,解析视障人士需求并完成相应任务,帮助视障人士捡拾掉落的物品等。

二、最“显眼包”黑科技——捡铁饼机器狗

在杭州亚运会田径赛场,几只来来回回运送铁饼的机器狗成为赛场“显眼包”。

这是在亚运会上运输铁饼的“机器狗”。每只狗的背上都装有卡槽,可以负重1- 2 公斤重的铁饼,在预先设定好的线路上迅速运送体育设备,完成任务之后,机器狗们会“趴”在场边等待指令。此外,个头较小的机器人还可以完成前扑、坐下、作揖等动作。

据了解,机器狗每次往返的平均距离约120m,按照一场比赛往返 60 次来计算,相当于以往铁饼比赛中工作人员超过7000m的工作量,有了机器狗往返运输,就可以大大解放工作人员了。

三、最“私人定制”黑科技--高速运动AI 解说系统

亚运赛场不仅有机器狗捡铁饼,还有AI做赛事解说。

这套由北京大学棨宁学生团队打造的高速运动AI 解说系统,通过高速摄像机的脉冲信号检测场景物体和运动员,将能够捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据,基于多模态大模型算法和深度学习模型对这些运动数据进行分析,基于分析结果,系统再生成提供实时的个性化解说服务,从而为各个语种的观众都能提供个性化的体验。

以乒乓球赛事解说生成为例,画面中两个人正在打乒乓球,系统可以捕捉和理解运动员的3D 姿态、也可以对球的轨迹做分析,并生成准确描述。

更值得一提的是,这是多模态大模型技术首 次在国际大型综合性体育赛事中的落地和尝试。

四、最“快”黑科技——AI智能剪辑

众所周知,本届杭州亚运会核心系统实现了100 %上云,这意味着同一场比赛,通过云平台可以生成不同版本,更重要的是,一种全新的视频剪辑方式也有了实现的可能。

据了解,亚运会媒体中心使用的阿里云AI智能剪辑,可以一键自动剪接多角度镜头,添加字幕转场等效果。

举例来说,原本剪辑100 米自由泳比赛集锦视频需要在全景、近景、特写镜头之间来回切,现在只要选中选手就能一键生成多轨合一的镜头,再根据背景音乐加入慢动作的特写镜头、校对 AI 生成的字幕,一条又快又好的视频就完成了。

五、最正直黑科技——AI裁判

传统的人类裁判可能会因为视角、视线遮挡或是瞬间的判断失误而错过某些行为,而AI裁判则可以通过多个角度和高帧率的摄像头实时捕获细节,确保决策更加准确。

据官方披露,本届亚运会引入了AI裁判评分技术,为比赛提供了更公正、准确的判罚。

AI裁判系统通过AI红外追踪技术,配合自动生成的打分系统,为每位选手进行打分。AI裁判还会会对选手的各项身体参数和动作角度进行分析,根据国际标准完成打分,

AI裁判不受情感、压力或任何外部因素的影响,完全基于事实和预定规则进行判决,堪称最“正直”的科技。

期待这些黑科技产品逐渐渗透到普通用户的生活中,为我们的生活带来更多便利、效率和可持续性。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

    本期AI日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架UltraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能阉割”传闻,提醒用户勿通过第三方强行激活。

  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • 它石智航 WIYH 数据集正式开源:全球首个具身 VLTA 多模态数据,加速具身智能真实世界落地

    它石智航开源了全球首个大规模真实世界具身多模态数据集WIYH,填补了高质量、可泛化、大规模真实世界数据的空白。该数据集采用以人为中心的新范式,破解了数据采集成本高、仿真数据迁移难等痛点,为具身基座模型实现Scaling Law提供了关键语料。WIYH数据集具备真实可靠、丰富多元、全面多模态、规模化等特征,并拥有海量数据,覆盖10余种核心场景全链路任务。它石还�

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 具身智能,吉利不想赶晚集

    “吉利有望从车企转变为中国乃至全球最大的机器人公司”。 吉利汽车集团副总裁、吉利汽车研究院院长李传海在WAIC2025上公开抛出这一观点后,外界的惊讶可能远多于质疑。 得益于银河品牌的助力,吉利今年在汽车领域的销量实现全面爆发,前11个月总销量同比增长42%,新能源同比增长97%,远超行业平均水准。 在汽车主业务进入加速期时提出转型机器人,既反映出吉利未�

  • 四相科技亮相CES2026 多模融合高精度定位方案赋能全球工业智能化升级

    在CES2026上,国内物联网UWB定位厂商四相科技展示了其第二代UWB定位技术为核心的解决方案。该方案融合GNSS与蓝牙定位,构建“硬件+软件+算法”一体化服务体系,精准适配工业制造复杂场景需求,为智慧工厂数字化注入核心动能。其产品采用CH9高频信道,有效避免信号干扰,在复杂工况下测距成功率稳定在98%以上。方案还搭载恒迹寻分析引擎与恒迹云平台,可与企业生产管理系统高效对接,实现显著降本增效。四相科技CEO表示,公司深耕UWB技术十余年,希望将自主创新的UWB技术推向世界,以“From China for Global”姿态参与全球工业定位标准共建。

  • 贾跃亭:FF首批具身智能机器人2月4日发布

    法拉第未来(Faraday Future,简称FF)日前宣布全面启动全球EAI产业桥梁战略,正式推出具身智能机器人业务板块,形成EAI汽车与EAI机器人双轨并行的全新发展格局。 公司创始人贾跃亭今日通过社交媒体预告,FF将于2月4日在美国拉斯维加斯举行的NADA北美汽车经销商大会上,完成首批具身智能机器人产品的终极发布并同步开启销售,此举标志着FF正式切入机器人赛道。

  • 国产全球最强医疗大模型Baichuan-M3发布:已超越GPT-5.2与人类医生

    AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�

  • 苹果谷歌官宣合作:新一代Siri选定使用Gemini大模型

    苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。

  • 昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA

    北京大学张牧涵团队提出TransMLA转化框架,实现无需重训即可将主流大模型(如LLaMA、Qwen)从GQA架构迁移至MLA架构。该框架通过四大核心技术模块解决迁移痛点:结构映射、RoRoPE位置编码适配、频率折叠融合及KV矩阵均衡化,在昇腾算力支持下,成功在LLaMA-2-7B上裁剪68.75%的KV缓存,仅轻微性能损失。昇腾硬件的高效并行架构与存储优化体系为技术落地提供关键支撑,推动TransMLA集成至高性能推理框架生态,大幅降低企业升级成本,为长上下文推理提供自主算力解决方案。

今日大家都在搜的词: