首页 > 传媒 > 关键词  > 正文

具身智能、多模态大模型……盘点杭州亚运会上的五大“最黑”科技

2023-10-09 10:27 · 稿源: 站长之家用户

“与历届亚运会相比,杭州亚运会很可能是最智能的一届。”是亚奥理事会代理总干事维诺德在接受媒体访问时的评价。

杭州亚运会于 10 月 8 日晚正式闭幕。中国队以 201 枚奖牌创下新纪录,相较 201 枚奖牌,杭州亚运期间的各类智能应用和科技范儿也同样闪耀。

据亚运会官方数据,本届亚运会有近 20 项首推、首创、首用的应用和科技,接下来我们将介绍其中最为突出的五个科技应用及其背后的技术细节。

一、最“暖”黑科技--智能爱心辅助助手“未名”

杭州亚运会举办期间,在杭州市的一些亚运会志愿者服务点,有一款机器人外观的智能体在为视力障碍人士服务。

“未名”来自未名湖畔的北京大学。在北京大学黄铁军教授及仉尚航研究员的指导下,北京大学庄棨宁学生团队打造了具身智能机器人软件服务系统“未名”,用于亚运会期间的导航指引与帮助服务,还获得了人民日报的“点名”。

“未名”和以往所有的传统机器人不同,它基于庄棨宁学生团队自研的感知生成一体化多模态大模型,能够准确地感知与理解场馆内外的视觉场景,生成准确丰富的语言描述,实现从人类复杂指令到具体行动的转化,并基于端云协作大小模型的协同有效微调,提升模型的泛化性,使其可以快速适应新场景。

据悉,这套系统可以为观众提供导览服务,协助视障人士进行引领和导航,解析视障人士需求并完成相应任务,帮助视障人士捡拾掉落的物品等。

二、最“显眼包”黑科技——捡铁饼机器狗

在杭州亚运会田径赛场,几只来来回回运送铁饼的机器狗成为赛场“显眼包”。

这是在亚运会上运输铁饼的“机器狗”。每只狗的背上都装有卡槽,可以负重1- 2 公斤重的铁饼,在预先设定好的线路上迅速运送体育设备,完成任务之后,机器狗们会“趴”在场边等待指令。此外,个头较小的机器人还可以完成前扑、坐下、作揖等动作。

据了解,机器狗每次往返的平均距离约120m,按照一场比赛往返 60 次来计算,相当于以往铁饼比赛中工作人员超过7000m的工作量,有了机器狗往返运输,就可以大大解放工作人员了。

三、最“私人定制”黑科技--高速运动AI 解说系统

亚运赛场不仅有机器狗捡铁饼,还有AI做赛事解说。

这套由北京大学棨宁学生团队打造的高速运动AI 解说系统,通过高速摄像机的脉冲信号检测场景物体和运动员,将能够捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据,基于多模态大模型算法和深度学习模型对这些运动数据进行分析,基于分析结果,系统再生成提供实时的个性化解说服务,从而为各个语种的观众都能提供个性化的体验。

以乒乓球赛事解说生成为例,画面中两个人正在打乒乓球,系统可以捕捉和理解运动员的3D 姿态、也可以对球的轨迹做分析,并生成准确描述。

更值得一提的是,这是多模态大模型技术首 次在国际大型综合性体育赛事中的落地和尝试。

四、最“快”黑科技——AI智能剪辑

众所周知,本届杭州亚运会核心系统实现了100 %上云,这意味着同一场比赛,通过云平台可以生成不同版本,更重要的是,一种全新的视频剪辑方式也有了实现的可能。

据了解,亚运会媒体中心使用的阿里云AI智能剪辑,可以一键自动剪接多角度镜头,添加字幕转场等效果。

举例来说,原本剪辑100 米自由泳比赛集锦视频需要在全景、近景、特写镜头之间来回切,现在只要选中选手就能一键生成多轨合一的镜头,再根据背景音乐加入慢动作的特写镜头、校对 AI 生成的字幕,一条又快又好的视频就完成了。

五、最正直黑科技——AI裁判

传统的人类裁判可能会因为视角、视线遮挡或是瞬间的判断失误而错过某些行为,而AI裁判则可以通过多个角度和高帧率的摄像头实时捕获细节,确保决策更加准确。

据官方披露,本届亚运会引入了AI裁判评分技术,为比赛提供了更公正、准确的判罚。

AI裁判系统通过AI红外追踪技术,配合自动生成的打分系统,为每位选手进行打分。AI裁判还会会对选手的各项身体参数和动作角度进行分析,根据国际标准完成打分,

AI裁判不受情感、压力或任何外部因素的影响,完全基于事实和预定规则进行判决,堪称最“正直”的科技。

期待这些黑科技产品逐渐渗透到普通用户的生活中,为我们的生活带来更多便利、效率和可持续性。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 餐馆走红成“全球第五大摄影巨头” 紧邻四大摄影器材门店

    在江苏徐州,一家名为“徐州老味菜”的餐馆近期在网络上意外走红,其独特的地理位置成为了网友热议的焦点。这家餐馆紧邻索尼、尼康、佳能、富士四大国际知名摄影器材品牌门店,且恰好处于中心位置,被网友戏称为占据“C位”。这一强烈的视觉反差场景被拍摄并上传至网络后,迅速引发了广泛关注,网友纷纷将其调侃为“全球第五大摄影巨头”或“摄影圈新贵”。 �

  • Vlog相机排行榜TOP5:2025年五大精选机型,从入门到进阶全解析

    本文推荐五款Vlog相机:佳能R50V轻巧全能,支持6K超采和智能对焦;松下G100以出色音频系统见长;奥林巴斯E-PL10兼具复古外观与防抖功能;富士X-T200色彩直出优秀;理光GR IIIx便携且画质细腻。佳能R50V综合表现突出,适合各类Vlog场景,是提升视频质量的高效选择。

  • 2025 年会议系统厂商推荐 五大品牌核心能力对比

    随着混合办公普及,会议系统已从辅助工具升级为核心协作载体。2024年全球会议市场规模达386亿美元,预计2025年将以12.3%年复合增长率持续扩张。本文聚焦华为、腾讯、淳中、易联、公信五大主流厂商,从功能覆盖、性能表现、安全性等维度展开分析:华为云WeLink以4K超清视频、千人并发能力见长,适合大型组织;腾讯会议侧重易用性与低成本,契合中小企业需求;淳中主打硬件集成与可视化管控;易联深耕医疗、教育行业定制化方案;公信专注无纸化会议及政务合规场景。未来行业将向AI深度集成、硬件智能化及跨行业适配方向发展,企业需结合自身规模与核心需求精准选型。

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 2025半画幅相机选购指南:佳能R50V领衔,五大机型满足多元创作

    本文推荐五款半画幅相机:佳能R50V以视频优化功能获评9.9分,支持4K直播与专业格式,适合Vlog创作者;富士X-S20(9.4分)平衡性能与续航,具备胶片模拟模式;索尼A6700(9.3分)搭载AI芯片,支持4K 120P录制;富士X-T5(8.9分)融合复古设计与高像素;尼康Z50(8.5分)操作简易,适合新手。佳能R50V凭借便携性与专业视频功能成为内容创作者首选。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

今日大家都在搜的词: