首页 > 传媒 > 关键词  > 正文

亚运会惊现AI解说员,机器人帮残障者捡物品,北大学生为亚运会研发黑科技

2023-10-06 18:42 · 稿源: 站长之家用户

作为本届亚运会办赛理念之一,“智能”贯穿于杭州亚运会全的各个方面。

为服务正在举办的第19届亚运会,在北京大学黄铁军教授及仉尚航研究员的指导下,北京大学庄棨宁学生团队基于多模态大模型的研究,结合视觉、语言、语音等多种模态的输入,推出高速运动AI 多语种解说系统,为观众提供更丰富的观赛体验。这也是多模态大模型技术首 次在国际大型综合性体育赛事中的落地和尝试。

同时,团队着眼于具身智能研究,研发基于多模态大模型的人工智能助理来提供导览引领、场景解说、物品抓取等服务,为残障和需要帮助的人士创造更为人性化的互动方式和友好体验。

AI“复刻”赛事解说员

“除却君身三重雪,天下谁人配白衣。”

东京奥运会上中国运动员杨倩夺得首金身披白色领奖服时,赛事解说员用这句“神仙”解说词击中了无数观众的心。

事实上,一场精彩的体育比赛不仅取决于运动员双方的比拼,解说员在其中的价值也不可忽略。竞赛解说员不仅会在解说中提供关于球队、运动员和比赛背景的信息,帮助观众更好地理解比赛的重要性和背后的故事,经验丰富的解说员还能够深入分析比赛,揭示比赛中的策略和技巧,使观众能够更好地理解比赛的每一个环节,从而提高观赛的乐趣。

当比赛出现精彩一刻,优秀的解说员还能够通过解说传达激情和情感,更好地带动观众的情绪,为赛事瞬间增色添彩,甚至成为永恒经典。

然而受限于人手问题,并不是每场体育赛事都会安排解说员,特别是亚运会这类国际大型赛事,同一时间有多场比赛进行,并且不是所有的解说员都适合解说所有的体育项目,很多相对小众的赛事就会缺少解说员,更无法想象一位解说员可以使用多种语言、面向不同的语言的受众做解说。

基于此,北大庄棨宁学生团队面向乒乓球、跆拳道、跳水、体操等赛事,推出了高速运动 AI 解说系统,系统可以辅助录播频道调用多模态大模型能力,理解视频内容,并生成中文、英语、藏语、阿拉伯等多种语言的解说,让信息传递给更多有实际需求的人。

图:AI智能解说通过感知场景并生成解说

庄棨宁介绍说,这一技术通过高速摄像机的脉冲信号检测场景物体和运动员,将能够捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据,基于多模态大模型算法和深度学习模型对这些运动数据进行分析,基于分析结果,系统再生成提供实时的个性化解说服务,从而为各个语种的观众都能提供个性化的体验。

智能爱心辅助助手让AI有温度

大型赛事活动通常会为东道主城市带来显著的经济、环境等变化,但由于人流量激增,城市公共区域会面临巨大压力。据预测,亚运会期间的杭州也将迎来近年来最密集的游客潮,外地游客量将超过2000万人次,加上本届杭州亚运会来自亚洲45个国家和地区代表团的12527名运动员,亚运期间杭州的人流大增。

在杭州市公共区域,庄棨宁学生团队打造了具身智能机器人软件服务系统,用于亚运会期间的导航指引与帮助服务。这套系统可以为观众提供导览服务,协助视障人士进行引领和导航,解析视障人士需求并完成相应任务,帮助视障人士捡拾掉落的物品等。

目前,在杭州市的一些亚运会志愿者服务点,已经有市民看到一个机器人外观的智能体在为视力障碍人士服务。

图:杭州市民在体验庄棨宁学生团队的具身智能机器人软件服务系统

“很荣幸能够将我们的所学、所研转化为可以服务每个人的应用,让AI服务人们的普通生活。”庄棨宁介绍说,为本次亚运会打造的具身智能机器人软件服务系统,是基于团队自研的感知生成一体化多模态大模型,能够准确地感知与理解场馆内外的视觉场景,生成准确、丰富的语言描述,控制机器人执行智能志愿者服务任务。

同时,团队将多模态大模型与具身智能相结合,使得人工智能可以更好的感知和理解物理世界,再更好地做决策,最终实现人工智能和物理世界更好地交互。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 播音系女大学生为大叔录叫卖广播 一下子卖出去好几份糖炒栗子

    近日南京传媒学院一位播音系女大学生,为卖糖炒栗子的大叔重新录制了叫卖广播,引发网友围观。就在前两天,她看到暴雨天,地铁口的大叔还在卖糖炒栗子。有网友评论:一个年轻好听,有生命力的女生声音,在一个雨夜里,遇到一个散发香味的糖炒栗子小摊,像青草在草原上遇到一阵徐徐清风。

  • 店主送大学生榨菜遭邻桌顾客投诉 店主:大学生是自己店的租客

    7月8日,安徽黄山一家温馨小餐馆内发生了一幕令人意想不到的风波。店主蒋女士在社交媒体上分享了一段经历,迅速在网络上引发了广泛讨论。在商业行为中融入人文关怀,本是值得提倡的美德,却因一场误会蒙上了一层阴影。

  • 北京科技大学基于矢量场制导的微型仿生扑翼飞行机器人的路径跟踪

    科研团队:北京科技大学贺威团队关键词:微型仿生扑翼;路径跟踪;室内定位验证仿生扑翼飞行机器人因其出色的飞行机动性和较低的飞行成本等优点,在隐蔽侦察、环境监测等领域展现出广阔的应用前景。微型仿生扑翼飞行机器人在此基础上还具有尺寸小、重量轻、隐蔽性好等特点,在狭窄受限空间作业任务中优势更为突出。凌云光·元客视界致力于为高校提供完备的解决方案,助力科研发展。

  • 日本研发出开车机器人:时速5公里 只能开直线和右转

    据报道,日本东京大学河原塚健人团队研发一款可以驾驶普通汽车的机器人。该机器人名为武藏,有74块肌肉”和39个关节,它每只手有五根手指,手脚上都有压力传感器。这个机器人能够做出高度拟人化的复杂动作,将其用于车辆驾驶的话,着实有点大材小用了,毕竟真正的自动驾驶,只在车辆上部署自动驾驶软件即可,用机器人反像是点错了科技树。

  • 扫地机器人哪个牌子好?扫地机器人老玩家的新机评测

    最近我又给父母家里新买了一台扫地机器人,原因是之前的机型因为使用成本过高一直被父母闲置,无法发挥让父母解放双手的作用。新机收货后的老规矩是给大家来个测评记录,虽然我用过很多台扫地机器人人了,但在德国销量第 一的斐纳TOMEFON我确实还是第 一次接触:【开箱】斐纳TOMEFON的外包装有两层,打开黄色的瓦楞纸盒子里面才是斐纳TOMEFON的正式外包装盒,里面的纸�

  • 大学生求助喊“你好” 还怪礼貌嘞:危难中仍不失风度

    在一个阳光明媚的周末午后,一名热爱户外骑行的大学生踏上了探索郊野的旅程。命运的转折点悄然降临,在一次对陌生路况的挑战中,不慎失足,连车带人翻滚落入了幽深的山沟,四周顿时被寂静与未知所包围。他在社交媒体上公开表达了对消防员的深深感激,并分享了自己这段非凡的经历,特别是那声在危难中仍不失风度的“你好”,成为了网络上广为流传的一段佳话。

  • 大学生练车误踩油门 教练狂追秒变跨车飞人

    暑假又到了学生们学车的高峰期,但每年都有大神学员,不断激发教练的各路潜能。有网友上传的视频显示,广西一驾校内,一位大学生学员在场地内练习科目二时,误踩了油门,学员不知如何停车,车辆在训练场内高速行驶。因为科目二不需要踩油门,不少驾校会把车辆的油门踏板用垫块垫起来,防止学员误踏,这对于学员和其他人来说,都是一种安全保护。

  • 韩国机器人官员“自杀”:自己摔下楼梯后失灵

    机器人会自杀吗?本月26日,韩国一市政厅对位外宣称,他们的首个行政官机器人在自己摔下楼梯后失灵,当地媒体将其称为该国首个机器人自杀事件”并进行哀悼。实际上机器人自杀”早已发生过,2017年,美国保安机器人投池自杀”的话题和照片在互联网走红,有网友称其意识觉醒”后反抗压迫。

  • 扫地机器人哪个牌子好?2024新款热销扫地机器人评测

    无论哪个行业都是卷得不行,浸透了AI智慧的扫地机器人行业更是如此,什么自动积尘技术、气体导流零缠绕设计、超大自动集尘充电桩,看上去黑科技质感满满,但真正在顽固灰尘和边角灰尘处理、零误撞等消费者们最关心的环节上做得怎么样?必须全面测评一番今年的新款热销机型才行哦!斐纳TOMEFON斐纳TOMEFON扫地机器人是在德国销量名列前茅的扫地机器人品牌,售价三千出头,配置了当前稳定性最高LDS激光雷达导航系统,拥有强大的全局规划能力,续航时长最长可达150分钟,在智能方面做了9项全新升级,因此成为了很多精明消费者的优选品牌。斐纳TOMEFON激光雷达导航系统无惧光线明暗和地形复杂程度,在0.5平米的空间内也能游刃有余的展开清洁工作,在床底、沙发底、家具底层区域都能灵活进出极少出现被困情况,当发现地图之外的障碍物时,斐纳TOMEFON会灵敏的提前减速然后缓慢靠近绕圈打扫,不仅不会留下清洁盲区,其位于吸尘口内部的可浮动胶刷甚至还能深入地板缝隙4毫米深度捡拾陈年集尘,对于地面的清扫达到了超立体的效果;斐纳TOMEFON扫地机器人的使用成本还很低,单边尘刷聚拢灰尘无打飞颗粒灰尘的烦恼,平米恒压拖布借助机身重力和精确的出水量调节系统浸势带着顽固灰尘,对高端地板的保护效果更为出色;斐纳TOMEFON的湿拖工作噪音仅有40分贝,这样一来扫地机器人的使用就再无时间限制了,无论是休息时使用还是学习、工作时使用都不会影响到用户本人以及邻居,几乎在每个消费者们关心的环节都做到了尽善尽美。实测分析结果:在目前市面上的新款扫地机器人当中,新功能配置得多并不等同于扫地机器人会在顽固灰尘处理、边角灰尘处理、家具扫脚零误撞等用户们最关心的核心问题上做得更好,因此没必要花费大价钱盲目追高、追新,只要选购那些在消费者们最关心的环节上做到位了的品牌跟型号就足够了。

  • 科沃斯机器人大模型算法通过备案,AI大模型与智能清洁结合带来哪些超级体验?

    据吴中区政府公众号吴中发布报道,科沃斯家用机器人有限公司研发的科沃斯机器人大模型算法成功通过国家网信办深度合成服务算法备案,这也是国内家用机器人领域首 个通过国家备案的大模型算法。该模型作为国内首 个在家用机器人领域中通过国家备案的大模型算法,其应用场景包括智能家用机器人的自主决策、智能客服系统的高效问答等。具体而言,该大模型支持将用

  • 知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

    知了 zKnown 是一款 AI-Native 构建的个人知识助手,专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能,帮助用户高效地管理和整理信息。产品的主要优点包括:- 多端同步:用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结:支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持:最长支持总结3万字的文章内容。- 摘要导出:用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景:知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率,适合需要高效处理大量信息的用户。

  • MBox AI Meet:实时转录与会议总结的谷歌会议扩展

    MBox AI Meet是一款免费Chrome扩展,专为Google Meet设计,提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论,而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节,并在会议结束后自动生成总结,确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全,不存储任何音频或视频内容。此外,该扩展还计划在未来更新中增加更多AI功能,如发言人识别、实时AI助手等。

  • Klee:本地安全AI,保障数据隐私。

    Klee是一款macOS原生的AI助手应用程序,专注于本地处理数据,确保数据安全和隐私。它使用先进的AI技术,如RAG(检索增强生成)和开源大型语言模型,如Llama 3和Mistral,为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

  • Kipps.AI:快速构建AI助手,提升业务效率

    Kipps.AI 是一个在线平台,允许用户在短短两分钟内构建自己的AI助手,并将其集成到业务中。该平台支持多种数据源,如PDF、Notion、网站链接和文本,用户只需提供这些数据,Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成,使得用户可以轻松地将AI助手集成到现有的业务流程中。

  • CrossPrism for MacOS:图像识别、标注和关键词生成工具

    CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎,能够识别物种、生成标题和描述,并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片,确保所有照片安全地存储在 Mac 上,无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类,并提供新的视角来整理目录和重新发现旧照片。此外,它还支持视频处理、Lightroom 插件、图像质量评估等功能,使其成为一个强大的筛选工具。

  • ZETIC.ai:构建零成本的设备端AI。

    ZETIC.ai提供了一种革命性的设备端AI解决方案,使用NPU技术帮助企业减少对GPU服务器和AI云服务的依赖,从而显著降低成本。它支持任何操作系统、任何处理器和任何目标设备,确保AI模型在转换过程中不损失任何核心功能,同时实现最优性能和最大能效。此外,它还增强了数据安全性,因为数据在设备内部处理,避免了外部泄露的风险。

  • Kerqu.Ai:一站式AI内容生成器,助力跨境电商提升效率。

    Kerqu.Ai是一个为跨境电商卖家提供一站式AI解决方案的平台,整合了先进的AI技术,帮助用户节约成本、提升品牌影响力和销售转化率。产品通过AI技术实现模特换场景、AI图片创作、批量抠图、图片变高清等功能,同时提供一键撰写文案、优化文案和多语言翻译服务,满足多站点经营需求。

  • ReviewHawk:通过分析用户评论,降低用户流失率。

    ReviewHawk是一个专注于分析应用商店评论的工具,旨在帮助企业降低用户流失率,获取用户反馈,从而改善产品。它通过数据驱动的决策和用户满意度分析,帮助企业了解用户真正想要的功能,从而提升用户留存率和产品满意度。

  • Airtable Cobuilder:快速创建与管理数据的应用程序

    Airtable Cobuilder 是一款强大的应用程序构建工具,旨在通过简单的拖放界面和AI辅助功能,帮助用户快速创建和管理数据。它允许用户连接和简化他们最关键的数据,通过可视化数据、自定义视图和集成其他业务工具,提高团队协作和数据管理的效率。该工具特别适合需要高度定制化和灵活性的业务应用场景。

  • Alertfor:追踪网络信息,及时获取答案变化

    Alertfor 是一个在线平台,通过其专有的AQTA (Ask Question Track Answer) 流程,允许用户提交复杂问题,并在网页上寻找最相关的答案。它通过持续追踪提供连续的更新,确保用户能够获得准确且及时的信息。

  • Unskool:家长支持工具,助力家庭教育

    Unskool是一个由家长为家长制作的辅助工具,旨在简化家庭教育过程。它通过去除繁琐的行政工作,让家长能够专注于创造一个丰富的学习环境,让家长和孩子都能茁壮成长。Unskool提供了跟踪、记录和灵感激发的功能,并通过人工智能生成定制的、按需的课程计划,帮助家长更高效地进行家庭教育。

  • AI Generated Diagram:智能生成图表工具

    AI Generated Diagram 是一款利用人工智能技术生成图表的工具。它通过用户输入的提示(prompts)来创建图表,支持多种布局类型,如水平布局(Horizontal)。用户可以通过编辑、配置等操作来调整图表的细节,并支持导出为SVG格式或导出数据。该工具不仅提高了设计图表的效率,还通过AI技术提升了图表的美观度和准确性。

  • Free AI Image Extender:使用人工智能扩展图像边界

    AI Image Extender 是一款利用人工智能技术扩展图像边界的工具,通过生成新内容与现有图像无缝融合,增强图像的视觉延展性。该产品通过先进的AI算法,能够智能识别图像内容并生成自然过渡的扩展区域,适用于需要图像扩展或背景生成的各种场景。

  • Capacities:一个为你的思维打造工作室的APP

    Capacities是一个旨在改善人们思考方式和工作流程的应用程序。它通过使用对象而非传统文件和文件夹来组织信息,帮助用户更直观地理解和连接复杂的信息结构。该应用支持网络化笔记,使用户能够自然地构建信息网络,激发新的创意。Capacities还提供AI助手,帮助用户与笔记中的对象动态互动,并提高写作质量。此外,该应用注重数据安全和隐私保护,符合GDPR标准,数据存储在欧盟的加密服务器上。

  • CLASI:高质量、类人同声传译系统

    CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟,采用多模态检索模块来增强特定领域术语的翻译,利用大型语言模型(LLMs)生成容错翻译,考虑输入音频、历史上下文和检索信息。在真实世界场景中,CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例(VIP),远超其他系统。

  • image-matting:AI抠图项目,使用开源模型实现图像抠图。

    image-matting 是一个基于开源模型 briaai/RMBG-1.4 的AI抠图项目。该项目旨在通过学习AI技术、GUI开发、前端学习以及i18n国际化等技术,实现本地模型算法的图像抠图功能。它支持单张和批量抠图,用户可以通过拖拽和粘贴的方式快速进行图像处理。项目还提供了打包后的运行文件下载链接,方便用户使用。

  • OnlyPans:AI定制周晚餐计划

    OnlyPans是一个利用人工智能技术为用户提供定制化晚餐计划的应用程序。它通过与用户的简短聊天来了解用户的预算、口味偏好、语言习惯、饮食限制以及日常生活的忙碌程度,然后快速生成符合用户需求的晚餐计划。随着用户使用时间的增长,OnlyPans会不断学习和优化,提供更加个性化的服务。此外,OnlyPans还提供智能购物清单功能,帮助用户避免食品浪费和不必要的紧急购物。OnlyPans注重用户隐私保护,承诺不会出售用户的任何信息。

  • Excel Dashboard AI:将Excel转换为仪表板和报告的AI工具。

    Excel Dashboard AI是一款利用人工智能技术,将Excel数据快速转换为交互式仪表板和分析报告的工具。它通过自然语言处理能力,允许用户以对话形式与数据进行交流,从而迅速获得洞察。产品的主要优点包括快速生成多样化的数据分析维度、自然语言编辑和锁定分析视角、一键生成交互式仪表板、AI解读图表含义以及将仪表板转换为详尽的分析报告等。

  • 清影 AI 视频生成服务:基于 AI 技术生成视频内容的智能服务。

    清影 AI 视频生成服务是一个创新的人工智能平台,旨在通过智能算法生成高质量的视频内容。该服务适合各种行业用户,能够快速便捷地生成富有创意的视觉内容。无论是商业广告、教育课程还是娱乐视频,清影 AI 都能提供优质的解决方案。该产品依托于先进的 GLM 大模型,确保生成内容的准确性与丰富性,同时满足用户个性化需求。提供免费试用,鼓励用户探索 AI 视频创作的无限可能。

  • Tempest AI:无需编码,10分钟构建游戏

    Tempest AI是一个无需编码即可快速构建游戏的平台。它利用强大的AI助手帮助用户从零开始创建游戏,支持动态角色、适应性任务和互动世界。用户可以通过拖放编辑器构建世界,设计游戏机制,并通过故事构建器控制游戏叙事。Tempest AI不仅适合游戏开发者,也适合那些希望探索创意和互动叙事的爱好者。

今日大家都在搜的词: