首页 > 业界 > 关键词  > 正文

小米AI识物眼镜获黑客马拉松大赛一等奖 为视障人群提供认路等功能

2023-08-06 18:09 · 稿源: 凤凰网科技

凤凰网科技讯 8月6日消息,近日,小米举办2023第四届黑客马拉松“创想无界,生生不息”大赛,本次大赛产出了大量创新思维与先进技术相结合的项目成果,经评审,最终“小米AI识物眼镜-基于语义理解的视觉系统”获得一等奖。

“小米AI识物眼镜-基于语义理解的视觉系统”,以眼镜为载体搭载视觉识别系统,通过双目摄像头,对物品的名称、距离、位置、颜色,以及文本、人脸等进行多模态识别,为视障人群提供认人、认物、认路、认字等多种功能。项目创新性地将视觉识别模型和大语言模型进行有机结合,让用户不仅可以通过自然对话的方式了解眼前的世界,更能理解其逻辑关系,向真正“理解世界”又踏出了一步。同时,项目也为全尺寸人形仿生机器人CyberOne、以及CyberDog仿生四足机器人理解眼前世界进行了前沿探索。

二等奖项目“小米随心控-基于视觉识别系统的智能控制中心”,关注到了言语障碍人群的智能家居使用体验。现有智能设备多以手机控制和语音控制这两种方式来操控,然而语音控制并不利于言语障碍者使用。因此,团队成员设计了这款基于视觉识别系统的全新手势交互智能中枢,通过深度相机结合手势控制,计算手掌与设备的空间关系,让智能设备可以实现“指哪控哪”,以更自然的交互方式让更多人能够享受新科技的乐趣。

举报

  • 相关推荐
  • 大家在看
  • 技术代码让生活更美好,齐聚码力黑客马拉松圆满落幕

    2023Google开发者大会在上海顺利举办。由SegmentFault思否主办的2023“齐聚码力”黑客马拉松决赛路演也于同期举行。我们期待与更多志同道合者同行,共同探索美好生活的无限可能!

  • 免费在线AI图片编辑工具Fotor 提供AI扩图、AI换脸等功能

    Fotor是一款免费的在线AI图片编辑工具包,提供丰富的智能编辑功能。与昂贵的Canva订阅相比,如果你不想花费太多钱,可以试试Fotor。Fotor是一个功能强大且易于使用的在线AI图片编辑工具包,无论你是专业设计师还是普通用户,都可以通过它轻松编辑和优化你的照片。

  • 滴滴上线亲友守护工具 提供车费代付等功能

    滴滴于今年8月份推出了一款名为“亲友守护”的工具。滴滴亲友守护工具具备多种实用功能,包括上下车提醒、行程自动分享、行程异常同步、行中实时查看轨迹、直接联系司机或平台、车费代付、帮助完成车内录像开启和实名认证等。通过该工具,用户可以方便地与亲友绑定关系,并开启远程实时陪伴。

  • 赛场显眼包 男子马拉松终点前倒立:结果被反超

    在山东巨野一场马拉松临近终点处,一选手选择倒立冲线,被原本在他后面的选手反超。热心啦啦队都在提醒他:超过你啦”。体内脂肪含量可以减少12-20%。

  • 布雷博发起第二届骇客马拉松

    ·布雷博组织的第二届骇客马拉松活动开始报名·活动在传统创新流程之外寻找全新解决方案,契合布雷博的愿景:“将能量转化为灵感”布雷博作为全球汽车制动技术的领导者和创新者,将于10月13日至15日在美国加州森尼韦尔市的布雷博灵感实验室举办第二届布雷博骇客马拉松活动。本次布雷博骇客马拉松活动期间,参与者将深入研究机器学习和人工智能,革新目前的制动技术。评选出的最优项目会获得奖励,并有可能与布雷博签订孵化合同。

  • 一帧秒创:支持图文转视频,AI数字人等功能

    一帧秒创是一款基于秒创AIGC引擎的智能AI内容生成平台,旨在为创作者和机构提供多种AI生成服务,包括文字续写、文字转语音、文生成图、图文转视频等多项创作服务。这个平台的核心特点是其智能分析技术,能够快速将文案、素材、AI语音和字幕等元素整合,创作出高质量的视频内容,无需复杂的编辑和制作过程。这些功能使一帧秒创成为一个全面的视频内容创作工具,为用户提供了从文字到视频的一站式解决方案,简化了视频制作过程,提高了创作效率。

  • 链接全球!成都再次组局国际科技马拉松

    作为欧洲规模最大、最具影响力的编程类国际科技竞赛之一,JuncitonChina2023国际极客马拉松再次牵手成都,于今日在新津区“开跑”。后大运时代,成都赛事营城步履不停这也是2023成都世界科幻大会新津分会场的重要配套活动之一。这次有意义的探索,也将助力成都科技创新产业发展。

  • 极越 01预售价 25.99 万元起 配备AI语音等功能

    极越汽车宣布,极越01中大型纯电SUV已经正式下线并开启预售,起售价为25.99万元。这款新车基于SEA浩瀚架构打造,定位为纯电动中大型SUV,并计划于10月份正式上市。智能化方面,极越01还配备了AI语音,具备AI养成,可实现智舱自我成长。

  • 中国移动云盘内测AI智能工具 上线AI云笔记、图配文等功能

    中国移动云盘最新发布了AI智能工具,这是一款基于人工智能技术的云端应用,可以轻松生成文章、邮件和图片等各类内容能自动整理会议纪要、润色文案并回答问题。图片生成方面,通过这款AI智能工具,用户可以轻松实现图片风格转换,只需一键操作,就可以将黑白照片转换成彩色,实拍照片转换成动漫风格,静态照片转换成动态照片这些图片还可以长久保存在云端。通过智能化整理会议纪要、总结概括长篇大论以及自动配文等功能,用户可以更加高效地办公,同时也更加方便地使用云笔记等工具。

  • 京东物流将在双11推出电商仓服务 提供24小时发货揽收等功能

    京东物流将在京东11.11购物节期间推出电商仓服务,帮助商家提升多平台履约效率。京东物流电商仓的物流服务包括24小时发货揽收、36小时内配送时长控制、及时推单建议等。京东物流将继续利用强大的仓网体系和数智化能力,为更多中小企业提供高质量发展的一体化供应链物流服务,为供应链的稳定与韧性贡献更多的力量。

  • Animate Old Photos:用AI技术让老照片动起来

    Animate Old Photos是一个利用Kling AI技术将老照片转化为生动视频的网站。它通过AI技术使旧时记忆重新焕发活力,为用户带来更加生动和动态的体验。该产品目前处于beta测试阶段,免费提供服务,但随着高级功能的增加,未来可能会推出付费计划。

  • Discovery Outcomes:AI驱动的产品管理操作系统

    Discovery Outcomes是一个AI驱动的产品管理操作系统,旨在简化和增强产品管理流程。它通过集成工具、促进协作,并利用AI提高工作效率。该平台通过统一平台覆盖从设定目标到功能交付的所有内容,解决工具跳跃、数据冗余和信息孤岛等常见挑战。Discovery Outcomes通过AI驱动的效率提升,旨在提高上市时间、生产力、创新率、交付物质量、适应性、灵活性、跨功能协作和投资回报率。

  • Revent.ai:使用AI快速创建专业演示文稿

    Revent.ai 是一个专注于利用人工智能技术帮助用户快速创建专业演示文稿的平台。其核心功能包括演示文稿自动化和设计服务,旨在通过简化设计流程,让用户能够专注于内容的传达,从而提升演示文稿的质量和效率。Revent.ai 的使命是让技术更好地服务于人,强调以人为本,确保质量和价值始终贯穿于产品之中。

  • AI Memory:智能记忆助手,随时随地回忆重要信息

    Flot.ai的AI Memory是一个基于人工智能的个人知识库管理工具,通过AI Memory功能,帮助用户轻松构建和回忆个人知识库。它允许用户通过简单的点击操作,从任何应用程序或网站保存文本到AI记忆中,并随时通过与AI对话来回忆这些信息。产品强调了其无需组织、易于访问和使用的特点,以及对隐私的高度重视,符合GDPR标准。

  • AI数学解题器:智能解决数学问题,提升学习效率

    AI数学解题器是由数学AI和数学GPT模型(如GPT-4o)驱动的在线工具,旨在提供广泛的数学问题解决方案。它利用先进的人工智能技术,为学生和教师提供详尽的分步解答,增强了对数学概念的理解和解题能力。该产品背景是数学学习中对高效解题工具的需求,定位于免费提供高质量的教育支持。

  • CohesiveAI:AI驱动的数据采集与分析工具

    Cohesive是一款集成在Google Sheets中的AI工具,它允许用户通过AI技术进行数据的批量分析、个性化生成以及网页抓取,特别适用于需要大规模数据采集和分析的商业场景。它支持在Google Sheets内直接进行操作,无需学习新平台,简化了数据导入和导出的流程。Cohesive还提供了与ZeroBounce的集成,帮助用户找到或验证电子邮件地址。

  • AI Renamer:智能文件重命名工具

    ai-renamer 是一个基于 Node.js 的命令行工具,利用 Ollama 和 LM Studio 模型(如 Llava, Gemma, Llama 等)智能地根据文件内容重命名文件。它支持视频、图片等多种文件类型,并且可以通过自定义参数来优化重命名过程。该工具使用户能够自动化文件管理,提高效率,尤其适合需要批量处理文件名的开发者和内容创作者。

  • EasyMedia:AI驱动,快速将YouTube视频转化为社交媒体内容。

    EasyMedia是一个利用人工智能技术,帮助用户将YouTube视频内容快速转化为适合不同社交媒体平台的帖子、推文等。它支持Facebook、Instagram、Twitter、LinkedIn等多个平台,能够根据平台特点自动调整内容格式,提高内容的吸引力和传播力。产品背景在于帮助用户节省内容创作时间,同时增加其在数字世界中的影响力。

  • Kuluko:将想法变成有声书

    Kuluko是一款AI驱动的有声书生成器,它允许用户通过简单的提示或个性化的设置来创作属于自己的有声书。它提供了两种模式:简易模式和高级模式,以满足不同用户的需求。简易模式下,用户只需输入一个提示,AI即可生成完整的小说。高级模式则允许用户自定义故事的各个方面,包括角色、类型、背景、故事时间、叙述者声音等。Kuluko将故事转化为长达4小时的有声书,用户可以立即开始收听。此外,Kuluko还具有个人和公共图书馆功能,用户可以选择私密享受或与他人分享。

  • fastn:无代码AI驱动的集成平台

    fastn是一个无代码、AI驱动的集成平台,旨在帮助开发者通过单一、统一的API连接和编排多个数据源。它通过AI代理创建API,支持即时API组合,无需编码即可实现数据流的连接。fastn的主要优点包括降低成本、加速开发和上市时间、提高可靠性和安全性。它通过实时数据编排、统一数据访问和监控与故障排除等功能,帮助企业构建互联生态系统。

  • Wasps:AI代码审查工具,快速理解代码库并修复问题。

    Wasps是一个集成在VSCode中的AI代码审查插件,通过深度分析和理解代码库,能够快速识别并修复代码中的错误和漏洞。它为开发者提供即时反馈,推荐潜在问题和改进建议,帮助提高代码质量和开发效率。

  • LLM Optimize:专业网站审计,提升AI推荐排名

    LLM Optimize 是一套工具,旨在帮助用户优化网站,使其在AI聊天机器人和生成引擎(如ChatGPT和Google的AI Overview)中排名更高。该工具通过专业的网站审计,提供可操作的建议,帮助用户在这些生成引擎中获得更好的展示效果。其重要性在于,随着AI技术的不断发展,传统的SEO策略正在逐渐被LLM(Large Language Models,大型语言模型)优化所取代。LLM Optimize通过分析网站内容和竞争对手的策略,提供定制化的优化方案,帮助用户在AI驱动的搜索结果中获得更高的曝光率。

  • Meme Search:通过文本搜索快速找到完美表情包

    Meme Search是一款通过视觉内容和文本索引表情包的应用程序,它能够让用户通过文本搜索快速找到所需的表情包。该应用使用自然语言处理技术,将图片中的文本描述自动生成并作为向量索引存储,从而实现快速检索。Meme Search的开源特性和创新的搜索方式,使其成为提升表情包搜索效率的有力工具。

  • PDFJourney:快速且经济的PDF创建方式

    PDFJourney 是一个旨在为用户提供快速且经济的PDF创建服务的网站。它通过简化用户界面和操作流程,使得用户能够轻松地创建PDF文件。该产品的主要优点在于其高效的渲染速度和低廉的成本,这对于需要频繁处理文档的用户来说是一个巨大的优势。PDFJourney 是 GPT4 的微调版本,它致力于通过技术手段降低文档处理的复杂性和成本,从而提升用户的工作效率。

  • AnyParser:准确、私密且可配置的文档检索LLM

    AnyParser Playground 是一个基于网页的解决方案,旨在帮助用户从PDF和图像文件中提取信息。它通过使用机器学习技术,能够处理文件的前10页,为用户提供数据的全面洞察。该平台不存储用户数据,保证了数据的隐私和安全性。

  • Reimagic.ai:将照片转化为非凡肖像的革命性应用

    Reimagic.ai是一款革命性的移动应用程序,可以将您的照片转化为非凡的肖像。它具备即时背景转换、无缝融合、多样化使用场景、用户友好界面等功能,适用于人像、宠物和产品摄影,使每张快照都成为杰作。

  • Xspiral:新一代3D可视化设计平台,让创意触手可及。

    Xspiral是一个结合了2D和3D设计的混合平台,通过AI技术增强,提供实时渲染、无需下载、协作功能。它允许用户快速创建、设计、管理、预览、分享和发布3D作品。Xspiral支持使用智能写作功能,如一键重写、总结、扩展和快速思维导图,以及创建和管理交互式3D工作流应用,包括文档、思维导图、流程图等。它还支持在3D空间中进行UI/UX设计,为初学者和专业人士提供了轻松创建3D设计的可能。

  • 如果相机:用AI帮你看见各种「如果」背后自己可能的样子

    如果相机是一款利用人工智能技术,帮助用户探索不同生活选择下自己可能的样子的网站。通过AI技术,用户可以体验到不同的生活方式、外貌变化等,从而发现更多的可能性。该产品的主要优点在于其创新性和趣味性,能够激发用户的想象力和探索欲。

  • Relingo:智能双语翻译,助力词汇记忆

    Relingo是一款专注于提升用户英语词汇记忆能力的教育类APP。它通过在用户阅读和观看视频时自动高亮生词并提供翻译,帮助用户在感兴趣的内容中轻松积累单词。产品支持多种语言,包括中文、英文、日文等,覆盖了全文翻译、视频双语字幕、PDF阅读等多种场景,使用户在沉浸式翻译中提升语言能力。

  • AI Photo Filter:AI滤镜,一键转换照片风格

    AI Photo Filter是一个在线服务,使用人工智能技术将用户上传的照片转换成多种艺术风格,如动漫、粘土、3D、像素艺术等。它适用于初学者和专业人士,只需简单点击即可使用。该技术的主要优点包括操作简便、风格多样、效果生动,能够满足不同用户对照片美化和创意表达的需求。

今日大家都在搜的词:

热文

  • 3 天
  • 7天