首页 > 业界 > 关键词  > 正文

索尼发布六枚“纽扣”:真人动作捕捉驱动3D虚拟形象

2023-09-23 15:25 · 稿源: 快科技

快科技9月23日消息,索尼发布便携动作捕捉产品mocopi,将于10月上旬上市销售,建议零售价2499元。

mocopi由六个小巧轻便的传感器搭配专用mocopi ”应用程序,使用智能手机实现实时动作捕捉与数据处理,让用户自由驱动3D虚拟形象。

相较于只能在专业动捕棚内完成的传统动捕方案,mocopi由六枚重量仅约8g,尺寸直径约3.2cm的纽扣式”传感器组成,用户仅需通过蓝牙将传感器与兼容mocopi”应用程序的智能手机进行配对,穿戴四肢、头部和腰部的传感器,即可轻松实现动作捕捉。

此外,传感器满电状态下支持长达约10小时续航,在户外也能自由使用。

mocopi”应用程序可以轻松接收传感器获得的数据,进而自由驱动自己的3D虚拟形象。在mocopi”应用程序中,用户还可以实时录制视频或导出动作数据,这一切都可以在智能手机上完成,省去了传统动捕方案复杂的操作流程。

除了默认的官方Raynos酱形象,也支持VRM模型导入,上传即可使用自制虚拟形象。

mocopi的AR背景模式支持实景和3D虚拟形象同框录制,用户可以随身携带小巧的mocopi,走出家门,利用AR背景模式使虚拟形象置身于不同的现实场景和环境中,并实时录制保存拍摄的视频。同时,mocopi也自带绿幕背景模式,支持拍摄作品在其他终端的二次创作。

举报

  • 相关推荐
  • 大家在看
  • 3D领域的Midjourney?Luma AI助您捕捉真实之美

    LumaAI是一款革命性的3D捕捉技术,具备无与伦比的光线和反射效果。它使未来的视觉效果技术可用于每个人,无论是专业人士还是普通用户。这将彻底改变游戏开发、虚拟现实和影视行业的创作方式。

  • 好莱坞演员继续罢工 抗议AI和3D扫描技术

    好莱坞演员继续罢工,对抗AI技术的增长和使用,并声援“NOFAKESACT”法案。好莱坞编剧罢工已经结束,并获得了对剧本中的AI保护措施,但对于演员来说,情况却并不乐观。包括MoveAI在内的初创公司正在开发可以使用单部智能手机的AI驱动的3D运动捕捉技术,这将大大降低成本和所需资源。

  • MonoXiver:新AI算法将2D照片转换为3D地图

    MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法。它只需要一个普通的单目摄像头,就可以构建相机周围可靠的三维地图。除自动驾驶外,这种AI方法也可应用于其他领域,如机器人、环境监测、医学成像等。

  • 3D视角洞悉矩阵乘法,这就是AI思考的样子

    如果能以3D方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。矩阵乘法已经成为机器学习模型的构建模块,是各种强大AI技术的基础,了解其执行方式必然有助于我们更深入地理解这个AI以及这个日趋智能化的世界。下面的可视化显示了一个注意力头,其权重张量wQ、wK_t、wV、wO被低秩分解wQ_A@wQ_B等替换。

  • 中国研究团队发布多视角数据集“FreeMan” 解决3D人体姿势估计局限性

    从真实场景中估计人体的三维结构是一项具有挑战性的任务,对于人工智能、图形学和人机交互等领域具有重要意义。现有的3D人体姿态估计数据集通常在受控条件下收集,具有静态背景,无法代表真实世界场景的多样性,从限制了用于真实应用的准确模型的开发。FreeMan的可用性预计将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。

  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • CoDA开源:可在3D场景中检测和命名新物体

    CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。

  • 思看科技3D扫描仪助力大型房车个性化定制改装!

    汽车产业正在迈入个性化定制新时代,传统的大规模生产已经不能满足人们对汽车的多样化需求,汽车制造商和经销商可以借助思看科技三维扫描技术,为消费者提供高效、精准、灵活、全方位的定制选择和体验。01客户需求与痛点房车作为一种独特的出行方式,具有自由、灵活、舒适和独特的特点,给人们带来非常特殊的旅行和居住体验。思看科技的产品与解决方案还可用于汽车开发设计、冲压件检验、汽车车身检测、其它零部件检测、维护检修与其他车型的定制化环节,为全球客户提供专业的三维数据获取方法,降低检测人工及时间成本,以数字化技术驱动汽车制造产业转型升级。

  • POCO:用于3D人体姿势和形状估计的新型人工智能框架

    人体姿态和形状的三维估计是重建现实世界中的人体行为所必需的。从二维图像进行三维推断面临深度模糊、遮挡、不寻常的服装和运动模糊等挑战。如果您对此感兴趣,不妨查看相关链接以了解更多详情。

  • 创新型生成模型CityDreamer:一键生成无边界的3D城市

    关于3D自然场景生成的研究已经很多,但对于3D城市生成的研究相对较少。这是因为在城市环境中,人们对结构扭曲更加敏感生成3D城市比生成3D自然场景更为复杂。这一技术的应用前景非常广阔,将在游戏、城市规划、虚拟现实等领域发挥关键作用。

  • FLUX.1-Turbo-Alpha:基于FLUX.1-dev模型的8步蒸馏Lora,用于文本到图像生成。

    FLUX.1-Turbo-Alpha是一个基于FLUX.1-dev模型的8步蒸馏Lora,由AlimamaCreative Team发布。该模型使用多头鉴别器来提高蒸馏质量,可以用于文本到图像(T2I)、修复控制网络等FLUX相关模型。推荐使用指导比例为3.5,Lora比例为1。该模型在1M开源和内部源图像上进行训练,采用对抗性训练提高质量,固定原始FLUX.1-dev变换器作为鉴别器主干,并在每层变换器上添加多头。

  • F5-TTS:基于深度学习的高质量文本到语音合成模型

    F5-TTS是由SWivid团队开发的一个文本到语音合成(TTS)模型,它利用深度学习技术将文本转换为自然流畅、忠实于原文的语音输出。该模型在生成语音时,不仅追求高自然度,还注重语音的清晰度和准确性,适用于需要高质量语音合成的各种应用场景,如语音助手、有声读物制作、自动新闻播报等。F5-TTS模型在Hugging Face平台上发布,用户可以方便地下载和部署,支持多种语言和声音类型,具有很高的灵活性和可扩展性。

  • Octomind QA Agent:自动化测试工具,无需编程即可生成端到端测试。

    Octomind QA Agent 是一款基于人工智能的自动化测试工具,它能够自动分析网页应用并生成测试用例,执行测试并维护测试代码。这款工具的主要优点是它不需要用户具备编程知识,可以大幅降低测试的门槛,提高测试效率。它适用于希望提高软件质量、减少测试成本和时间的开发者和团队。Octomind QA Agent 提供了免费试用版本,用户可以在不提供信用卡信息的情况下尝试其功能。

  • Augment UI:利用AI生成用户界面的创新工具

    Augment UI是一个利用人工智能技术,根据用户描述自动生成用户界面代码的工具。它通过简化设计流程,提高开发效率,让设计师和开发者能够快速实现创意。产品背景信息显示,Augment UI旨在解决传统UI设计中耗时且重复的工作,通过AI技术,用户只需描述他们想要的界面,Augment UI就能生成相应的代码。这不仅节省了时间,还降低了设计和开发的门槛。目前产品提供免费试用,具体价格信息需进一步了解。

  • Anon:AI助手,隐私保护

    Anon是一个注重隐私的AI助手,类似于ChatGPT,但默认提供隐私保护。它允许用户在不登录、无追踪的情况下自由使用,所有对话都保留在本地设备上。Anon由先进的技术如Llama 3.1 405B和FLUX提供支持,旨在为用户提供一个安全、私密的AI对话环境。

  • PodcastWorld:AI驱动的播客对话搜索引擎

    PodcastWorld是一个利用人工智能技术,通过分析数百万播客对话来帮助用户找到所需答案的搜索引擎。用户可以询问问题,并直接收听播客中回答该问题的确切片段。这个平台不仅提供了一个与播客内容互动的新方式,还通过聊天功能,使用户能够与播客创作者进行更深入的交流。PodcastWorld通过提供播客摘要、音频片段和完整的对话记录,满足了用户对信息获取和知识分享的需求。

  • Chat with your Database:与数据库对话,用自然语言查询数据。

    Chat with your Database 是一个创新的数据库交互工具,它允许用户通过自然语言与Postgres数据库进行交互。利用AI技术,用户可以轻松地查询、分析和操作数据库,而无需编写复杂的SQL代码。该产品支持开源,鼓励社区参与开发和贡献,代码在GitHub上公开,用户可以自由探索、贡献或定制以满足特定需求。

  • AI Comic Factory.ai:在线AI漫画生成器,快速将创意转化为漫画故事。

    AI Comic Factory是一个创新的在线平台,旨在帮助用户轻松创建独特的漫画。用户可以通过输入描述性的提示或上传图片来生成各种风格的漫画,包括角色、场景和对话的选项。该平台提供定制选项,如版式布局、角色设计和对话生成,以增强漫画的视觉效果。凭借用户友好的步骤和可调设置,实现高质量的结果变得简单。无论是个人娱乐还是创意项目,AI Comic Factory都使得漫画创作过程变得高效且愉快。

  • AutoArena:自动化的生成式AI评估平台

    AutoArena是一个自动化的生成式AI评估平台,专注于评估大型语言模型(LLMs)、检索增强生成(RAG)系统和生成式AI应用。它通过自动化的头对头判断来提供可信的评估,帮助用户快速、准确、经济地找到系统的最佳版本。该平台支持使用来自不同供应商的判断模型,如OpenAI、Anthropic等,也可以使用本地运行的开源权重判断模型。AutoArena还提供了Elo评分和置信区间计算,帮助用户将多次头对头投票转化为排行榜排名。此外,AutoArena支持自定义判断模型的微调,以实现更准确、特定领域的评估,并可以集成到持续集成(CI)流程中,以自动化评估生成式AI系统。

  • GodmodeHQ:销售和市场营销AI,自动增长您的业务。

    GodmodeHQ是一个AI驱动的销售和市场营销平台,旨在通过自动化的方式帮助企业提高销售效率和市场覆盖。它通过集成多个B2B数据库,利用自然语言处理技术,帮助用户寻找和验证潜在客户,生成个性化的营销信息,并管理整个销售流程。产品的主要优点包括节省时间、提高销售团队的工作效率、以及通过个性化的营销信息提高转化率。GodmodeHQ的背景信息显示,它是由一群对销售和市场营销有深刻理解的团队开发的,旨在解决传统销售过程中的痛点,如寻找潜在客户、客户资格审查、个性化营销等。产品的价格策略是免费试用,之后根据功能的不同,提供不同的付费套餐。

  • Echo:使用AI整理和提炼你的想法的语音和文本笔记应用

    Echo是一款结合了人工智能技术的语音和文本笔记应用,它通过AI技术帮助用户组织和提炼思考。Echo利用GPT-4o大型语言模型进行转录、回忆和洞察力生成,能够准确转录用户的语音输入,并根据用户过去的想法提供有意义的答案,使日记体验更具互动性和吸引力。该产品注重隐私和安全性,笔记加密,不查看用户数据,也不使用数据训练AI,遵循行业最佳实践进行数据保护。目前Echo处于免费测试阶段,未来计划引入高级功能。

  • JobJump:个性化AI面试助手,助你在面试中脱颖而出。

    JobJump - AI Interview Copilot是一款专为求职者设计的Chrome插件,它通过人工智能技术提供个性化的面试辅导。这款插件能够识别面试官的问题,并即时生成定制化的答案提示,帮助用户更自信地回答问题。它支持50多种面试语言,并针对200多个行业和角色进行了定制化。JobJump插件易于安装和使用,用户可以通过Google账号注册并免费开始使用。它适用于多种在线面试平台,能够帮助用户在面试中更好地展示自己,提高获得理想工作的机会。

  • Coverr AI Workflows:利用AI技术提升视频创作效率

    Coverr AI Workflows是一个专注于AI视频生成的平台,提供多种AI工具和工作流程,帮助用户通过简单的步骤生成高质量的视频内容。该平台汇集了AI视频专家的智慧,通过社区分享的workflows,用户可以学习如何使用不同的AI工具来创作视频。Coverr AI Workflows的背景是基于人工智能技术在视频制作领域的应用日益广泛,它通过提供易于理解和操作的工作流程,降低了视频创作的技术门槛,使得非专业人士也能创作出专业级别的视频内容。Coverr AI Workflows目前提供免费的视频和音乐资源,定位于满足创意工作者和小型企业的视频制作需求。

  • Emploio:AI驱动的员工成长平台

    Emploio是一个利用人工智能技术来支持个人成长、增强职业发展,并培养一个充满活力的工作场所文化的平台。它通过提供AI驱动的洞察力来最大化团队潜力,帮助企业跟踪员工成长和团队表现,分享跨部门的洞察力,并构建完美的团队。此外,Emploio还提供一对一的协助,确保每个团队成员都能获得成功所需的指导。它还可以与日常使用的工具集成,优化生产力,并通过统一的仪表板与团队保持联系。

  • Handinger:从互联网提取数据的简单且经济的方式

    Handinger是一个提供数据提取服务的网站,它允许用户通过HTTP端点轻松提取网页内容,包括Markdown、截图、元数据和HTML等格式。这种服务对于训练大型语言模型、存储内容或获取网页特定内容非常有用。Handinger的价格非常低廉,每URL的成本仅为0.0005美元,且每月前2000个URL免费,没有前期成本,也无需复杂的API积分。该服务支持所有类型的网站,并且为用户提供了慷慨的速率限制,每分钟可进行1000次请求。

  • 笔灵AI小说生成器:智能AI辅助小说创作工具

    AI小说生成器是一个专为小说创作者设计的智能AI辅助工具,它通过提供各种写作模板、灵感词库、人物设定、剧情生成等功能,帮助作者快速构思和创作小说。该产品背景信息显示,它由上海简办网络科技有限公司开发,旨在解决作者在创作过程中遇到的灵感枯竭、写作效率低下等问题。产品的主要优点包括丰富的写作模板、AI智能生成和改写功能、以及对不同小说类型的全面支持。价格方面,产品提供终身会员服务,每月只需极低的费用,性价比极高。

  • Swarm:多智能体系统构建、编排和部署框架

    Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。它通过定义智能体(Agent)和交接(handoffs)的抽象概念,实现了智能体之间的协调和执行。Swarm框架强调轻量级、高可控性和易于测试,适用于需要大量独立功能和指令的场景,允许开发者拥有完全的透明度和对上下文、步骤和工具调用的细粒度控制。Swarm框架目前处于实验阶段,不推荐在生产环境中使用。

  • AI Hairstyle:AI驱动的发型变换和发色更换工具

    AI 发型是一个在线平台,利用人工智能技术为用户提供个性化的发型和发色更换体验。用户可以通过上传自己的照片,尝试不同的发型和颜色,无需实际剪发或染发即可预览效果。该平台的AI技术能够分析用户的面部特征,推荐最适合的发型和颜色,帮助用户在做出实际改变前做出更明智的决定。AI 发型的主要优点包括:个性化推荐、真实预览效果、云端存储生成的图片、用户友好的界面以及多种发型和颜色选择。产品背景信息显示,AI 发型已经拥有超过10K+用户和2M+生成的发型数量,显示了其受欢迎程度。价格方面,AI 发型提供免费计划,同时也提供不同级别的付费计划,以满足不同用户的需求。

  • Enjoy App:AI辅助的英语学习应用,专注发音训练和记忆提升。

    Enjoy App是一款专注于英语学习的应用程序,它通过AI技术帮助用户纠正发音,提供学习记录跟踪,并利用丰富的在线素材进行语言学习。该应用提倡直接上手学习,忽略繁琐的方法论,旨在通过1000小时的专注训练帮助用户掌握英语技能。它支持音频和视频的可视化跟读,AI自然对话,以及记忆增强系统,是学习英语的有力工具。Enjoy App的价格策略是按使用功能计费,新用户有初期余额,之后可以通过充值享受更多服务。

  • AI视频生成神器:利用AI技术快速生成视频内容

    AI视频生成神器是一款利用人工智能技术,将图片或文字转换成视频内容的在线工具。它通过深度学习算法,能够理解图片和文字的含义,自动生成具有吸引力的视频内容。这种技术的应用,极大地降低了视频制作的成本和门槛,使得普通用户也能轻松制作出专业级别的视频。产品背景信息显示,随着社交媒体和视频平台的兴起,用户对视频内容的需求日益增长,而传统的视频制作方式成本高、耗时长,难以满足快速变化的市场需求。AI视频生成神器的出现,正好填补了这一市场空白,为用户提供了一种快速、低成本的视频制作解决方案。目前,该产品提供免费试用,具体价格需要在网站上查询。

今日大家都在搜的词: