首页 > 业界 > 关键词  > 百度最新资讯  > 正文

百度虚拟形象驱动专利公布 可应用于元宇宙等场景

2022-10-19 14:39 · 稿源:站长之家

站长之家 10 月 19 日讯:企查查APP显示,近日,北京百度网讯科技有限公司“虚拟形象驱动方法、装置、电子设备及存储介质”专利公布。专利摘要显示,该专利涉及计算机视觉、深度学习以及增强现实等人工智能领域,可应用于虚拟形象生成以及元宇宙等场景。

举报

  • 相关推荐
  • 大家在看
  • 索尼发布六枚“纽扣”:真人动作捕捉驱动3D虚拟形象

    索尼发布便携动作捕捉产品mocopi,将于10月上旬上市销售,建议零售价2499元。mocopi由六个小巧轻便的传感器搭配专用mocopi”应用程序,使用智能手机实现实时动作捕捉与数据处理,让用户自由驱动3D虚拟形象。mocopi也自带绿幕背景模式,支持拍摄作品在其他终端的二次创作。

  • 不用再怕晕车了!华为防晕车专利公布:眼随身动

    快科技9月26日消息,国家知识产权局网站显示,华为技术有限公司申请的基于视觉补偿图像的防晕车方法、装置和系统”专利公布,公告号为 CN116804918A。专利摘要获悉显示,申请提供了一种基于视觉补偿图像的防晕车方法、装置和系统。通过实时地生成视觉补偿图像,该视觉补偿图像可以反映出车辆相对道路 (或者地面) 的实时运动状态,该视觉补偿图像中包括道路和车道�

  • 看完这场震惊所有人的“虚拟人”对话,我觉得元宇宙可能真要来了…

    元宇宙这个概念,自从2021年被扎克伯格带火后,给人们的感觉一直就像个“最熟悉的陌生人”,总是若即若离,忽远忽近的。说直白点儿,就是大家都觉得它存在感不够强,没有想象的那么厉害。生于这个时代,见证一切不可能变为可能的我们,本身就已经足够幸运。

  • 苹果考虑将灵动岛概念应用于Mac 14等新产品上

    苹果公司正计划将灵动岛的设计理念扩展到更多产品中不仅仅是iPhone。未来苹果的Mac产品也可能采用灵动岛设计,这将对Mac的桌面风格和交互方式产生重大影响。mini-LED的使用也让人们期待未来苹果将在更多产品中使用这项技术。

  • 巨头“拾荒”元宇宙

    科技语境从来没有永恒的主角,无论是技术、概念是故事,都在随着时代变换不停流转,如同不息涌动的浪潮,塑造着时代的脉络,将人们卷入其中。在诸多造势神话里,元宇宙的故事最令人意难平。那个肆意野蛮生长,任由玩家们炒作、敛财的元宇宙概念,已经死了;对真正的元宇宙言,未来的路还很长。

  • 苹果手柄专利公开,可与平板、VR等设备互动

    企查查APP显示,近日,苹果公司公开专利“具有可分离部分的控制器设备”。该专利提供了一种可以与联网设备一起使用的控制器设备,操作方式可以包括按钮、操纵杆和/或触摸输入。在一些应用中,控制器还可以检测用户的手的位置或运动以用于导航增强现实或虚拟现实编程,以及导航界面或游戏活动。

  • 小米无线充电车专利公布:支持自动驾驶 可将电能无线传输给电动车

    快科技10月10日消息,据天眼查,今日,小米汽车科技有限公司申请的充电车及充电方法”专利公布。本公开涉及一种充电车及充电方法,所述充电车包括:电池仓,用于装载电池;无线充电装置,用于将所述电池的电能无线传输给电动车。自动驾驶系统用于控制所述充电车行驶到与所述电动车处于预设的相对位置关系,在所述相对位置关系下,所述无线充电装置能够将所述电�

  • 密歇根大学发布UM-GPT等3款生成式AI产品并应用于教学

    美国顶级公立大学密歇根大学发布了3款自主研发的生成式AI产品,用于支撑学校的教学、行政管理和学术科研等工作,这在高等教育机构中具有开创性的意义。密歇根大学推出了UM-GPT,这是一个类似ChatGPT的问答机器人,能够回答各类问题,自动总结文本,甚至可以根据用户喜好推荐影视作品或音乐。虽然仍需关注潜在的安全隐患,但这一举措无疑为其他高校智能化提供了宝贵借鉴。

  • 百度发布首个量子领域大模型 及百度量子助手、量子写作助手AI原生

    百度发布首个量子领域大模型,及百度量子助手和量子写作助手两大AI原生应用,旨在芯片层、框架层、模型层及应用层等全栈技术上加速量子技术与大模型深度融合,充分激发两大技术各自的潜力。该量子领域大模型是在文心一言基础上,使用量子领域高质量数据进行更有针对性的训练和优化构建的量子领域大模型,能更好地理解量子知识,专业执行量子任务。只需输入6个变量,量子写作助手可在5分钟内撰写一篇13000字符合格式要求的专利文档,高效帮助企业将量子领域的研究成果与知识产权沉淀为企业资产。

  • 第三届元宇宙共享大会|甘华鸣:高屋建瓴地认识Web3.0/元宇宙和区块链积分

    2023年9月26日,“趋势与未来”第三届元宇宙共享大会暨Web3.0链改——绿色积分资产化实践项目签约发布会及汇来购全生态3.0启动盛典在广东惠州金海湾成功举办。该活动由中国移动通信联合会元宇宙产业工作委员会、中国通信工业协会区块链专业委员会联合主办,亚洲区块链综合管理机构、汇来购经济服务平台共同承办,物链芯工程技术研究院,央链直播联合协办。为推动社会走向数字文明新时代,共建元宇宙技术创新生态体系,推动元宇宙可持续健康发展。

  • ElevenLabs AI audio API :强大的AI音频API,提升项目互动性。

    ElevenLabs AI音频API提供了高质量的语音合成服务,支持多种语言,适用于聊天机器人、代理、网站、应用程序等,具有低延迟和高响应速度。该API支持企业级需求,确保数据安全,符合SOC2和GDPR合规性。

  • Swapy:简单几行代码,实现拖拽交换布局

    Swapy是一个框架无关的工具,它允许开发者通过简单的代码将任何布局转换为拖拽交换式的布局。它支持所有流行的前端框架,如React、Vue和Svelte,并且可以通过npm或CDN进行安装。Swapy的主要优点是它的易用性和灵活性,使得开发者可以快速实现复杂的拖拽功能,而无需深入了解拖拽交互的底层实现。

  • Finance Commons and the Bad Data Toolbox:开箱即用的文档AI工具箱,针对不良数据优化

    Finance Commons和Bad Data Toolbox是一系列针对文档AI研究和应用的模型和工具。它们专注于处理不良数据,包括OCR错误、结构混乱的文本等,以提高AI在文档处理中的鲁棒性。这些工具和模型有助于自动化流程,减少企业在准备内容时的工作量,同时支持下一代多模态文档模型的发展。

  • Morphic Studio:加入等待名单,体验新的故事讲述方式

    Morphic Studio是一个创新的故事讲述平台,旨在通过先进的技术手段,为用户提供沉浸式和互动式的故事体验。它利用最新的交互技术和视觉效果,让用户能够更深入地参与到故事中,感受故事的魅力。Morphic的主要优点包括:1. 沉浸式体验;2. 互动性强;3. 视觉效果突出;4. 易于操作和使用。产品背景信息显示,Morphic致力于通过技术革新,推动故事讲述方式的变革,满足现代观众对高质量内容的需求。

  • DCLM-baseline:高性能语言模型基准测试数据集

    DCLM-baseline是一个用于语言模型基准测试的预训练数据集,包含4T个token和3B个文档。它通过精心策划的数据清洗、过滤和去重步骤,从Common Crawl数据集中提取,旨在展示数据策划在训练高效语言模型中的重要性。该数据集仅供研究使用,不适用于生产环境或特定领域的模型训练,如代码和数学。

  • DCLM-7B:7亿参数的语言模型,展示数据整理技术的有效性。

    DCLM-Baseline-7B是一个7亿参数的语言模型,由DataComp for Language Models (DCLM)团队开发,主要使用英语。该模型旨在通过系统化的数据整理技术来提高语言模型的性能。模型训练使用了PyTorch与OpenLM框架,优化器为AdamW,学习率为2e-3,权重衰减为0.05,批次大小为2048序列,序列长度为2048个token,总训练token数达到了2.5T。模型训练硬件使用了H100 GPU。

  • DCLM:构建和训练大型语言模型的综合框架

    DataComp-LM (DCLM) 是一个为构建和训练大型语言模型(LLMs)而设计的综合性框架,提供了标准化的语料库、基于open_lm框架的高效预训练配方,以及超过50种评估方法。DCLM 支持研究人员在不同的计算规模上实验不同的数据集构建策略,从411M到7B参数模型。DCLM 通过优化的数据集设计显著提高了模型性能,并且已经促成了多个高质量数据集的创建,这些数据集在不同规模上表现优异,超越了所有开放数据集。

  • Dzine AI:AI图像和设计工具,提升创意效率。

    Dzine AI是一个强大的AI图像生成和设计工具,它通过生成式AI帮助设计师将创意转化为专业视觉效果,大幅度减少重复性工作时间。Dzine AI提供了丰富的预设风格,用户无需复杂的风格提示即可轻松定制设计,同时支持层叠、定位和草图工具,实现直观准确的图像布局调整。Dzine AI拥有用户友好的界面,适合所有技能水平的用户使用。

  • RWKV:新一代大模型架构,超越 Transformer。

    RWKV 是一种革新的深度学习架构,结合了 RNN 和 Transformer 的最佳特性。它提供出色的性能,快速的推理和训练,并且不依赖自注意力机制,节省 VRAM,支持 ' 无限 ' 的上下文长度。RWKV 在多个语言和编码中表现出色,成为全球开发者的热门选择,推动了开源大语言模型的进步。

  • Live_Portrait_Monitor:通过监控器让肖像动起来!

    Live_Portrait_Monitor 是一个开源项目,旨在通过监控器或网络摄像头实现肖像动画化。该项目基于LivePortrait研究论文,使用深度学习技术,通过拼接和重定向控制来高效地实现肖像动画。作者正积极更新和改进此项目,仅供研究使用。

  • Typebot.io:一个可自托管的强大聊天机器人构建器

    Typebot是一个开源的聊天机器人构建器,允许用户通过可视化方式创建高级聊天机器人,嵌入到任何web/mobile应用中,并实时收集结果。它提供了34多种构建块,如文本、图片、视频、音频、条件分支、逻辑脚本等,支持多种集成方式,如Webhook、OpenAI、Google Sheets等。Typebot支持自定义主题,以匹配品牌身份,并提供深度分析功能,帮助用户洞察聊天机器人的表现。

  • Animate Old Photos:用AI技术让老照片动起来

    Animate Old Photos是一个利用Kling AI技术将老照片转化为生动视频的网站。它通过AI技术使旧时记忆重新焕发活力,为用户带来更加生动和动态的体验。该产品目前处于beta测试阶段,免费提供服务,但随着高级功能的增加,未来可能会推出付费计划。

  • Discovery Outcomes:AI驱动的产品管理操作系统

    Discovery Outcomes是一个AI驱动的产品管理操作系统,旨在简化和增强产品管理流程。它通过集成工具、促进协作,并利用AI提高工作效率。该平台通过统一平台覆盖从设定目标到功能交付的所有内容,解决工具跳跃、数据冗余和信息孤岛等常见挑战。Discovery Outcomes通过AI驱动的效率提升,旨在提高上市时间、生产力、创新率、交付物质量、适应性、灵活性、跨功能协作和投资回报率。

  • Revent.ai:使用AI快速创建专业演示文稿

    Revent.ai 是一个专注于利用人工智能技术帮助用户快速创建专业演示文稿的平台。其核心功能包括演示文稿自动化和设计服务,旨在通过简化设计流程,让用户能够专注于内容的传达,从而提升演示文稿的质量和效率。Revent.ai 的使命是让技术更好地服务于人,强调以人为本,确保质量和价值始终贯穿于产品之中。

  • AI Memory:智能记忆助手,随时随地回忆重要信息

    Flot.ai的AI Memory是一个基于人工智能的个人知识库管理工具,通过AI Memory功能,帮助用户轻松构建和回忆个人知识库。它允许用户通过简单的点击操作,从任何应用程序或网站保存文本到AI记忆中,并随时通过与AI对话来回忆这些信息。产品强调了其无需组织、易于访问和使用的特点,以及对隐私的高度重视,符合GDPR标准。

  • AI数学解题器:智能解决数学问题,提升学习效率

    AI数学解题器是由数学AI和数学GPT模型(如GPT-4o)驱动的在线工具,旨在提供广泛的数学问题解决方案。它利用先进的人工智能技术,为学生和教师提供详尽的分步解答,增强了对数学概念的理解和解题能力。该产品背景是数学学习中对高效解题工具的需求,定位于免费提供高质量的教育支持。

  • CohesiveAI:AI驱动的数据采集与分析工具

    Cohesive是一款集成在Google Sheets中的AI工具,它允许用户通过AI技术进行数据的批量分析、个性化生成以及网页抓取,特别适用于需要大规模数据采集和分析的商业场景。它支持在Google Sheets内直接进行操作,无需学习新平台,简化了数据导入和导出的流程。Cohesive还提供了与ZeroBounce的集成,帮助用户找到或验证电子邮件地址。

  • AI Renamer:智能文件重命名工具

    ai-renamer 是一个基于 Node.js 的命令行工具,利用 Ollama 和 LM Studio 模型(如 Llava, Gemma, Llama 等)智能地根据文件内容重命名文件。它支持视频、图片等多种文件类型,并且可以通过自定义参数来优化重命名过程。该工具使用户能够自动化文件管理,提高效率,尤其适合需要批量处理文件名的开发者和内容创作者。

  • EasyMedia:AI驱动,快速将YouTube视频转化为社交媒体内容。

    EasyMedia是一个利用人工智能技术,帮助用户将YouTube视频内容快速转化为适合不同社交媒体平台的帖子、推文等。它支持Facebook、Instagram、Twitter、LinkedIn等多个平台,能够根据平台特点自动调整内容格式,提高内容的吸引力和传播力。产品背景在于帮助用户节省内容创作时间,同时增加其在数字世界中的影响力。

  • Kuluko:将想法变成有声书

    Kuluko是一款AI驱动的有声书生成器,它允许用户通过简单的提示或个性化的设置来创作属于自己的有声书。它提供了两种模式:简易模式和高级模式,以满足不同用户的需求。简易模式下,用户只需输入一个提示,AI即可生成完整的小说。高级模式则允许用户自定义故事的各个方面,包括角色、类型、背景、故事时间、叙述者声音等。Kuluko将故事转化为长达4小时的有声书,用户可以立即开始收听。此外,Kuluko还具有个人和公共图书馆功能,用户可以选择私密享受或与他人分享。

今日大家都在搜的词:

热文

  • 3 天
  • 7天