首页 > 业界 > 关键词  > 游戏行业最新资讯  > 正文

全球语音指挥FPS AI ,腾讯魔方携AI成果亮相科隆展

2024-08-23 13:39 · 稿源:站长之家用户

AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo这是全球首次将大语言模型融合到FPS游戏的队友和自动交互中,属于业界前沿的技术尝试。目前,魔方AI技术团队正在为该技术申请10项专利

“Bravo2从右边的卡车发起射击掩护,Brove3原地隐蔽,Bravo4带我撤离”,在这段魔方工作室最新射击端游《ArenaBreakout:infinite》(《暗区突围:无限》)最新展示的AI技术视频里,玩家可以通过语言给AI智能队友下指令,而AI会根据指令密切配合玩家进行战术动作。

descript

作为全球第一个能听懂人类语言的FPSAI队友,F.A.C.U.L.应用了最先进的生成式AI技术,包括语音输入,大语言模型,实时语音合成,和环境识别等,具备四大突出能力:

第一,直接分析复杂战术指令语言的能力。

在以往的FPS游戏中,玩家只能通过快捷键、指令轮盘向AI队友下达如跟随、防守、撤退等简单命令,而现在,智能队友不仅能够理解复杂如“二号,去前面带路”、“用前面那棵树做掩体”,甚至像“跑到前面用沙袋当掩体,再从沙袋绕到前方汽车后”这样更加复杂的、一系列的指令,使玩家的语言也成为战力的一部分。

descript

第二,极强的环境感知能力。

目前,智能队友能够准确识别超10000个游戏内物体,如建筑物、汽车、可收藏物品等,能分辨颜色与材质,甚至能对天气情况进行报告,这一能力使玩家下达的“寻找一个绿色的箱子”、“帮我找大金(战利品)”等指令也能被准确执行,大大提升了AI与玩家进行战术配合的空间。

值得一提的是,该环境感知技术为全球首创,目前尚无其他游戏产品应用。

第三,优秀的策略执行能力。

智能队友不仅可以完成如侦查、投掷道具、开关门、找掩体等动作指令,还能够理解并执行“重复起立蹲下十次,吸引火力”、“一起当老六”等进阶指令,例如“我开门你扔雷”、“掩护我!封烟”、“你攻击敌人,我绕后”等强调队友间协作的动作,智能队友都可以完美完成。

descript

第四,更拟真的交互能力。

不同于FPS游戏中常见的文字反馈或固定语音播放,智能队友能够推测玩家意图并进行实时语音反馈。当玩家询问“这一波打得爽不爽”时,智能队友会根据实际情况与玩家闲聊,而对于“你去舔包”、“给我一把枪”等涉及游戏成果的指令,智能队友会结合目前形势灵活选择听从或拒绝。

基于以上各项能力,智能队友能够及时反馈并完美执行玩家通过语音下达的各种复杂指令,使AI的应用深度结合局内环境与战斗行为,为FPS玩法探索更多的可能性。

descript

据工作室负责人现场介绍,F.A.C.U.L.仍在内部训练测试阶段,目前只以技术demo方式呈现,未来还需要思考与解决”如何保证更公平的游戏环境”等关键问题。

与此同时,魔方AI技术团队正在探索AI技术于游戏里的更多应用可能,此前首创格斗游戏大规模强化学习方案“集海训练系统”并应用于《火影忍者》手游,使《火影忍者》手游成为全球首个应用AI学习的商业格斗游戏。

AI等前沿数字技术正在实现革命性突破,不断推动产业发展。一直以来,腾讯游戏在AI领域持续深耕,旗下天美、光子等工作室群在AI领域进行了不同方向的技术探索,如光子工作室研发的GVoice AI Codec技术,实现了语音AI Codec技术应用游戏行业零的突破;天美J3工作室实现了拟人 AI 与智能体动作生成技术的研发突破;腾讯在今年推出的自研AI引擎,让游戏场景制作、内容生成等领域的部分工作效率提升40倍以上。这次在科隆游戏展首次曝光的全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo,则有望为FPS游戏带来全新的体验。

举报

  • 相关推荐
  • 大家在看
  • Echo:使用AI整理和提炼你的想法的语音和文本笔记应用

    Echo是一款结合了人工智能技术的语音和文本笔记应用,它通过AI技术帮助用户组织和提炼思考。Echo利用GPT-4o大型语言模型进行转录、回忆和洞察力生成,能够准确转录用户的语音输入,并根据用户过去的想法提供有意义的答案,使日记体验更具互动性和吸引力。该产品注重隐私和安全性,笔记加密,不查看用户数据,也不使用数据训练AI,遵循行业最佳实践进行数据保护。目前Echo处于免费测试阶段,未来计划引入高级功能。

  • JobJump:个性化AI面试助手,助你在面试中脱颖而出。

    JobJump - AI Interview Copilot是一款专为求职者设计的Chrome插件,它通过人工智能技术提供个性化的面试辅导。这款插件能够识别面试官的问题,并即时生成定制化的答案提示,帮助用户更自信地回答问题。它支持50多种面试语言,并针对200多个行业和角色进行了定制化。JobJump插件易于安装和使用,用户可以通过Google账号注册并免费开始使用。它适用于多种在线面试平台,能够帮助用户在面试中更好地展示自己,提高获得理想工作的机会。

  • Coverr AI Workflows:利用AI技术提升视频创作效率

    Coverr AI Workflows是一个专注于AI视频生成的平台,提供多种AI工具和工作流程,帮助用户通过简单的步骤生成高质量的视频内容。该平台汇集了AI视频专家的智慧,通过社区分享的workflows,用户可以学习如何使用不同的AI工具来创作视频。Coverr AI Workflows的背景是基于人工智能技术在视频制作领域的应用日益广泛,它通过提供易于理解和操作的工作流程,降低了视频创作的技术门槛,使得非专业人士也能创作出专业级别的视频内容。Coverr AI Workflows目前提供免费的视频和音乐资源,定位于满足创意工作者和小型企业的视频制作需求。

  • Emploio:AI驱动的员工成长平台

    Emploio是一个利用人工智能技术来支持个人成长、增强职业发展,并培养一个充满活力的工作场所文化的平台。它通过提供AI驱动的洞察力来最大化团队潜力,帮助企业跟踪员工成长和团队表现,分享跨部门的洞察力,并构建完美的团队。此外,Emploio还提供一对一的协助,确保每个团队成员都能获得成功所需的指导。它还可以与日常使用的工具集成,优化生产力,并通过统一的仪表板与团队保持联系。

  • Handinger:从互联网提取数据的简单且经济的方式

    Handinger是一个提供数据提取服务的网站,它允许用户通过HTTP端点轻松提取网页内容,包括Markdown、截图、元数据和HTML等格式。这种服务对于训练大型语言模型、存储内容或获取网页特定内容非常有用。Handinger的价格非常低廉,每URL的成本仅为0.0005美元,且每月前2000个URL免费,没有前期成本,也无需复杂的API积分。该服务支持所有类型的网站,并且为用户提供了慷慨的速率限制,每分钟可进行1000次请求。

  • 笔灵AI小说生成器:智能AI辅助小说创作工具

    AI小说生成器是一个专为小说创作者设计的智能AI辅助工具,它通过提供各种写作模板、灵感词库、人物设定、剧情生成等功能,帮助作者快速构思和创作小说。该产品背景信息显示,它由上海简办网络科技有限公司开发,旨在解决作者在创作过程中遇到的灵感枯竭、写作效率低下等问题。产品的主要优点包括丰富的写作模板、AI智能生成和改写功能、以及对不同小说类型的全面支持。价格方面,产品提供终身会员服务,每月只需极低的费用,性价比极高。

  • Swarm:多智能体系统构建、编排和部署框架

    Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。它通过定义智能体(Agent)和交接(handoffs)的抽象概念,实现了智能体之间的协调和执行。Swarm框架强调轻量级、高可控性和易于测试,适用于需要大量独立功能和指令的场景,允许开发者拥有完全的透明度和对上下文、步骤和工具调用的细粒度控制。Swarm框架目前处于实验阶段,不推荐在生产环境中使用。

  • AI Hairstyle:AI驱动的发型变换和发色更换工具

    AI 发型是一个在线平台,利用人工智能技术为用户提供个性化的发型和发色更换体验。用户可以通过上传自己的照片,尝试不同的发型和颜色,无需实际剪发或染发即可预览效果。该平台的AI技术能够分析用户的面部特征,推荐最适合的发型和颜色,帮助用户在做出实际改变前做出更明智的决定。AI 发型的主要优点包括:个性化推荐、真实预览效果、云端存储生成的图片、用户友好的界面以及多种发型和颜色选择。产品背景信息显示,AI 发型已经拥有超过10K+用户和2M+生成的发型数量,显示了其受欢迎程度。价格方面,AI 发型提供免费计划,同时也提供不同级别的付费计划,以满足不同用户的需求。

  • Enjoy App:AI辅助的英语学习应用,专注发音训练和记忆提升。

    Enjoy App是一款专注于英语学习的应用程序,它通过AI技术帮助用户纠正发音,提供学习记录跟踪,并利用丰富的在线素材进行语言学习。该应用提倡直接上手学习,忽略繁琐的方法论,旨在通过1000小时的专注训练帮助用户掌握英语技能。它支持音频和视频的可视化跟读,AI自然对话,以及记忆增强系统,是学习英语的有力工具。Enjoy App的价格策略是按使用功能计费,新用户有初期余额,之后可以通过充值享受更多服务。

  • AI视频生成神器:利用AI技术快速生成视频内容

    AI视频生成神器是一款利用人工智能技术,将图片或文字转换成视频内容的在线工具。它通过深度学习算法,能够理解图片和文字的含义,自动生成具有吸引力的视频内容。这种技术的应用,极大地降低了视频制作的成本和门槛,使得普通用户也能轻松制作出专业级别的视频。产品背景信息显示,随着社交媒体和视频平台的兴起,用户对视频内容的需求日益增长,而传统的视频制作方式成本高、耗时长,难以满足快速变化的市场需求。AI视频生成神器的出现,正好填补了这一市场空白,为用户提供了一种快速、低成本的视频制作解决方案。目前,该产品提供免费试用,具体价格需要在网站上查询。

  • AI答案生成器:免费无需注册的智能问答系统,为营销人员提供AI驱动的洞察和解决方案。

    AI答案生成器是一个专为营销人员设计的智能问答系统,它利用先进的人工智能技术,为用户提供关于数字营销趋势和策略的最新信息。该产品的主要优点包括免费使用、无需注册、用户友好界面、精确的语言模型、独特和创意的答案以及节省时间的解决方案。它适用于SEO优化、社交媒体内容规划、电子邮件营销等多种营销需求,帮助用户提高工作效率,快速生成营销策略和内容创意。

  • 派欧算力云:AI云端一体化解决方案,提供模型API、Serverless和GPU租赁服务。

    派欧算力云是一个一站式AIGC云服务平台,提供高性价比的GPU基础设施和无缝集成的最前沿AI推理技术。它全面覆盖不同业务阶段的AI需求,加速业务发展。派欧算力云的主要优点包括:高性能的云服务产品、无需管理和运维GPU基础设施、自动弹性扩缩容、全球覆盖的GPU容器实例、7X24小时客户服务。产品背景信息显示,派欧算力云旨在为AI应用开发者提供强大的算力支持,降低开发成本,提高开发效率。

  • FLUX.1-dev-LoRA-One-Click-Creative-Template:一键式创意图像生成模型

    FLUX.1-dev-LoRA-One-Click-Creative-Template 是一个基于 LoRA 训练的图像生成模型,由 Shakker-Labs 提供。该模型专注于创意照片生成,能够将用户的文本提示转化为具有创意性的图像。模型使用了先进的文本到图像的生成技术,特别适合需要快速生成高质量图像的用户。它是基于 Hugging Face 平台,可以方便地进行部署和使用。模型的非商业使用是免费的,但商业使用需要遵守相应的许可协议。

  • rag-chatbot:一个可以本地与多个PDF文件进行对话的聊天机器人。

    rag-chatbot是一个基于人工智能技术的聊天机器人模型,它能够让用户通过自然语言与多个PDF文件进行交互。该模型使用了最新的机器学习技术,如Huggingface和Ollama,来实现对PDF内容的理解和回答生成。它的重要性在于能够处理大量文档信息,为用户提供快速、准确的问答服务。产品背景信息表明,这是一个开源项目,旨在通过技术创新提升文档处理的效率。目前该项目是免费的,主要面向开发者和技术爱好者。

  • AI Anime Generator:免费AI动漫生成器,轻松创造独特的动漫风格图片

    Free AI Anime Generator是一个基于人工智能技术的在线平台,它允许用户通过简单的点击操作生成高质量的动漫风格图片。这个平台利用先进的AI算法,使得即使是非专业人士也能轻松创造出独特的艺术作品。它不仅为动漫爱好者提供了一个实现创意的平台,也为艺术家和设计师提供了一个探索新创意的工具。该平台完全免费,易于使用,是动漫艺术创作领域的一次创新。

  • Flux 1.1 Pro AI:高级AI图像生成工具,将文本提示转化为专业级图像

    Flux 1.1 Pro AI是一个基于人工智能的高级图像生成平台,它利用尖端的AI技术将用户的文本提示转化为高质量的视觉效果。该平台在图像生成速度上提高了6倍,图像质量显著改善,并增强了对提示的遵从性。Flux 1.1 Pro AI不仅适用于艺术家和设计师,还适用于内容创作者、营销人员等专业人士,帮助他们在各自的领域中实现视觉想法,提升创作效率和质量。

  • falcon-mamba-7b:高性能的7B参数因果语言模型

    tiiuae/falcon-mamba-7b是由TII UAE开发的高性能因果语言模型,基于Mamba架构,专为生成任务设计。该模型在多个基准测试中展现出色的表现,并且能够在不同的硬件配置上运行,支持多种精度设置,以适应不同的性能和资源需求。模型的训练使用了先进的3D并行策略和ZeRO优化技术,使其在大规模GPU集群上高效训练成为可能。

  • 派欧算力云大模型 API:AIGC 应用快速构建平台

    派欧算力云大模型 API 提供易于集成的各模态 API 服务,包括大语言模型、图像、音频、视频等,旨在帮助用户轻松构建专属的 AIGC 应用。该平台拥有丰富的模型资源,支持个性化需求的模型训练和托管,同时保证用户私有模型的保密性。它以高性价比、高吞吐量和高性能推理引擎为特点,适用于多种 AI 应用场景,如聊天机器人、总结摘要、小说生成器等。

  • Chunkr:开源数据摄取API服务

    Chunkr是一个开源的数据摄取API服务,专注于文档布局分析、OCR和分块处理,将文档转换成适合RAG和LLM的数据格式。支持PDF、DOC、PPT和XLS文件。该服务能够将文本、表格、图像和手写内容进行结构化处理,为人工智能和机器学习应用提供数据支持。它由Lumina AI Inc.维护,并且提供免费试用和定价方案。

  • 园丁提词器:智能AI提词器,支持语音跟读、隐形提词,提升直播体验。

    园丁提词器是一款专为直播、演讲、教学等场景设计的桌面提词器应用。它通过智能语音识别技术,实时感知用户语速,智能调节文本滚动速度,确保提词与表达同步。产品融合尖端AI技术,提供文案优化、全渠道提取文案、无水印视频下载、违禁词检测、文案配音等功能,显著提升文本创作效率。园丁提词器支持多窗口同步播放,满足多样展示需求,所有窗口均可置顶,避免遮挡,实现真正的隐形提词。产品背景信息显示,园丁提词器历经万场直播考验,稳定耐用,团队持续创新,稳定迭代,提供卓越服务。

今日大家都在搜的词: