首页 > 传媒 > 关键词  > 手游最新资讯  > 正文

网易伏羲受邀出席「2024骁龙游戏技术赏」,分享游戏AI技术实践

2024-07-26 15:51 · 稿源: 站长之家用户

7月25日,备受期待的《永劫无间手游正式开启公测,该手游预下载阶段便荣登App Store免费总榜TOP1!游戏中全新引入的语音AI队友功能,迅速吸引了广大玩家的关注和好评。

这一创新玩法由网易24工作室联合网易伏羲AI实验室共同研发,作为全球首 款游戏Co pilot队友,该功能依托于最前沿的AI大模型推理技术,成功塑造了与真人玩家体验相媲美的AI队友。AI队友不仅能够自主执行跑图、搜索物资、参与战斗、跑圈等战术动作,更能在战斗中提供辅助和救援,通过自然语音与玩家进行双向无缝沟通。

《永劫无间》手游上线当日,网易伏羲AI技术负责人睿风应邀在「2024骁龙游戏技术赏」上发表演讲,首 次公开分享《永劫无间》手游中语音AI队友的技术探索和应用成果。该活动为高通公司循例在ChinaJoy前夕举办的年度盛会,今年,高通公司携手网易伏羲等产业合作伙伴,共同探讨移动技术创新如何赋能前沿数字娱乐体验。

因演讲当日恰逢《永劫无间》手游公测上线,睿风无法到达现场,所以通过连线方式进行分享。以下是他的演讲实录:

大家好,我是来自网易伏羲的睿风,很高兴能够参加「骁龙游戏技术赏」。

(网易伏羲AI技术负责人睿风现场连线分享画面)

网易伏羲成立于2017年9月份,是国内第 一个面向游戏行业进行AI研究的人工智能实验室,我们以“创建人工智能与游戏交叉领域的世界知名实验室”为宗旨,运用人工智能尖 端技术为玩家营造新世代的游戏体验,同时也借助游戏平台的海量数据和仿真环境,推动人工智能技术的发展。

自2017年成立至今,网易伏羲已经在多款游戏中落地大量的AI玩法。例如我们在《逆水寒》端游中首创AI照片捏脸玩法和智能养育系统,在《永劫无间》端游中,我们上线了基于强化学习技术的噩梦人机玩法,利用AI反外挂技术定位和处罚违规玩家确保公平游戏环境。去年我们在现象级游戏《逆水寒》手游中落地了大量创新的AI应用,包括智能NPC、文字捏脸、大宋头条、UGC剧组模式等等,打造了全球首 款AI游戏,也获得了玩家们的高度认可和欢迎。

今年,我们在今天正式上线的《永劫无间》手游中,率先发布了全球首创的语音AI队友玩法。在这个玩法中,玩家可以邀请智能AI队友进行一场完整的游戏体验。玩家可以通过语音交互的方式,直接跟AI进行交流。这个AI队友首先能听懂指挥,搜装送装、团战配合样样精通;其次能实时观察战况,汇报关键信息并答疑解惑;此外AI队友还具备强大的战斗能力,博弈强、配合好;最后该AI队友还能自由交流,给予玩家较高的情绪价值。

为了能实现这个能听、能说还能做的AI队友,网易伏羲基于多年的技术积累,结合语音识别、语义理解、文本生成、语音合成、强化学习、模仿学习等多项AI技术,解决了大量的技术难题。为了实现跟真人队友几乎无异的语音交互体验,我们给这个玩法设定了几个技术指标。

首先相比于唤醒词或手动按钮触发的交互方式,全开麦的实时语音交互对我们提出了更多的技术挑战,其中最核心的就是噪音检测和非交互内容识别的能力,为了尽可能降低误触率,我们使用网易伏羲的有灵众包平台,在开发期就采用自动数据闭环方式,通过持续采集各种机型和项目成员们的真实体验数据,不断优化模型效果。

其次,为了让AI能够比较准确识别玩家指令并做出最合理的行为决策,我们不仅引入了自然语言理解技术来提升指令识别能力,而且采用了基于指令的强化学习技术,让模型能够根据指令和实时的战场状态,做出最合理的行为决策,实现了尽可能遵循玩家指令的基础上,又保持较高强度的游戏能力。

最后,为了达到极低的交互体验速度,我们做了大量的工程优化工作。当前线上的实时响应时长最短可以实现300ms内的语音和行为响应,最长响应时长也能控制1s左右,从而实现了让交流不延迟,让配合更及时。

正如前面提到的,这个语音AI队友玩法对于时延非常敏感,为了给用户带来更极 致的交互体验,伏羲跟高通进行了深入合作,将部分AI推理从云端GPU迁移到第三代骁龙8移动平台的NPU上。

为什么我们要去做端侧推理?首先就是低时延,相比于基于云的推理,端侧推理可以节省网络传输带来的时间延迟,特别是对于一些网络条件不太好的地区的玩家,这部分的时延降低带来的收益是非常可观的,从而给这部分玩家带来更好的游戏体验。其次从公司层面来说,AI推理从云端迁移到端侧,可以充分利用玩家的终端算力,降低服务运行成本。我们知道目前云端的GPU服务都是比较贵的,为了控制成本,很多AI服务都会对应用做一些使用限制或让玩家采用付费使用的方式,而端侧推理可以让这部分玩家自由地体验AI玩法。

当前在《永劫无间》手游的AI队友玩法中,网易伏羲跟高通已经迁移了部分AI能力到端侧,目前正在做更多深入合作。我们期望未来可以将更多AI能力,包括大语言模型(LLM),语音合成(TTS)等技术适配到手机终端,给玩家们带来更好的游戏体验。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 新华网×赛迪网双重肯定:销售易AI CRM入选“AI中国”生态范式集

    销售易AI+CRM产品NeoAgent凭借卓越的AI技术应用与业务实践,入选《“AI中国”生态范式集(2025)》和《“AI中国”生态图谱(2025)》,获得“AI中国”双项核心认定。这标志着中国CRM行业在响应国家人工智能发展战略、以智能化工具赋能企业形成新质生产力方面迈出坚实一步。销售易已连续九年入选Gartner SFA魔力象限,并获得高度评价。未来,销售易将持续深化与腾讯的战略协同,基于国产化技术底座,将“智能”与“连接”能力注入企业运营的每一个环节,推动中国CRM产业高质量发展,为壮大数字经济贡献力量。

  • 网易云音乐旗下“网易天音”上线测试“AI写歌”功能

    网易云音乐旗下“网易天音”推出“AI写歌”功能,开启线上测试。该功能旨在通过人工智能技术降低音乐创作门槛,让更多人轻松参与创作。用户只需在移动端首页输入灵感词句,即可智能生成完整歌曲,操作简便。目前提供“普通创作”和“高级创作”两种模式:前者根据关键词快速生成歌曲;后者支持自定义曲风、歌词及歌名,满足个性化需求。功能目前处于测试阶段,主要面向音乐爱好者及深度用户开放。

  • 2025,中国首份AI CRM的“标准”:销售易凭什么执笔?

    2025年9月,中国信通院与销售易联合发布《智能驱动增长:人工智能客户关系管理系统研究报告》,并启动相关标准编制。这标志着中国AI+CRM领域标准制定权从“政府授予”转向“市场博弈”。销售易凭借其AI原生技术路线、服务5000+大型企业的实践经验,以及作为唯一深度参与标准核心起草的CRM厂商身份,成为产业规则制定者。这不仅提升了其品牌高度和生态位势,更意味着�

  • 阻止互联网广告下滑,全靠AI?

    AI如何提高效率的表达,是当下大厂对外叙事的标准模板。可能会在某些具体业务层面,给出一些数据反馈,但是大部分时候,这仍然是一种模糊状态。 直到今年Q3 财报发布,我们终于在部分互联网公司的财报披露中,找到一些可量化的指标,而且主要集中在广告和营销。 比如,百度和快手明确列出「AI广告」或「AI营销」对应的收入:百度AI原生营销服务收入达28亿元,同比�

  • 智能家居新宠:2025最新语音AI智能浴霸,这些品牌提升沐浴幸福感!

    2025年智能浴霸已从单一取暖设备升级为“浴室管家”,通过语音指令即可自动调节灯光、暖风、水温及换气除菌,实现“人感即开、人走即关”的智能体验。文章基于专业实力、技术创新、研发制造、健康体验四大维度评选出TOP5品牌:奥普凭借热能环专利技术、双氧水除菌等核心科技位列第一;欧普、松下、美的、小米米家分别以速热除菌、纤薄设计、智能恒温等功能入选。

  • 逗哥配音引领解说潮流:ai分角与声音转换技术重塑创作流程

    逗哥配音平台推出AI智能分角与声音转换两大核心技术,显著提升多角色内容创作效率。AI分角功能基于深度语义理解,自动识别对话中的角色切换与情感变化,将制作效率提升70%。声音转换技术实现跨语言音色转换,保持原始录音的情感与节奏,并与平台“臻品达人”声库深度融合,拓展创作边界。平台正从工具提供者向创作赋能者升级,构建智能化声音创作生态系统。

  • 李楠:豆包手机是今年技术最激进的AI设备

    怒喵科技创始人李楠发文表示,豆包手机是今年技术上最激进的AI设备。 自从豆包手机上架以来,市场给予了近乎狂热的反馈,该机定价是3499元,一经上市便被抢购一空,二手平台炒至8000元以上,这款AI设备由字节跳动旗下的豆包团队和努比亚联合打造。 你只需发出语音指令,豆包手机上的AI助手就能自动在屏幕上点击、滑动,跨越App的边界,完成点外卖、比价等一系列操�

  • AI日报:AI动画神器Seko 2.0上线;超强语音模型Qwen3-TTS发布;2025 年度字词候选公布

    本文介绍了近期AI领域多项重要进展:阿里发布Qwen3-TTS语音合成模型,支持49种音色和10种语言;推出全模态大模型Qwen3-Omni-Flash,支持实时流式交互。谷歌上线Gemini TTS 2.5,具备情绪化表达和多语言支持。商汤科技推出Seko 2.0,可一句话生成百集连贯动画。此外,DeepSeek入选年度汉字候选,Adobe与ChatGPT合作推出图像与PDF编辑功能,腾讯元宝AI推出QQ群消息总结功能,以及ChatGPT登顶美国苹果应用商店免费榜。这些进展展示了AI技术在语音、多模态、内容生成及日常应用方面的快速发展与普及。

  • 《暮光双龙》定档1月,娱美德自研新作开启公测预约

    娱美德公司12月16日宣布,由旗下中国海南研发中心开发的传奇IP正版授权产品《暮光双龙》已开启公测预约,计划于2026年1月正式上线。该作是继《热血传奇》后时隔二十余年重磅回归的传奇IP正版产品,标志着该IP在中国市场进入新发展阶段。游戏基于虚幻引擎技术,对经典玩法进行了全方位重塑,并针对中国玩家习惯优化了社交系统与操作节奏。此次推出展现了娱美德深耕中国市场、推进本地化战略的决心,旨在为玩家提供高品质的正统选择,并推动传奇IP市场向规范化、精品化转型。

  • 可灵2.6模型上线!语音、音效与画面一键直出 重构AI视频创作工作流

    可灵视频生成2.6模型推出“音画同出”功能,彻底改变了传统AI视频“先无声画面、后人工配音”的工作流程。它能在单次生成中,输出包含自然语言、动作音效及环境氛围的完整视频,重构了AI视频创作工作流,极大提升创作效率。该模型在中文语音生成效果上保持全球领先,支持生成最长10秒的视频,可广泛应用于广告营销、自媒体、电商等内容创作场景。

今日大家都在搜的词: