我们和网易互娱AI Lab的小伙伴聊了聊,AI如何赋能游戏

作者:李小歪 界面 2021-01-14
图源:ledgerinsights

这几年,不管高屋建瓴的学术圈,还是产业前线的互联网,各路机构和大厂都在下场做AI,就发展程度而言,AI已经是全面渗透的姿态了。

我持续关注AI发展趋势和使用场景有一段时间了。这几年,自动驾驶、人脸识别、脑机接口,越来越花里胡哨的词儿都或多或少地和AI开始沾边。

这直接引发了大众领域内的观点站队。保守派大喊着「机器拥有自己的思想很可怕」,技术极客大多是「我们要拥抱AI」的开放姿态,但问题是,AI到底能用在哪些领域,怎么用,只有内行人清楚。

以目前的发展阶段来看,AI技术对人类的助益远远大过担忧。更何况,万事没有绝对的非黑即白,AI这事儿也不是一句两句能说清楚的。我们争论这些,不如看一看技术目前已经落下的场景,能给产业带来的实际赋能在哪里。

我会从大家比较熟悉的游戏等泛文娱领域展开讲讲。

为什么突破点在AI


说一个观点。

我认为游戏行业竞争的下一个突破点,可能在于各家的AI技术水平。

来看一个整体脉络。

根据中国音数协游戏工委最新的游戏产业报告,整个行业的规模肯定在扩大,但从2017年-2020年报告也能看出另一个趋势:随着人口红利见顶,用户规模增长放缓,游戏市场扩张的同时,竞争也越发激烈。

这种激烈竞争在2018年版号收窄之后更加明显,监管层面也希望通过数量的减少去促成质量的提升和品质的创新。这背后,是大量未被满足的游戏玩家的需求。

伽马数据等多方报告指出,游戏感受、玩法创新和社交是大多玩家最注重的游戏体验,再往下拆分就是画面、音乐、公平性、竞技感、游戏协作等具体层面的需求。而诸如AI等技术层面的突破,无疑会改善玩家的这些体验,加速游戏行业的换挡升级。

从玩家角度来说,丰富的竞技感是重要因素。Steam上线《全境封锁》时,不同风格的NPC就点燃了玩家。胆小的NPC见了你知道绕路,胆大的就开始猛攻,这就是新型AI利用强化学习技术优化出来的多样玩法。它更接近一个真实的游戏环境,体验更类似你遭遇到风格不同的三维世界玩家。

竞技感之外,相对公平有序的游戏环境也是需要的,多少FPS玩家内心的痛就在于,眼睁睁地看着对手外挂还无能能力。早年CS反恐精英不知道伤了多少人的心。这一点如今的AI技术其实能较好地消化解决,多重维度的匹配和反外挂监测已经在路上了。

继续深入讨论,如果你打开一款游戏,第一眼看到的画面、听到的声音也是决定你是否会成为潜在玩家的理由。音画已经成为绝对不能忽视的因素。

这是AI技术能够大显身手的地方,在游戏设计和开发中,AI的降本增效效果明显。

举个例子。对游戏里的美术同学来说,通过各种形式的生成-对抗网络模型,AI能直接生成高质量的角色原画、场景原画,甚至三维动作资源。作为制作者,美术同学大概最明白AI减少了多少工作量,还提升了画面质量,增加了玩家沉浸感。

产学研一体,全链路赋能


了解了AI对于游戏行业的破局程度,自然也能理解深入游戏领域的公司们对AI的重视了。

就拿网易来说,其互动娱乐事业群早在2017年就成立了网易互娱AI Lab,收拢的人才基本上都来自于清北浙复交等名校。

一个比较明显的趋势是,如今巨头们入局AI,产学研三者有了更深层的渗透。这也是互联网行业的妙处,它们本身走在前沿,对科技边缘的拓展也跑得最快。

以网易互娱AI Lab为例,这几年,七十多位算法和工程人员在顶会上发表了多篇重磅论文。

还是从大家比较好理解的音画这个角度举个例子,比如去年7月网易互娱AI Lab 获得全球最大的语音会议 INTERSPEECH 2020 声纹识别赛道双料第一。在这次比赛中,网易互娱AI Lab提出了一种 ASR-free 的文本相关声纹识别算法。相比传统的识别方法,该算法不需要依赖语音识别, 也能在多语言环境下,同时完成说话人和文本内容的验证。

而声纹识别技术在游戏中,主要可用于进行游戏身份验证或完善用户画像等方面。从实用场景来说,以往该技术多用于安防场景,网易互娱 AI Lab 能够将其嵌入游戏场景,本身就是突破。

实际上,更多AI技术的落地是围绕游戏的运营痛点来打通的。这就促成AI技术在游戏生命周期的全链路上的贯通和覆盖。目前,在包括策划、动作、美术、音频、程序、测试、营销和运营的环节,网易的AI技术正在全面赋能。

让子弹先飞会儿


一个共同的走向是,巨头们在AI上的发力并不是仅仅为了游戏,而是不断思考更广泛实用的商业场景,以及游戏业务可能与之产生的化学反应。

这几年大众触点较多的AI使用场景就是自动驾驶,在实际的场景测试里,自动驾驶公司很难创造或者遇到极限场景,比如暴雨+冰雹的复杂路况,或者高速公路上闯入的动物及行人这种突发事件。这往往会造成测试数据的局限。

然而在游戏世界,利用AI技术的测试数据获取成本就相对较低。而模拟场景中的无限撞车,或持续过弯,都能在AI的短时多次测试中得到一个相对可行的解决路径。

在赛博朋克的时代,AI技术在产业端的落地只是时间早晚问题,技术深度是目前要突破的方向。先前我提到的来自大众认知层面最大的争议点,实际在AI是否能取代人上。

在科学技术螺旋上升的前期阶段,这种讨论其实会牵绊住前进的步伐,不如让子弹飞一会儿,看以后的发展,道德伦理与法律法规必然是伴随技术的进步随之发展的。

我这里倒是会用网易互娱AI Lab虚拟偶像制作的相关技术来解释一下我自己的观点,为什么我会认为目前AI之益远大于弊。

2021年跨年之际,数字人「万一」登上了浙江卫视的跨年晚会,其生动的面部表情是由网易互娱AI Lab的AIxFace面部动捕技术打造的。这种配置首先就为具备即时性、现场感的直播晚会增强了科技感,其次虚拟人的神态高度真人化也让互动更为有趣。

依靠AIxFace面部动捕技术,女孩的眼神、唇动、眉毛、甚至法令纹等变化都细致入微,在交谈和说话时,她发出的每一个字也能精准匹配口型。

而网易互娱AI Lab开发的这种轻量级面部动捕系统,与传统面部动捕技术的最大区别在于,不需要复杂专业的动作捕捉场地和设备,也不需要设置任何面部标记点,只需要一个单目摄像头,就可以实时将演员的面部表情迁移到可以脸上,并实现舌头、视线、口型等表情细节变化的精准跟踪。

表情的丰富、自然和准确程度,自然是数字人在互动真实感上的直接体现。此外,虚拟偶像是否像真人爱豆那样兼具唱跳能力,也是评判其真实感的重要标准之一。

在此之前,AxFace技术已经在《第五人格》Bilibili秃秃杯游戏决赛的侦探主播中落地,即时的互动、极具情绪感染力,让虚拟偶像挣脱了虚拟的限制,真正实现了「次元壁的突破」。

事实上,游戏AI和非游戏AI的技术核心是一致的,只是数据、应用场景和优化目标不同。两者的互相赋能、协同发展是一致的。

在未来,人类和游戏的交互会呈现愈加多元化的趋势。可以遇见的是,未来的人机交互并不是一个单一的技术驱动,而会是一个综合方案,它或许能够让电脑像真人一样通过眼球追踪、语音分析和肢体语言去理解玩家的意图。

当然,这不止取决于AI技术的进步,也取决于游戏设备和游戏产品本身的演进。而这两者,会更深刻地丰富人类的游戏体验和快乐感受。



以下是吴怼怼工作室与网易互娱AI Lab的独家对话内容节选,对话内容有删减。

1、网易互娱AI Lab目前的规模和人员如何?研究重点和方向是什么?
网易互娱AI Lab:我们在杭州、广州和上海三地总共有七十多位算法和工程人员,从降低游戏开发成本、提升游戏开发效率、降低游戏获客成本、提升游戏用户留存、改善玩家游戏体验等方面入手,重点围绕计算机图形学中的AI、语音技术,自然语言处理、图像处理和强化学习等技术方向开展工作。目前部分技术已应用于《梦幻西游》、《一梦江湖》和《第五人格》等多款热门游戏。

2、除了AI对话、智能捏脸、智能蒙皮等比较前沿的技术外,还会看好哪些AI技术在游戏中的落地?
网易互娱AI Lab:从目前的技术落地和上线情况可以看到,自动化内容生产相关的技术(如我们的AIxFace面部动捕、AIxPose视频动捕、AIxDance音乐舞蹈合成和语音合成等技术)、精细化运营相关的技术(AI用户智能标签匹配),和为了提升用户体验的强化学习等AI技术在游戏中落地价值更大,也更加受到游戏工作室重视。

随着玩家对游戏品质的逐渐提升,游戏的制作成本上升明显,为了降低和控制成本,自动化生产工具越来越重要。其中角色的面部模型、面部动画和身体动画的制作成本比重最大。为此网易互娱AI Lab开发了针对面部动画自动化生产的AIxFace面部动捕技术方案,和针对身体动画的AIxPose视频动捕技术方案以及AIxDance音乐舞蹈合成技术。

3、之前AI周期已经覆盖到整个游戏周期的全链路,具体覆盖哪些环节,具体如何实现?
网易互娱AI Lab:在策划上,AI能够丰富玩法。例如,AI捏脸让玩家在捏脸环节能够拥有更多自由度,轻松创造千人千面的游戏世界;借助文本生成,游戏可以在新春等节日推出符合传统文化习俗的对联玩法;借助面部动捕技术,游戏可以添加颜艺系统,玩家能在游戏中DIY角色表情包。另一方面,其也作为生产效率工具,帮助策划自动完成一些传统需要人手动做的重复性工作,比如音游中的谱面生成,或者关卡配置中的平衡性验证。

除了画面,在音频上,AI音频管理系统将海量音频可视化呈现,做到自动识别并推荐声音。语音合成技术可用于游戏前期语音资源的生成及辅助调试。借助音色迁移,当游戏中某些角色语音台词需要变动时,无需同个声优再次配音,加快音频迭代速度。

游戏开发出来之后,就是测试环节。AI自动化测试可以实现测试人力的解放,提升游戏平衡性,给玩家更好体验。AI一小时的战斗数量是和投入的服务器资源以及游戏类型相关的,比如我们现在正在制作的卡牌游戏,单组服务器的采样速度为14w局/小时,相当于一个真人日夜不休地测试约500天。

在后续运营层面,AI可以帮助实现精细化运营。通过AI用户标签匹配,玩家能够匹配到与自身实力相当的对手、获得更符合需求的推荐;通过AIxGuardian游戏环境净化系统,无需大量人力审核就能够建立更加友好清洁的游戏环境,保障玩家的游戏体验。

4、我们也注意到营销环节有一些UGC内容的产出和实现?
网易互娱AI Lab:是的,在营销环节AI能够加速创意内容生成,同时也可以帮助实现更多维度的互动玩法。例如,通过AIxDance音乐生成舞蹈动作等技术,角色NPC可以快速生成贴合短视频平台热点的舞蹈动作;时下热门的H5换脸、声音互动、文本生成玩法等也都可借助AI得以实现。

5、网易的游戏画面精细程度一直蛮受认可的,尤其是动画。AI在这块可以有什么赋能?
网易互娱AI Lab:AI能够提升动画的制作效率,帮助实现美术减负。已经提过的,传统动捕流程或手K生成的表情或动作动画,如今通过AIxFace轻量级面部动捕和AIxPose视频动捕技术,无需宽敞的空间或专业技术人员,只需要一个普通摄像头就几乎可以做到表情动作动画的实时生成,而耗时耗力的NPC建模过程也可以通过3D人头重建或风格化模型生成得以改变,只需一张照片,AI就可以实时生成超写实的3D人头或符合游戏风格的脸模。

比如在PGC场景下,美术可以基于需求对AIxPose的结果进行和传统美术生产流程一样的调整,但相比按传统流程,动画制作效率可以提升4-5倍,节省7-8成的成本。

6、目前在游戏中已经成熟使用的AI技术,如果拓宽到非游戏的实用领域,还有哪些商业化场景?
网易互娱AI Lab:就拿游戏AI中的计算机图形学技术来说,它也可以应用于文娱、会展、教育、金融等各领域。像前面提到的面部动捕技术、视频动捕技术和其他虚拟偶像制作相关的技术,它和会展中的虚拟导航员、在线教育中的卡通老师形象、金融领域的虚拟客服角色等背后的技术本质其实差别不大。

而游戏AI中的语音识别、语音控制、语音合成等技术,也可用于搜索、导航、教育/英语口语的自动评分,以及文娱、会展等领域的智能交互场景。

游戏AI中使用的视觉技术也可以应用于其他非游戏领域,如在游戏中为防沉迷开发的人脸识别技术,和为净化游戏环境开发的政治、色情和暴力监控技术,应用至其他领域分别可以是安防领域的人脸识别,以及电商平台的政治、色情和暴力监控等。

7、之前叶明江也提过,「AI在游戏领域最著名的事件就是在游戏中击败人类职业玩家」,像这个AlphaGo打败人类的事件有意义吗?有一种观点是,游戏就应该为人类创造美好的体验,如果AI都赢过了人类,那我们还玩游戏干嘛呢?对这个观点怎么看?
网易互娱AI Lab:AlphaGo的实现对于游戏,特别是游戏AI的发展有重要意义。首先AlphaGo的实现让游戏公司/游戏工作室认识到AI可以达到人类顶级水平,可以做到很多以前不敢考虑的事情。

在AlphaGo事件后,游戏公司给与了AI更大的投入和耐心,同时也开始在各游戏环节考虑引入AI技术。

其次,AlphaGo的成功给AI研发者注入了一支强心剂,有更多的AI研究者会投入到游戏AI领域。

最后,我们相信AlphaGo的技术不仅仅可以用于游戏,未来可以用于很多其他的领域,比如智能机器人,技术的进步总能带来新的生产力。

游戏AI的目的是为人类创造更好的游戏体验,这是游戏AI不变的追求。我们认为AI赢过玩家不会阻碍,反而会激发玩家更大的兴趣。

首先,一个竞技感不强的AI缺乏挑战性,难以让玩家体验到游戏的乐趣。更高段位的“玩家”对抗,是激发玩家兴趣的一个重要因素。好的游戏AI可以成为不同水平玩家的对手。

其次,能做出职业选手水平的AI,让陪玩型AI的实现也更简单。我们可以用很多种不同的方式去降低AI的强度,创造出低强度但是多样性的陪玩AI,从而通过更好的冷启动、玩家陪玩、智能辅助等方式提升玩家游戏体验。

最后,AI可以发现/探索出一些顶尖玩家也未发现的操作和玩法,成为职业选手们的辅助或者陪练。

作者:李小歪
来源:界面
地址:https://www.jiemian.com/article/5537551.html

最新评论
暂无评论
参与评论

商务合作 查看更多

编辑推荐 查看更多