AI游戏开发者GDC“诉苦”:玩家来了2000万、游戏太成功“上线即破产”!

【GameLook专稿,未经授权不得转载!】

GameLook报道/如果问任何一名游戏开发者,“你希望自己的游戏玩家数是多少?”相信绝大多数人给出的答案都是:多多益善。然而,这对于AI游戏小团队而言,骤增的用户量可能不只是惊喜,还会带来惊吓,甚至直接导致公司破产。

随着技术的进步,AI在游戏业的影响力越来越大,从聊天机器人、美术资产生成器,到智能NPC的制作,AI能做的事情越来越多,甚至出现了由AI研发的游戏。

《Death by AI》截图

在为数不多的成功AI游戏当中,最为值得关注的就是Little Umbrella的《Death by AI》,这款游戏在3个月内就吸引了2000万玩家;另一款则是Wishiroll团队研发的《Status》,该游戏两周内游戏用户量就突破了100万,DAU达到50万之多!

那么,用AI做游戏容易吗?答案显然是否定的。

在GDC 2025大会上,Little Umbrella联合创始人兼技术总监Tabish Ahmed、Wishiroll创始人Fai Nur,以及AI技术平台Inworld AI联合创始人兼CEO Kylan Gibbs分享时表示,如今的AI大模型绝大部分都不是专门为游戏打造的,虽然能够在特定领域提升研发效率、降低资产制作成本,但如果要做一款AI驱动的游戏,常常会面临高时延、高成本和低可靠性等“致命”问题。

Tabish Ahmed指出,《Death by AI》测试期间仅一周就花掉了4万美元,而Fai Nur更是坦言,按照测试期的AI费用,她的游戏规模化之后,可能上线两天就会导致公司破产。这就会导致一个非常怪的现象:为了节约成本,开发商不得不“拒绝”新玩家。

那么,用AI做游戏当前都面临哪些“陷阱”、想要尝试用AI做游戏的小团队又该怎么解决呢?

请看Gamelook整理的演讲内容:

陷阱一:大模型昂贵,玩家增长会让游戏上线即破产

Tabish Ahmed在GDC 2025分享时透露,游戏发布的时候,团队从未想过它能取得如此巨大的成功。《Death by AI》在不到3个月的时间里就斩获了2000万玩家,过去半年内依然有1500万玩家。

只不过,成功带来的可不全是喜悦,同样给工作室的成本,以及游戏运营带来了巨大挑战,甚至“不得不限制用户增长,也就是拒绝新玩家加入”。

Ahmed表示,在游戏刚发布的时候,AI模型的使用费很贵,尽管最初只使用了非常基础的东西,但该游戏首周的AI成本就接近4万美元,每天都处理20亿Token。为了控制成本,团队几乎尝试了市面上的所有模型。

《Status》截图

《Status》也遇到了同样的问题。Fai表示,该游戏一个月内就达到了50万DAU,两周就斩获百万用户量,还形成了20万用户的Discord社区,玩家平均游戏时间达到一天半,实际上比很多真正的社交媒体使用时长还高,且用户大部分都是年轻女生。

她在分享团队测试经历的时候说,“我们在测试期的时候,有几百人使用,我们当时也在用很昂贵的模型,是ChatGPT 3.5,这个模型很不错,但如果不改变,我们永远也发布不了游戏,因为这么用下去,一旦用户增加,我们上线两天就得破产。”

可能会有人问,每一个模型都有确定的标价,为什么游戏用起来就这么贵呢?

Inworld AI联合创始人兼CEO Kylan Gibbs指出,目前市面上所有的大模型,都是为了通用场景设计,并非为游戏而设计的。

“AI如今更适合做高价值、低容量(low volume)任务,比如企业场景,你要做法律审核、营销内容生成,AI做的很好。如果10美元一天,这还可以,因为请一名专业律师很贵。所以,如果你可以节省10%的请律师审核的时间,那就相当于数百万美元。”

但是,当玩家与AI互动的时候,他们的互动次数是数千次,在一个模型上每分钟都有数千次调用,这是非常不同的应用场景,是有根本差距的。

Gibbs甚至提到,我们对人类级别的智能是有偏见的,作为开发者,所有人都知道游戏里根本不需要人类级的智能。哪怕是大多数玩家都觉得,这个真实模拟的世界感觉很鲜活,但每个开发者都知道,游戏并没有那么做,因为有LOD系统、有很多东西可以做到这个效果。

他开玩笑说,如果用户的互动方式和使用频率相当,苹果公司甚至都跑不起Siri。

“一个消费者应用和一款游戏,规模化有很大的差别。如单个体验可能每秒3000次请求,每分钟5亿、10亿Token,这远远超过了AI领域的任何其他运用,哪怕是在ChatGPT当中这么做都很难。如果是50万DAU、数百万DAU,每秒钟数千次请求,这与企业级AI的应用是完全不同的,按照这个成本,苹果连Siri都跑不起。”

陷阱二:什么都想自己干,可玩家并不在意用什么模型

Ahmed表示,用AI做游戏最忌讳的就是什么都想内部实现,尤其是对于小团队而言。他指出,模型的迭代更新太快了,未来使用模型的价格会更便宜,不要在这上面给自己制造挑战, 不如让做模型的公司去解决。

他坦言,“我说一句可能不讨喜的话,包括我们的技术团队也在这里,很多人都想要一切都内部做,要控制一切的技术堆栈,从模型到剧情再到游戏体验,可我们只有5个人!作为开发者,我们可能有能力去做这一切,但是,我们在训练自己模型的时候,下个月可能就有新模型出来,比我们的还好,这时候怎么办?整个模型就浪费了,我们本可以把时间用来将游戏体验做到更好。你不必控制游戏的一切,你只需要做一个人们想玩的游戏就好了。”

Kylan Gibbs指出,如果只是问答,那么ChatGPT这样的模型是对的答案,但应用到游戏的时候就完全不同了。

《吸血鬼幸存者》游戏截图

他甚至开玩笑说,对于Inworld AI来说,如果自己做GPU,那可能模型使用成本会大幅降低,“但这需要多久?可能要20年,投入至少1000亿美元,而且做出来的时候,早就有更先进的了。而且每个人对于乐趣都有不同的定义,不管是在不同游戏还是同一款游戏里。就像在玩《吸血鬼幸存者》的时候,我和我的总监Brian有着完全不同的策略,而且玩一款游戏的方式有很多种。

提到文本、对话、角色动作等内容,每一种都有玩家认为它很有趣,所以你要让AI适应用户,给他们提供不同类型的乐趣。AI训练目前就是为了在任何问题上都给你一个精准答案,但是,当我跟游戏NPC聊天的时候,却并不需要一个精准答案。”

虽然新技术很令人兴奋,但他认为,玩家并不会在意你用了什么模型,开发者需要考虑的是如何在模型之上构建一个层,在使用模型的时候将体验交付给玩家。“没有人在意你用什么模型,玩家只需要享受乐趣就行了。”

陷阱三:新模型一个月就过时,容易被套牢

Kylan Gibbs表示,每个月都有新模型出现,这也改变了消费者的预期。当ChatGPT出现的时候,所有人都很兴奋,说它很强大,但是,现在回过去用ChatGPT 3,你会发现体验很差,因为所有人现在都用新模型了。

“所以,这是云服务供应商、模型供应方的事情,他们在不断迭代模型,推动技术发展。但到了游戏中,这就成为了游戏开发者的事情,因为你的游戏要运营很久,半年后、一年后,消费者对于游戏AI有了更高的预期,你的游戏内可能会看起来过时了。”

对此,Far Nur讲述自己经历的时候说,有些模型供应商会告诉你,用他们的模型可以获得很大的流量,当你只是个小团队的时候,他们希望留住你。

“但这是没有意义的,模型现在每周都会变得更好,被锁在一个模型中是不可行的。这也是跟Inworld合作比较好的原因,他们可以帮我们找到适合我们的方案,他们知道哪些模型在用户与角色互动的时候有什么优势和问题,这给我们打开了新世界。”

Kylan Gibbs表示,这其实不只是小企业或者游戏开发者遇到的问题,Inworld在签合同的时候也会遇到,比如“使用某个模型一年”这样的条款。

“你敢想象明知道2周就可能过时的模型要用一年吗?这很愚蠢,这是硬件生态系统采用的方式。还有定价问题,这个月的价格,到下个月可能就会下降,你不可能接受固定的价格。包括3A公司也会遇到,他们签约的时候可能会写‘使用某个模型4年’。

这期间可能有几十个新模型出现,当时的模型可能早就过时了,所以这也是个挑战。所以在选择模型的时候,我们需要保持灵活性,这样才能对我们的客户保持灵活。但这需要很艰难的谈判,因为他们不想这样。”

用AI做游戏还有哪些“硬伤”?

前面提到,游戏玩家与应用的用户和AI互动的方式有很大差异,除了兴趣、偏好以及互动方式不同外,用AI做游戏还有一些硬伤是目前的技术无法解决的。

比如时延,如果一个反应循环用的时间太长,就会破坏游戏体验。特别是在玩一款FPS游戏的时候,如果你要寻求AI的帮助,可这需要2秒钟才能反映,你就被人击败了,这是绝对不能被不允许的。哪怕是比较快的模型,给出完整的回答可能也需要4秒钟,完全跟不上游戏里的速度要求。

Kylan Gibbs指出,另一个问题就是控制与观察。

“当你在使用大量的东西时,你不知道后端发生了什么,所有开发者都知道,你需要遥测、需要debug,当你做玩法测试的时候,要知道是在哪里失败的、问题在哪里?AI是个黑盒子,你可能提交一个请求,但很久都没有回馈,因为可能有数百万用户在排队。

这个问题会一直存在,因为发布一款游戏的时候,你不会想要希望它能运行,而是要确保能行得通。如果不能实时观察发生了什么,那就很容易出问题。”

还有就是数据问题。新模型总是在不断出现,开发者需要收集自己的数据,然后带到不同的模型中训练,这就会带来法律和成本方面的问题。“如果你的数据供应商、数据库或者数据结构有了问题,那么它的价值就没了。当然,拥有权之外,数据能使用也很关键,如果每次使用的代价很昂贵,那用起来就可能很不划算。”

另一个问题是体验的品质,开发者需要再成本与玩家游戏体验之间做好平衡。Ahmed指出,哪怕没有宣布该换了模型或者微调了东西,人们都会问,“你们改了什么吗?它不再有趣了”。

“其实,我们是基于玩家数据进行了训练,然后模型变小了,所以玩家得到的回应可能越来越接近,但他们的预期是每次都有不同。所以我们发现,必须以不同的方式训练数据,或者在不同的模型上训练,这也是我们在投入的事情,或许以后的模型会更便宜。”

在使用AI的时候,Ahmed表示自己团队遇到最大的挑战是让AI有记忆,以便保持AI敏锐、连贯和情景感知的个性。

“最大的挑战是保留他们的记忆。哪怕是用ChatGPT,如果对话超过20次,它可能也会忘记你最开始的提问。这对游戏也很关键,如何让AI记住玩家互动,并给出连贯的行为?还有,要保持低成本,因为我们不是一直用所有的情境。”

Nur补充称,除了记忆,AI角色使用的语音也很重要。“因为我们的用户大部分都是GenZ,切换了更便宜的模型之后,他们觉得角色语音听起来像妈妈辈在说话,所以我们需要解决这个问题。”

Inworld的解决方案:“受控的进化”

Gibbs表示,他们这样做的原因有两个:你有不同的用户,这些用户的兴趣会发生变化,你还想要适应每个的需求来提升他们的参与度;你还需要做到经济实惠。目前有很多的公司在模型领域竞争,成本是不断下降的。所以需要在特定时间里找到性价比最高的,并且未来能对其做出改善。”

换据说,就是找到适合特定功能的小模型,然后确定合适的模型组合,并根据游戏和玩家的变化不断做出改变。只不过,这种环境下,开发者就需要将任务分解成小模型能胜任的小任务,通过模块化的方式实现自己想要的体验。

例如指令,你需要将之前大长段的指令变成多个短指令,这样小模型才能更容易消化你给的信息,带来同样质量的输出。

Gibbs说,“当人们使用AI的时候,由于一些模型很强大,我们倾向于把所有事情放到一个问题中,直接让模型给5种不同类型的输出,如果是做分析报告,这种方法是很好用的。然而到游戏的时候,我们就需要细分,一个任务当中,我们需要模型做的是什么?然后评估哪个模型最适合执行某个任务。

这意味着你实际使用的模型可能没那么多,因为所有这些事情并不是并行的。所有的模型都是为了通用任务设计的,但游戏设计并不是,我们有资产数、技能树、UI等等,我们需要找到符合自己品质标准的模型,然后将这些功能、任务模块化,然后减少使用的模型量。”

与游戏开发者合作时,Inworld提供很多的在应用内构建的逻辑层,也就是其所谓的框架,还可以加入很多的遥测和观察工具,实时收集数据。

“你在做的是两件事,基于实时收集的数据,我该如何调整模型适应当时的用户?所以不一定是做什么训练。而且,你还在收集所有数据,确保用这些数据带来长线提升。

例如,我该如何调整实时拿到的5个用户偏好标签?我该如何将这个信息传递给模型,以便让它对不同用户做出不同反应?然后,有些特定的因素是我们都重视的,如何获得对不同用户的整体理解?如何选择可用的最佳模型并降低它的成本?”

开发者可以从模型评估开始,确定某个特定时刻最合适的模型是什么,测试让用户与之互动,收集测试数据。基于数据得到很多细节,然后进行评估当前的模型表现如何,随后看可用的第三方模型,是否有可能在特定任务上的表现更好,训练第一方模型的差距在哪?

“比如我们跟Little Umbrella合作中的语音模型,11 Labs的品质不错,但成本并不友好,所以我们需要训练自己的模型。与Wishiroll的合作中,主要是用户参与度问题,比如Fai提到的切换模型听起来像妈妈辈的问题。

有了这些,我们可以做到人力完不成的事情,比如我们不可能了解50万DAU每个人的偏好,但通过模型可以做到。随着时间的增长,你的用户参与度也在不断增长。所以,我们需要有一个不断进化,不断适应用户期待变化的解决方案,如果不这样做,那么很可能一款AI游戏只能持续数周或者一个月,但从来做不到存在数月或者很多年。”

如若转载,请注明出处:http://www.gamelook.com.cn/2025/05/569364/

关注微信