넥슨이 주최하는 국내 최대 규모의 게임 개발자 콘퍼런스 ‘넥슨 개발자 콘퍼런스(NDC)’가 오늘(25일) 2일 차를 맞았다.

이날 현장에서는 ‘38만년을 1주로? - AI를 활용한 캐릭터 밸런스 디자인’을 주제로 넥슨의 한재민 개발자의 발표 세션이 진행됐다.
한재민 개발자는 2022년 소프트 런칭을 진행했던 수집형 RPG ‘아르젠트 트와일라잇’의 밸런싱 파트를 맡은 자신의 경험과 AI를 통한 밸런스 모델의 제작 과정 및 결과에 대한 본인의 소감을 자세히 소개했다.

먼저 한재민 개발자는 수집형 RPG에서 매력적인 캐릭터는 외형, 콘셉트 등의 외적 영역과 능력치, 전투 효율성 등 게임 내 능력치를 보유하고 있는 것이 특징으로, 수집형 RPG는 이 매력적인 캐릭터가 어떻게 조합되어 시너지를 내고, 밸런스를 유지하는지가 중요하다고 설명했다.
밸런스를 잡는 가장 좋은 방법은 캐릭터 조합을 테스트해 보는 것이지만, 이를 모두 테스트하기에는 시간이 오래 걸린다.
실제로 게임 내 300종 캐릭터를 5종의 조합으로 계산했을 때 예상되는 경우의 수는 무려 200억 개. 1분씩만 플레이해도 38만 년에 달하는 시간이 걸린다. 사실상 사람이 테스트하는 것은 불가능하다는 것이다.

이에 한재민 개발자는 이 밸런스 테스트에 총 3단계로 나누어 AI를 도입했다. 먼저 캐릭터의 정보와 조합, 장비 등을 정리하고, AI 모델이 이해할 수 있도록 데이터를 정규화했으며, 같은 입력을 주면 같은 결과로 나올 수 있도록 전투 로직을 설계했다.
하지만 이 방식도 평균 50턴을 기준으로 420시간에 달할 정도로 시간이 상당히 소요 됐다. 이에 한재민 개발자는 속도 증가를 위해 여러 대의 AI 머신이 동시에 계산하는 병렬 처리 형태로 시간을 20배 단축. 모든 조합 테스트를 4년 9개월로 단축하는 단계로 돌입한다.

한재민 개발자는 테스트 결과 모든 조합 검증은 사실상 불가능하다는 결론을 내렸다. 이에 더욱 효과적으로 밸런스를 테스트하기 위해 모든 캐릭터를 같은 조건으로 프리셋으로 구분하여 표준화하고, 쓸모없는 데이터를 걸러내는 덱 스크리닝 작업을 진행했다. 여기에 이 결과를 AI 모델이 학습하여 데이터를 고도화는 후속 작업까지 병행해 1주일로 기간을 단축했다.

그렇다면 이 AI 데이터는 어떻게 분석해야 할까? 한재민 디렉터는 참여 횟수, 승률, 클리어타임, 기여도 등의 정보를 합산하여 메타 스코어 형태로 점수를 매겼고, 지표별 순위를 캐릭터의 성과를 비교하는 상대평가로 계산하여 전체 캐릭터의 메타 스코어를 계산해냈다고 설명했다.
이렇게 나온 캐릭터별 메타 스코어는 정확했을까? 한재민 디렉터는 ‘아르젠트 트와일라잇’에 이 데이터를 기반으로 버전 별 밸런스 검중과 이상 밸런스 탐지 등에 사용할 결과 성능 조합이 너무 좋거나, 티어에 비해 성능이 낮은 캐릭터를 구분하여 개선 방향을 지시할 수 있었다고 설명했다. 심지어 메타 스코어가 너무 높게 나와 확인해 보니 계수 값을 잘못 입력한 것도 확인할 수 있을 정도였다.
한재민 개발자는 이처럼 AI 모델을 밸런스 조절에 사용할 수 있었지만, 가장 중요한 것은 AI 모델을 설계하는 것보다 개발자 스스로가 게임의 전문가가 되는 것이 가장 중요한 것이라고 강조했다.

AI가 분석한 데이터를 실제로 적용할지 결정하는 것은 사람이기에 아무리 데이터를 잘 뽑아도 해석이 틀리면 무의미하며, 게임에 대한 높은 이해도를 기반으로 데이터에 접근해야 한다는 것이 한재민 개발자의 설명이다.
실제로 한재민 개발자는 밸런스 파트를 맡은 이후 게임의 이해도를 높이고자 노력하여 100명이 참여한 사내 테스트에서 1등을 기록한 적도 있다.
마지막으로 한재민 개발자는 “기획자는 게임에 대해 누구보다 게임을 잘 알고 있어야 하며, 가설을 제시할 수 있어야 한다. 밸런스의 목적은 모든 캐릭터가 같은 성능을 내는 것이 아니며, OP 캐릭터로 소유욕을 불러일으키는 것도 좋은 방법”이라며, “지속 가능성과 즉각적인 체감의 균형을 고려하고, 의도와 목적을 가지면서 AI 모델을 적용하는 것이 현명한 방법이다”라고 전하며 강의를 마쳤다.