dev.log2013. 2. 22. 18:55

우연인지 몰라도 내가 다니는 회사마나 나한테 파일 및 리소스 로딩을 좀 손봐달라는 요구를 한다. 내가 파일을 잘 읽게 생겼나?  여튼, 언리얼 엔진에서만 두번째로 백그라운드 로딩을 만드는 일이 나한테 떨어졌다.


언리얼 리소스 로딩 시스템을 첫번째로 손봤던 것은 G사에 다닐 때의 일로, 그때는 MMORPG를 만들고 있었기 때문에, 요구사항이 그렇게 빡세지 않았다. "옆에서 캐릭터 스폰될때 막 1,2초씩 끊기지 않게 해주세요" 정도? 즉, Mutually Exclusive한 작업을 해야 할 때 그 1/10인 100ms 정도는 락을 잡고 있어도 무방하다는 뜻이고, 100ms정도면 많은 일을 할 수 있는 시간이다. 이 회사에서 언리얼 로딩 시스템을 손봄으로써 두번째 손을 대게 된 것인데, 이번 회사에서 만들고 있는 것은 FPS이고, 여기서의 요구사항은 "다른 플레이어가 난입할 때 프레임 저하가 안생기게 해주세요."였다. 이말인 즉슨, 90fps로 게임을 하는 것을 기준으로, 10ms 길이의 락도 길다는 것이다. OMG...


언리얼의 로딩 과정을 대략적으로 표현하면 이렇다.


load( name )

{

o = create( name );        // 생성

for each property in o

   read( property );         // 읽기

postload();                    // 정리

}


여기서 가장 오래 걸리는 작업은 대부분의 경우 (당연히) 읽기다. 시간에 따른 바의 길이로 표현하면 이런식.

 A생성

A읽기 

A정리 



그런데 언리얼의 리소스 패키지 관리 구조는 내가 "고구마줄기"라고 평하는 디펜던시 그래프에 기반한 구조다. 즉, 뭐 하나 로딩하려면 그놈이 의존하고 있는 것들을 따라가면서 줄줄이 로딩하는 구조다.

캐릭터를 하나 로딩한다고 치자. 당연히 캐릭터의 메쉬가 있어야 겠고, 메쉬에는 매터리얼이 붙어 있을 테고, 매터리얼에는 다수의 텍스쳐가 붙어 있고... 그뿐인가? 캐릭터 애니메이션도 불러 올라 치면 애니메이션에는 노티파이도 붙어 있고, 노티파이에서는 파티클도 뿌려대고, 사운드도 틀어주고, 파티클에는 메쉬를 뿌려주는 놈들이 있고 그 메쉬에는 또 매터리얼이 붙어있고.... 등등.

게다가 매터리얼에는 셰이더를 구성하는 매터리얼 표현식이, 애니메이션에는 각각의 애니메이션 시퀀스가, 사운드에는 개별 사운드 노드가 일일이 다 별개의 객체로 들어 있기 때문에 뭐 하나 로딩할라 치면 백여개의 서브 오브젝트가 생성되고, 로딩되어야 하는 실정.


그러니까, 이 고구마 줄기를 위의 슈도 코드에 반영하면, 이렇게 된다.


load( name )

{

o = create( name );

for each property in o

   read( property );

   if ( property is a object )

        load( property.name );

postload();

}


재귀적 구조 때문에 실제 타임라인은 이렇게 된다.

 A생성

A읽기 

A중단 

.... 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 B생성

B읽기 

B중단 

.... 

.... 

 B읽기

 B중단

.... 

 

 

 

 

.... 

 B읽기

 

 

 

 

C생성

C읽기 

C정리 

 

 D생성

 D읽기

D중단 

..... 

.... 

 D읽기

 D정리

 

 

 

 

 

 

 

 

 

 

 

 E생성

E읽기 

E정리 

 

 

 


이런 단계를 거쳐도 아직 A가 완료되려면 멀었다 ....


위 그림에서 '읽기' 단계의 길이가 좀 짧게 그려진 감이 있는데, 실제로는 모든 '읽기' 단계는 10~30배 가량 길다고 봐야 한다.  물론, 이런 오퍼레이션과 메인 쓰레드의 동작이 concurrent하게 진행될 수 있다면 아무 문제가 없지만, 불행히도 회사에서 쓰고 있는 언리얼 엔진은 모든 오브젝트를 하나의 거대한 전역 배열에 담아두고 사용하기 때문에, 그 배열에 변경을 가하고자 할 때에는 메인 쓰레드에 락을 걸고 붙잡고 있어야 한다. 게다가 이론상 '생성' 단계가 끝나면 전역 배열의 락은 풀어도 되지만, 우리 게임은 불행한 역사적 사건에 의해 '정리'단계가 끝날 때 까지 락을 잡고 있어야만 하는 상황이었다. 이래서는 뭐 하나 로딩하고자 할 때 필요한 시간이 10ms가 될지 100ms가 될지 아무런 보장도 할 수 없다.

G사에서 처음 로딩을 손볼 때에는 이런 구조를 그냥 놔 둬도 시간 제약이 좀 널럴한 편이어서 그냥저냥 쓸만 했는데, 시간 제약이 빡빡한 상황에서 그대로 쓸 수는 없다.

결국 시간을 잡아먹는 것은 '읽기' 단계인데, 이 '읽기' 단계에서 디스크에서 읽어올 내용을 모아서 한번에 처리해서 메모리에 담아 두었다가, 실제 '읽기' 단계에서 메모리 복사로 대체하면 필요한 락의 길이를 대폭 줄일 수 있다는 것이 내가 고친 내용의 핵심이다.

그런데 문제가 하나 있다. 디스크의 어디에서 무엇을 읽어올 지는 오브젝트를 하나하나 까보기 전에는 모른다는 점.

 - 계속

Posted by uhm
dev.log2011. 10. 25. 15:34
최근 1~2년간 내가 몸담고 있는 게임에 크래쉬가 부쩍 늘었는데, 그 속을 들여다보면 절반 이상이 메모리 부족이다. 이 문제는 시스템 사양을 올려도 해결되지가 않는다. 제아무리 시스템 메모리가 넘쳐나는 세상이라고 해도, 아직 32bit 윈도우를 쓰는 사람도 많다. 그래서 게임은 32bit 프로세스로 돌아가게 만들어야 하고, 그렇게 하면 프로세스가 할당받을 수 있는 유저 메모리는 2GB가 한계이기 때문이다. 실제로는 스택 영역도 있고, 단편화나 뭐 이런저런 문제로 진짜로 쓸 수 있는 메모리는 2기가가 안되기 마련.

문제는 게임의 수명이 길어질수록 컨텐츠가 늘어나게 되고 그에 따라 사용하는 리소스의 양도 많아진다는 것.

어느 게임이든 그럿지만, 개발 당시에는 어떻게든 출시하는게 목표였을 것이기 때문에, 일단 되는 방향으로 개발해야만 했을 거다(그당시의 상황을 나는 모른다). 이렇다할 컨텐츠가 많이 없었기 때문에 게임에 포함된 모든 리소스를 메모리에 올려놔도 사용하는 것만 메모리를 할당하는 것과 몇MB차이가 안났을 게다. 그래서 의도인지 아닌지는 모르겠으나, 게임에 쓰이는 모든 리소스가 게임 구동시에 메모리를 차지하도록 구성되어 있었다. (두둥)
아마도 짐작컨데, 이런 시나리오였을 거다. FPS게임이 있고, 출시 당시에 총기를 대략 20종 준비해 놓고 출시했다고 가정해 보자. 한 방에서 게임하는 플레이어가 대충 8:8이라고 치고 최악의 경우를 상정하면 16명이 16종의 총기를 골고루 들고 나오는 건데, 게임 구동시 모든 총기를 다 로딩해 놔도 기껏해야 4종의 총기 리소스에 해당하는 메모리만 추가 부담하면 된다. 총기 하나에 5~6MB를 차지한다고 치면 껏해야 20MB. 이마저도 게임에 플레이어가 들어오고 나가고를 몇번 하다 보면 어차피 다 로딩되어야 하는 경우도 심심치 않았을 거다. 게다가 게임 구동시에 로딩이 일어나므로 맵 로딩 시간 및 난입 랙이 줄어드는 순기능마저 있다. (lol)
그러다가 총기를 추가하는 업데이트를 한다. 한번에 한두개의 총기만 추가되므로 추가되는 메모리 부담 역시 10MB안쪽이다. 요즘 같은 세상에서는 납득할 만한 수치이다. 게다가 총기 한개 더 넣자고 기존의 리소스 관리를 뜯어고쳐서 새로 만드는 것 역시 수지가 안맞는 일이다. 이런저런 이유로 기존의 방식 대로 총기 리소스가 들어간다.
그런데 세월이 흘러 총기 한두개씩을 넣는 업데이트 30회를 거쳤다. 총기가 3배로 늘어났다. 그럼 총기가 60종이 되는 건데, 최악의 상황을 가정해도 16명이 16종의 총기를 들고 나오는 거다. 그런데 기존 스킴 대로 게임 구동시에 모든 총기의 리소스가 로딩된다면 게임 중 쓰일 리가 없는 총기 44종의 리소스는 말 그대로 메모리 도둑일 뿐이다. 게다가 같은 총기를 들고 오는 사람이 있다면 낭비는 더 심해진다.

물론 이런 일이 일어나서는 안된다. 그런데 그것이 실제로 일어났습니다.

이는 부분적으로 언리얼 엔진의 구조 때문이기도 한데, 언리얼 스크립트는 게임 진행에 필요한 리소스가 참조될 경우 스크립트 로딩과 동시에 해당 리소스를 로딩해 버린다. 신경써서 짜지 않으면 실행경로에 없는 리소스도 마구 로딩돼 메모리를 차지하게 된다.
그럼 방법은? 리소스가 로딩될 시점을 프로그래머가 제어해 줘야 하는데, 이 역시 난관이 있다. 개발 작업에 사용하는 애셋에는 일반에 공개되면 안되는 리소스도 많이 있다. 그래서 패키징 시에 공개될 버전에서는 참조되지 않는 리소스를 제외하고 패키징하는데, 리소스를 프로그래머가 동적으로 로딩하면 언리얼 스크립트에서 제공하는 리소스 참조 관리를 거치지 않으므로 참조되지 않는 것으로 처리하여 패키징에서 빠지는 불상사가 일어난다.
동적으로 로딩하는 것들을 별도로 관리하는 매커니즘을 만들면 되긴 하지만, (그리고 실제로도 만들었다) 문제는 지금까지 작성된 스크립트를 고칠 엄두가 안난다는 것이다. 작업량도 많거니와, 새 컨텐츠 만들 시간도 없는데 기존의 것 고치자고 노가다를 하기도 좀 그렇고, 게다가 고쳤는데 버그라도 일어난다면 누가 책임진단 말인가.

해서, 우리 게임의 메모리 사용량은 계속해서 계속 계속 계속 증가하기만 해왔고, 급기야 이제는 클라이언트 크래쉬의 주 원인으로 떠오른 지경. (후새드) 이거야말로 가랑비에 옷젖는 줄 모르는 대표적 사례.

결말은? 근 2주에 걸쳐 각종 총기과 무기, 캐릭터에 주렁주렁 달려 있는 리소스를 동적로딩으로 바꾸고 대략 200MB를 절감할 수 있었다는 것. (올레!)

 
Posted by uhm
dev.log2010. 5. 12. 17:56
오늘 섬군이 나한테 이렇게 물어봤다.
[섬] 엄아 엄아
[엄]  ??
[섬] 이게 웨 3바이트로 나올까.. ;ㅁ;
union RGB565
{
 struct
 {
  byte r : 5;
  byte g : 6;
  byte b : 5;
 };
 WORD rgb;
};
[엄]  음; 컴파일러의 최적화 덕분이겠지;
[섬] #pragma pack(1) 이거 해도?
[섬] 아.. 짜증나 .. 완전 삽질하고 있었네 -_-;
[엄] 음.. 유니언은 pack이 아니라 다른 걸로 할거 같은데...
[섬] 에잇! 다 다시 짜야쥐.ㅠ.ㅠ 망할
[섬] 유니온 따위 쓰지 말아야.. 겠.. -_-
[엄] 아아 니가 쓴 타입이 byte라 그래. WORD같은 걸로 바까바바
[섬] 흠.. WORD로? 따로 계산 ? 음..
[엄] 유니언은 선언된 타입의 경계를 벗어나는 멤버는 그 형에 맞춰서 재배열하게 돼 있슴
[엄] 5+5 = 10이니까.. g멤버가 1바이트 경계에 걸쳐지잖아
[엄] 그러니까 g멤버는 다음 바이트로 넘어가는 거지.
[섬] 호오 ... 그렇군
[섬] 크 ... 모든건 그 비모로글 유니언 때문이었군..ㅠㅠ
[엄] WORD로 바꾸면 별 문제 없이 잘 될듯;;

섬군이 모를 정도면 다른 사람들도 잘 모를거 같아서 포스팅.
Posted by uhm