Computer Science/Java

Garbage Collection

eunnnn 2023. 4. 10. 12:02

Garbage Collection

 가비지 컬렉션(Garbage Collection, 이하 GC)은 자바의 메모리 관리 방법 중의 하나로 JVM(자바 가상 머신)의 Heap 영역에서 동적으로 할당했던 메모리 중 필요 없게 된 메모리 객체(garbage)를 모아 주기적으로 제거하는 프로세스를 말한다.

 

 Java에서는 가비지 컬렉터가 메모리 관리를 대행해주기 때문에 Java 프로세스가 한정된 메모리를 효율적으로 사용할수 있게 하고, 개발자 입장에서 메모리 관리, 메모리 누수(Memory Leak) 문제에서 대해 관리하지 않아도 되어 오롯이 개발에만 집할 수 있다는 장점이 있다.

 그러나  메모리가 언제 해제되는지 정확하게 알 수 없어 제어하기 힘들며, 가비지 컬렉션(GC)이 동작하는 동안에는 다른 동작을 멈추기 때문에 오버헤드가 발생되는 문제점이 있다. 이를 전문적인 용어로 Stop-The-World 라 한다.

 

Garbage Collector의 대상

가비지 컬렉션은 특정 객체가 garbage인지 아닌지 판단하기 위해서 도달성, 도달능력(Reachability) 이라는 개념을 적용한다. 객체에 레퍼런스가 있다면 Reachable로 구분되고, 객체에 유효한 레퍼런스가 없다면 Unreachable 구분해버리고 수거해버린다. 

 

예를들어 JVM 메모리에서는 객체들은 실질적으로 Heap영역에서 생성되고 Method Area이나 Stack Area 에서는 Heap Area에 생성된 객체의 주소만 참조하는 형식으로 구성된다. 하지만 이렇게 생성된 Heap Area의 객체들이 메서드가 끝나는 등의 특정 이벤트들로 인하여 Heap Area 객체의 메모리 주소를 가지고 있는 참조 변수가 삭제되는 현상이 발생하면, 위의 그림에서의 빨간색 객체와 같이 Heap영역에서 어디서든 참조하고 있지 않은 객체(Unreachable)들이 발생하게 된다. 이러한 객체들을 주기적으로 가비지 컬렉터가 제거해주는 것이다.

 

Garbage Collection의 동작 방식 - 공통

세부동작 방식은 영역별, 적용 알고리즘별로 다르지만 공통적으로 따르는 2단계는 다음과 같다.

 1. Stop the world

JVM이 GC를 실행하기 위해서 애플리케이션의 실행을 멈추는 작업이다. 이때는 GC를 실행하는 쓰레드 외 다른 모든 쓰레드는 작업이 중단된다. 애플리케이션 중단 시간 최소화를 위해서 이 stop the world 작업의 소요시간을 줄이기 위해 다양한 알고리즘을 적용한다.

 2. Mark and Sweep

Stop the world 이후, GC가 스택의 모든 변수 또는 접근 가능한 Reachable 객체를 스캔한다. 사용되지 않는 메모리를 식별하는 과정이 Mark, 이 메모리들을 제거하는 과정을 Sweep 이라고 한다.

 

Garbage Collector의 동작 방식 - Heap 메모리 구조

JVM의 힙(heap) 영역은 동적으로 레퍼런스 데이터가 저장되는 공간으로서, 가비지 컬렉션의 대상이 되는 공간이다.

Heap영역은 처음 설계될 때 객체는 대부분 일회성되며, 메모리에 오랫동안 남아있는 경우는 드물다는 것을 전제로 설계되었다. 이러한 특성을 이용해 JVM 개발자들은 보다 효율적인 메모리 관리를 위해, 객체의 생존 기간에 따라 물리적인 Heap 영역을 나누게 되었고 Young 과 Old 총 2가지 영역으로 설계하였다.

 

Young 영역(Young Generation)

  • 새롭게 생성된 객체가 할당(Allocation)되는 영역
  • 대부분의 객체가 금방 Unreachable 상태가 되기 때문에, 많은 객체가 Young 영역에 생성되었다가 사라진다.
  • 새로 생성된 객체가 할당되는 영역인 Eden 영역, 최소 1번 이상의 GC 이후 남은 객체가 존재하는 Survivor 영역으로 나뉜다.
  • Young 영역에 대한 가비지 컬렉션(Garbage Collection)을 Minor GC라고 부른다.

Old 영역(Old Generation)

  • Young영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역
  • Young 영역보다 크게 할당되며, 영역의 크기가 큰 만큼 가비지는 적게 발생한다.
  • Old 영역에 대한 가비지 컬렉션(Garbage Collection)을 Major GC 또는 Full GC라고 부른다.

 

Minor GC

  1. 인스턴스가 계속 생성되어 Eden 영역이 포화된다.
  2. Stop the world -> Mark and Sweep 실행
  3. 2.에서 살아남은 객체가 첫 Survivor 영역으로 이동
  4. 첫 Survivor 영역 포화 -> Mark and Sweep으로 살아남은 객체가 두번째 Survivor 영역으로 이동
  5. 일정 횟수(age) 이상 살아남은 객체를 Old Generation 영역으로 이동(이것을 Promotion이라고 한다.)

 

Major GC

Young Generation 영역에서 Promotion으로 넘어온 인스턴스들에 의해서 Old Generation 영역의 메모리가 부족해지면 Major GC가 발생한다.

Old 영역에 할당된 메모리가 허용치를 넘게 되면, Old 영역에 있는 모든 객체들을 검사하여 참조되지 않는 객체들을 한꺼번에 삭제하는 Major GC가 실행되게 된다.

하지만 Old Generation은 Young Generation에 비해 상대적으로 큰 공간을 가지고 있어, 이 공간에서 메모리 상의 객체 제거에 많은 시간이 걸리게 된다. 바로 여기서 본문 초반에 소개했던 Stop-The-World 문제가 발생하게 된다.

 

 

출처