Back-end/Java Language

X. GarbageCollection(가비지 컬렉션)

prden 2021. 6. 10. 14:20

1.  Garbage Collection(가비지 컬렉션)이란?

JVM에서 가비지 컬렉터가 불필요한 메모리를 정리해 준다(메모리 누수 방지)

 

2. Minor GC와 Major GC

 JVM의 Heap영역은 처음 설계될 때 2가지를 전제로 설계되었다. 

1. 대부분의 객체는 금방 접근 불가능 상태가 된다. 

2. 오래된 객체에서 새로운 객체로의 참조는 아주 적게 존재한다. 

 

즉, 객체는 대부분 일회성이 되며, 메모리에 오랫동안 남아있는 경우는 드문 것이다. 그렇기 때문에 객체의 생존 기간에 따라 물리적인 Heap 영역을 나누게 되었는데, 이에 따라 Young, Old 총 2가지 영역으로 설계되었다. (초기에는 Perm영역이 존재했지만, java8부터 제거됨)

1) Minor GC

  Young 영역( Young Generation) : 새롭게 생성된 객체가 할당되는 영역으로 대부분의 객체가 금방 unreachable상태가 되기 때문에, 많은 객체가 Young영역에 생성되었다가 사라진다. 이러한 Young영역에 대한 가비지 컬렉션을 MinorGC라고 부른다. 

2) Major GC

Young 영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역으로 복사되는 과정에서 대부분 Young 영역보다 크게 할당되며, 크기가 큰 만큼 가비지는 적게 발생한다. 이러한 Old영역에 대한 가비지 컬렉션을 MajorGC 또는 FullGC라고 부른다. 

 

3. GarbageCollection의 동작 방식

가비지 컬렉션은 다음의 2가지 공통적인 단계를 따른다. 

 1) Stop The World

Stop The World는 가비지 컬렉션을 실행하기 위해 JVM이 애플리케이션의 실행을 멈추는 작업이다. GC가 실행될 때는 GC를 실행하는 스레드를 제외한 모든 스레드들의 작업이 중단되고, GC가 완료되면 작업이 재개된다.

 2) Mark and Sweep

 Mark : 사용되는 메모리와 사용되지 않는 메모리를 식별하는 작업

 Sweep : Mark 단계에서 사용되지 않는 식별된 메모리를 해제하는 작업

Stop The World를 통해 모든 작업을 중단시키면, GC는 스택의 모든 변수 또는 Reachable 객체를 스캔하면서 각각이 어떤 객체를 참고하고 있는지를 탐색하게 된다. 그리고 사용되고 있는 메모리를 식별하는데, 이러한 과정을 Mark라고 한다. 이후에 Mark가 되지 않은 객체들을 메모리에서 제거하는데, 이러한 과정을 Sweep라고 한다.

 

3) Minor GC의 동작방식

 Young영역은 1개의 Eden 영역과 2개의 Survivor영역 총 3가지 영역으로 나뉜다. 

 Eden 영역이란 새로 생성된 객체가 할당(Allocation)되는 영역이고, Survivor영역은 최소 1번의 GC이상 살아남은 객체가 존재하는 영역이다. 객체가 새롭게 생성되면 Young 영역 중에서 Eden영역에 할당(Allocation)이 된다. 그리고 Eden 영역이 꽉 차면 Minor GC가 발생하는 데 사용되지 않는 메모리는 해제되고 Eden 영역에 존재하는 객체가 Survivor영역으로 옮겨지게 된다. Survivor영역은 총 2개이지만, 반드시 1개의 영역에만 데이터가 존재해야 한다. 

Young영역의 동작 순서는 1. 새로 생성도니 객체가 Eden 영역에 할당되고 2. 객체가 계속 생성되어 Eden영역이 꽉 차면 MinorGC가 실행된다.  Eden영역에서 사용되지 않는 객체의 메모리는 해제되고, 살아남은 객체는 1개의 Survivor영역으로 이동한다. 3. 1-2의 과정이 반복되다가 Survivor영역이 가득 차게 되면 Survivor영역의 살아남은 객체를 다른 Survivor영역으로 이동시킨다. 4. 이런 과정을 반복해 계속 살아남은 객체는 Old영역으로 이동된다. 

 

4) Major GC의 동작 방식

Young영역에서 오래 살아남은 객체는 Old 영역으로 Promotion 됨을 확인할 수 있었다. 그리고 Major GC는 객체들이 계속 Promotion 되어 Old영역의 메모리가 부족해지면 발생하게 된다. Young영역은 일반적으로 Old영역보다 크기가 작기 때문에 GC가 보통 0.5~1초 사이에 끝난다. 그렇기 때문에 MinorGC는 애플리케이션에 크게 영향을 주지 않는다. 하지만 Old영역은 Young영역보다 크며 Young영역을 참조할 수도 있다. 그렇기 때문에 MajorGC는 일반적으로 Minor GC보다 시간이 오래 걸리고 10배 이상의 시간을 사용한다. 

 

https://d2.naver.com/helloworld/1329