공부/Java

[공부/자바] 프로세스와 쓰레드의 차이

오잎 클로버 2022. 2. 23. 09:36
728x90

프로세스, 쓰레드, 그리고 JVM 쓰레드, 멀티 프로세스, 멀티 쓰레드. 이렇게 5가지를 설명하고자 합니다.

 

프로그램(Program)이란?

사전적 의미: 어떤 작업을 위해 실행할 수 있는 파일

 

프로세스(Process)란?

사전적 의미: 컴퓨터에서 연속적으로 실행되고 있는 컴퓨터 프로그램

메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적인 개체)

운영체제로부터 시스템 자원을 할당받는 작업의 단위

즉, 동적인 개념으로는 실행된 프로그램을 의미합니다.

 

할당받는 시스템 자원의 예시) CPU 시간, 운영되기 위해 필요한 주소 공간, Code Data, Stack, Heap의 구조로 

있는 독립적인 메모리 영역

 

특징)

  • 프로세스는 각각 독립된 메모리 영역(Code, Data, Stack, Heap)을 할당 받음
  • 기본적으로 프로세스당 최소 1개의 쓰레드(메인 쓰레드)를 가지고 있음
  • 각 프로세스는 별도의 주소 공간에서 실행됨, 한 프로세스는 다른 프로세스의 변수나 자료구조에 접근 불가
  • 한 프로세스가 다른 프로세스의 자원에 접근하려면, 프로세스 간의 통신(IPC, inter-process communication)을 사용.
    • ex) 파이프, 파일, 소켓 등을 이용한 통신 방법 이용

쓰레드(Thread)란?

사전적 의미: 프로세스 내에서 실행되는 여러 흐름의 단위

프로세스의 특정한 수행 경로

프로세스가 할당받은 자원을 이용한 실행의 단위

 

특징)

  • 쓰레드는 프로세스 내에서 각각 Stack만 따로 할당받고, Code, Data, Heap 영역은 공유함
  • 쓰레드는 한 프로세스 내에서 동작되는 여러 실행의 흐름으로, 프로세스 내의 주소 공간이나 자원들(힙 공간 등)을 같은 프로세스 내에 쓰레드끼리 공유하면서 실행
  • 각각의 쓰레드는 별도의 레지스터와 스택을 갖고 있지만, 힙 메모리는 서로 읽고 쓸 수 있음
  • 한 쓰레드가 프로세스의 자원을 변경하면, 다른 이웃 쓰레드(sibling Thread)도 그 변경 결과를 즉시 확인 가능

자바 쓰레드(Java Thread)란?

  • 일반 쓰레드와 거의 차이가 없으며, JVM가 운영체제의 역할을 수행하여 작동
  • 자바에는 프로세스가 존재하지 않고 쓰레드만 존재하며, 자바 쓰레드는 JVM에 의해 스케줄 되는 실행 단위 코드 블럭
  • 자바에서 쓰레드 스케줄링은 전적으로 JVM에 의해 이루어짐
  • JVM에서 관리하는 쓰레드 관련 정보들은 다음과 같음
    • 쓰레드가 몇 개 존재하는지
    • 쓰레드로 실행되는 프로그램 코드의 메모리 위치는 어디인지
    • 쓰레드의 상태는 어떠한지
    • 쓰레드 우선순위는 어디인지

즉, 개발자는 자바 쓰레드로 작동할 쓰레드 코드를 작성하고,

쓰레드 코드가 생명을 가지고 실행을 시작하도록 JVM에 요청하는 것이 전부입니다.

멀티 프로세스(Multi Process)란?

멀티 프로세스에 대해 설명하기 앞서 Context Switching에 대해서 설명하고 합니다.

Context Switching이란?

  • CPU에서 여러 프로세스를 돌아가면서 작업을 처리하는 데, 이 과정을 Context Switching이라고 함
  • 동작 중인 프로세스가 대기를 하면서 해당 프로세스의 상태(Context)를 보관하고, 대기하고 있던 다음 순서의 프로세스가 동작하면서 이전에 보관했던 프로세스의 상태를 복구하는 작업을 말함

멀티 프로세싱: 하나의 응용 프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 하나의 작업(Task)을 처리하도록 하는 것입니다.

장점)

  • 여러 개의 자식 프로세스 중 하나에 문제가 발생하면 그 자식 프로세스만 죽는 것 이상으로 다른 영향이 확산되지 않음

단점)

  • Context Switching에서의 오버헤드
    • Context Switching 과정에서 캐시 메모리 초기화 등 무거운 작업이 진행되고 많은 시간이 소모되는 등의 오버헤드가 발생함
    • 프로세스는 각각의 독립된 메모리 영역을 할당받았기에 프로세스 사이에서 공유하는 메모리가 없어, ContextSwitching가 발생하면 캐시에 있는 모든 데이터를 모두 리셋하고 다시 캐시 정보를 불러와야 함
  • 프로세스 사이의 어렵고 복잡한 통신 기법(IPC)
    • 프로세스는 각각의 독립된 메모리 영역을 할당받았기에 하나의 프로그램에 속하는 프로세스들 사이의 변수를 공유할 수 없음

멀티 쓰레드(Multi Thread)란?

멀티 쓰레딩: 하나의 응용 프로그램을 여러 개의 쓰레드로 구성하고 각 쓰레드로 하여금 하나의 작업을 처리하도록 하는 것입니다.

윈도우, 리눅스 등 많은 운영체제들이 멀티 프로세싱을 지원하고 있지만, 멀티 쓰레딩을 기본으로 하고 있습니다.

또, 웹 서버는 대표적인 멀티 쓰레드 응용 프로그램입니다.

장점)

  • 시스템 자원 소모 감소 (자원의 효율성 증대)
    • 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리할 수 있음
  • 시스템 처리량 증가 (처리 비용 감소)
    • 쓰레드 간 데이터를 주고받는 것이 간단해지고, 시스템 자원 소모가 줄어들게 됨
    • 쓰레드 사이의 작업량이 적어 Context Switching이 빠르다.
  • 간단한 통신 방법으로 인한 프로그램 응답 시간 단축
    • 쓰레드는 프로세스 내의 Stack 영역을 제외한 모든 메모리를 공유하기에 통신의 부담이 적음

단점)

  • 주의 깊은 설계 요구
  • 디버깅이 까다로움
  • 단일 프로세스 시스템의 경우, 효과 기대하기 어려움
  • 다른 프로세스에서 쓰레드를 제어할 수 없음 (즉, 프로세스 밖에 쓰레드 각각을 제어할 수 없음)
  • 멀티 쓰레드의 경우, 자원 공유의 문제가 발생함(동기화 문제)
  • 하나의 쓰레드에 문제가 발생하면, 전체 프로세스가 영향을 받음

참고

https://brunch.co.kr/@kd4/3

https://you9010.tistory.com/136

 

 

이상입니다.