63, 64일차 [컴퓨터 공학] 기초

2021. 11. 2. 20:33
반응형

2021. 10. 25 월요일

1. Today's Key Points!🔑

  • 문자열
  • 그래픽
  • 운영체제
  •  
  • 프로그램, 프로세스, 스레드에 대해 기본적인 개념을 설명할 수 있다.
    • 동시성과 병렬성의 차이를 이해할 수 있다.
    • 자바스크립트 엔진(v8)이 어떤 특징을 가지고 있는지 이해할 수 있다.

2. 정리해보자!🔑

문자열

유니코드

유니코드(Unicode)는 유니코드 협회(Unicode Consortium)가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자를 다루기 위한 알고리즘 등을 포함하고 있다. 기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것이다.

  • 인코딩(부호화) : 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것이다. 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 한다. 이렇게 인코딩과 디코딩의 기준을 문자열 세트 또는 charset이라고 한다. 이 charset의 국제 표준이 유니코드이다.

ASCII 문자

영문 알파벳을 사용하는 대표적인 문자 인코딩. 7 비트로 모든 영어 알파벳을 표현할 수 있다. 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함한다. 유니코드는 ASCII를 포함한다.

UTF-8 vs UTF-16 (Universal Coded Character)

UTF-뒤에 있는 숫자는 비트(bit)이다.

  • 차이점 : 인코딩 방식
  • UTF-8 특징
    • 가변 길이 인코딩 : 유니코드 한 문자를 나타내기 위해 1 byte(=8 bits) 에서 4 bytes까지 사용한다. 영어 문자열 하나는 1 byte, 이 외의 글자는 2byte 또는 3byte, 보조 글자는 4byte를 차지한다.
    • 바이트 순서가 고정됨 : UTF-16에 비해 바이트 순서를 따지지 않고, 순서가 정해져 있다.
  • UTF-16 특징
    • 코드 그대로 바이트로 표현가능 : 유니코드 코드 대부분(U+0000부터 U+FFFF; BMP)을 16bits로 표현. 대부분에 속하지 않는 기타문자는 32 bit(4 bytes)로 표현하므로 UTF-16도 가변 길이라고 할 수 있으나, 대부분은 2 byte로 표현한다.
    • 바이트 순서가 다양함 : 바이트 순서에 따라 UTF-16의 종류가 달라진다.
  • UTF-8에서 한글은 3 byte, UTF-16에서 한글은 2 byte를 차지한다.

그래픽

벡터와 비트맵 차이점 이미지 예시

  비트맵(래스터) 벡터
기반 기술 픽셀 기반 수학적으로 계산된 Shape 기반
특징 사진과 같이 색상의 조합이 다양한 이미지에 적합 로고, 일러스트와 같이 제품에 적용되는 이미지에 적합
확대 확대에 적합하지 않음, 보다 큰 사이즈의 이미지가 필요할 때 사용하려는 크기 이상으로 생성하거나 스캔해야 함 품질 저하없이 모든 크기로 확대 가능하며, 해상도의 영향을 받지 않음
크기(dimension)에 따른
파일 용량(file size)
큰 크기의 이미지는, 큰 파일 사이즈를 가짐 큰 크기의 벡터 그래픽은 작은 파일 사이즈를 유지할 수 있음
상호 변환 이미지의 복잡도에 따라 벡터로 변환하는 것에 오랜 시간이 걸림 쉽게 래스터 이미지로 변환 가능
대표적인 파일 포맷 jpg, gif, png, bmp, psd svg, ai
웹에서의 사용성 jpg, gif, png 등이 널리 쓰임 svg 포맷은 현대의 브라우저에서 대부분 지원

운영체제

하드웨어에게 일을 시키는 주체가 운영체제이다. 운영체제가 하는 일을 알아보자.

시스템 자원 관리

응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와준다. 하드웨어를 구성하는 일을 하는 CPU, 자료를 저장하는 RAM, 디스크 등의 시스템 자원을 관리하는 주체가 바로 운영체제이다.

  • 프로세스 관리(CPU)
  • 메모리 관리
  • I/O(입출력) 관리 (디스크, 네트워크 등)

응용 프로그램 관리

응용 프로그램이 실행되고, 시스템 자원을 사용할 수 있도록 권한과 사용자를 관리한다.

응용 프로그램

  • 운영체제를 통해 컴퓨터에게 일을 시키는 것.
  • 응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키려면, 컴퓨터를 조작할 수 있는 권한을 운영체제로부터 부여받아야 한다.
  • 시스템 콜(System call) : 응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공하는 것. 
  • ex) 응용 프로그램이 프린터 사용에 대한 권한을 획득한 후에는, 프린터를 사용할 때 필요한 API를 호출해야 한다. 이 API는 시스템 콜로 이루어져 있다.

프로세스(Process)

실행 중인 하나의 애플리케이션을 프로세스라고 부른다. 예를 들어 Chrome 브라우저를 두 개 실행하면, 두 개의 프로세스가 생성된다. 이렇게 하나의 애플리케이션은 여러 프로세스(다중 프로세스)를 만들기도 한다.

스레드(Thread)

스레드는 사전적 의미로 한 가닥의 실이라는 뜻이다. 한 가지 작업을 실행하기 위해 순차적으로 실행한 코드를 실처럼 이어 놓았다고해서 유래된 이름이다. 하나의 스레드는 코드가 실행되는 하나의 흐름이기 때문에, 한 프로세스 내에 스레드가 두 개라면 코드가 실행되는 흐름이 두 개 생긴다는 의미이다.

  • 프로세스 내에서 실행되는 흐름의 단위
  • 각 스레드마다 call stack이 존재(call stack : 실행중인 서브루틴을 저장하는 자료 구조)
  • 스레드는 다른 스레드와 독립적으로 동작

멀티 스레드(Multi-Thread)

운영체제는 멀티 태스킹을 할 수 있도록, 프로세스마다 CPU 및 메모리 자원을 적절히 할당하고 병렬로 실행한다. 멀티 프로세스가 애플리케이션 단위의 멀티 태스킹이라면, 멀티 스레드는 애플리케이션 내부에서의 멀티 태스킹이라고 할 수 있다. 멀티 스레드는 다양한 곳에서 사용된다. 

  • 대용량 데이터의 처리시간을 줄이기 위해 데이터를 분할하여 병렬로 처리하는 데 사용
  • UI를 가지고 있는 애플리케이션에서 네트워크 통신을 하기 위해 사용
  • 여러 클라이언트의 요청을 처리하는 서버를 개발할 때 사용
  • 장점 : 시스템의 처리량향상. 응답 시간 단축. -> 여러 프로세스로 할 수 있는 작업을 하나의 프로세스에서 스레드로 나눠 수행하게 할 경우 메모리 공간과 시스템 자원의 소모가 줄어든다. 스레드 간의 통신이 필요한 경우에도 별도의 자원을 이용하는 것이 아니라 전역 변수의 공간 또는 동적으로 할당된 공간인 Heap영역을 이용한다. 따라서, 프로세스 간 통신 방법(IPC)에 비해 스레드 간의 통신 방법이 훨씬 간단하다.
  • 문제점 : 멀티 프로세스 기반으로 프로그래밍할 때에는 프로세스 간 공유하는 자원이 없기 때문에 동일한 자원에 동시에 접근하는 일이 없지만, 멀티 스레딩을 기반으로 프로그래밍 할 때에는 공유하는 자원에 대해 고민이 필요하다. 서로 다른 스레드가 같은 데이터에 접근하고, 힙 영역을 공유하기 때문에 서로 다른 스레드가 서로 사용중인 변수나 자료구조에 접근하여 엉뚱한 값을 읽어오거나 수정하는 일이 발생할 수 있다.
  • 멀티스레딩 환경에서는 동기화 작업이 필요하다. 동기화를 통해 작업 처리 순서를 제어하고, 공유 자원에 대한 접근을 제어해야 한다.

동시성 vs 병렬성

  • 동시성(Concurrency) : 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으킴
  • 병렬성(Parallelism) : 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨

가비지 컬렉션

프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것. 이 기능을 가진 언어(혹은 엔진)는 자바, C#, 자바스크립트 등이 있다.

let a;
a = 10;

a라는 변수는 스택에 저장된다. 10은 힙에 저장된다. a에 저장된 10이라는 값은 실제로는 10의 주소값이 저장된 것이다. 이렇게 사용 하다가 a를 사용하지 않게 되면, a는 스택에서 사라지는데, 10은 힙에 남아있게 된다. 이 때 a와 10의 연결이 끊기면서 가비지가 된다. 보통 하나의 js 파일이 끝났을 때, 가비지 컬렉션이 발생하는데 이때 가비지를 정리하는 동안 프로그램이 잠시 멈추기 때문에 가비지 컬렉션 발생횟수를 줄여야 한다.

웹 서비스에서의 캐시

캐시

일시적인 데이터를 저장하기 위한 목적으로 존재하는 고속의 데이터 저장공간이다. 첫 작업 이후에 이 데이터에 대한 요청이 있을 경우, 데이터의 기본 저장공간에 접근할 때 보다 더 빠르게 요청을 처리할 수 있다. 캐싱을 사용하면 이전에 검색하거나 계산한 데이터를 효율적으로 재사용할 수 있다.

작동원리

일반적으로 RAM(Random Access Memory)과 같이 빠르게 액세스할 수 있는 하드웨어에 저장되며, 소프트웨어 구성 요소와 함께 사용될 수도 있다. 캐시는 기본 스토리지 계층(SSD, HDD)에 액세스하여 데이터를 가져오는 더 느린 작업의 요구를 줄이고, 데이터 검색의 성능을 높인다.

속도를 위해 용량을 절충하는 캐시는 일반적으로 데이터의 하위 집합을 일시적으로 저장한다. 완전하고 영구적인 데이터가 있는 데이터베이스와는 대조적이다.

장점

  • 애플리케이션 성능 개선
  • 데이터베이스 비용 절감
  • 백엔드 부하 감소
  • 예측 가능한 성능
  • 데이터베이스 핫스팟 제거
  • 읽기 처리량 증가

웹서비스에서 캐시가 적용되는 예

  • 클라이언트 : HTTP 캐시 헤더, 브라우저
  • 네트워크 : DNS 서버, HTTP 캐시 헤더, CDN, 리버스 프록시
  • 서버 및 데이터베이스 : 키-값 데이터 스토어(e.g. Redis), 로컬 캐시(인-메모리, 디스크)
반응형
LIST

BELATED ARTICLES

more