63, 64일차 [컴퓨터 공학] 기초
2021. 10. 25 월요일
1. Today's Key Points!🔑
- 문자열
- 그래픽
- 운영체제
- 프로그램, 프로세스, 스레드에 대해 기본적인 개념을 설명할 수 있다.
- 동시성과 병렬성의 차이를 이해할 수 있다.
- 자바스크립트 엔진(v8)이 어떤 특징을 가지고 있는지 이해할 수 있다.
2. 정리해보자!🔑
문자열
유니코드
유니코드(Unicode)는 유니코드 협회(Unicode Consortium)가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자를 다루기 위한 알고리즘 등을 포함하고 있다. 기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것이다.
- 인코딩(부호화) : 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것이다. 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 한다. 이렇게 인코딩과 디코딩의 기준을 문자열 세트 또는 charset이라고 한다. 이 charset의 국제 표준이 유니코드이다.
ASCII 문자
영문 알파벳을 사용하는 대표적인 문자 인코딩. 7 비트로 모든 영어 알파벳을 표현할 수 있다. 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함한다. 유니코드는 ASCII를 포함한다.
UTF-8 vs UTF-16 (Universal Coded Character)
UTF-뒤에 있는 숫자는 비트(bit)이다.
- 차이점 : 인코딩 방식
- UTF-8 특징
- 가변 길이 인코딩 : 유니코드 한 문자를 나타내기 위해 1 byte(=8 bits) 에서 4 bytes까지 사용한다. 영어 문자열 하나는 1 byte, 이 외의 글자는 2byte 또는 3byte, 보조 글자는 4byte를 차지한다.
- 바이트 순서가 고정됨 : UTF-16에 비해 바이트 순서를 따지지 않고, 순서가 정해져 있다.
- UTF-16 특징
- 코드 그대로 바이트로 표현가능 : 유니코드 코드 대부분(U+0000부터 U+FFFF; BMP)을 16bits로 표현. 대부분에 속하지 않는 기타문자는 32 bit(4 bytes)로 표현하므로 UTF-16도 가변 길이라고 할 수 있으나, 대부분은 2 byte로 표현한다.
- 바이트 순서가 다양함 : 바이트 순서에 따라 UTF-16의 종류가 달라진다.
- UTF-8에서 한글은 3 byte, UTF-16에서 한글은 2 byte를 차지한다.
그래픽
비트맵(래스터) | 벡터 | |
기반 기술 | 픽셀 기반 | 수학적으로 계산된 Shape 기반 |
특징 | 사진과 같이 색상의 조합이 다양한 이미지에 적합 | 로고, 일러스트와 같이 제품에 적용되는 이미지에 적합 |
확대 | 확대에 적합하지 않음, 보다 큰 사이즈의 이미지가 필요할 때 사용하려는 크기 이상으로 생성하거나 스캔해야 함 | 품질 저하없이 모든 크기로 확대 가능하며, 해상도의 영향을 받지 않음 |
크기(dimension)에 따른 파일 용량(file size) |
큰 크기의 이미지는, 큰 파일 사이즈를 가짐 | 큰 크기의 벡터 그래픽은 작은 파일 사이즈를 유지할 수 있음 |
상호 변환 | 이미지의 복잡도에 따라 벡터로 변환하는 것에 오랜 시간이 걸림 | 쉽게 래스터 이미지로 변환 가능 |
대표적인 파일 포맷 | jpg, gif, png, bmp, psd | svg, ai |
웹에서의 사용성 | jpg, gif, png 등이 널리 쓰임 | svg 포맷은 현대의 브라우저에서 대부분 지원 |
운영체제
하드웨어에게 일을 시키는 주체가 운영체제이다. 운영체제가 하는 일을 알아보자.
시스템 자원 관리
응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와준다. 하드웨어를 구성하는 일을 하는 CPU, 자료를 저장하는 RAM, 디스크 등의 시스템 자원을 관리하는 주체가 바로 운영체제이다.
- 프로세스 관리(CPU)
- 메모리 관리
- I/O(입출력) 관리 (디스크, 네트워크 등)
응용 프로그램 관리
응용 프로그램이 실행되고, 시스템 자원을 사용할 수 있도록 권한과 사용자를 관리한다.
응용 프로그램
- 운영체제를 통해 컴퓨터에게 일을 시키는 것.
- 응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키려면, 컴퓨터를 조작할 수 있는 권한을 운영체제로부터 부여받아야 한다.
- 시스템 콜(System call) : 응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공하는 것.
- ex) 응용 프로그램이 프린터 사용에 대한 권한을 획득한 후에는, 프린터를 사용할 때 필요한 API를 호출해야 한다. 이 API는 시스템 콜로 이루어져 있다.
프로세스(Process)
실행 중인 하나의 애플리케이션을 프로세스라고 부른다. 예를 들어 Chrome 브라우저를 두 개 실행하면, 두 개의 프로세스가 생성된다. 이렇게 하나의 애플리케이션은 여러 프로세스(다중 프로세스)를 만들기도 한다.
스레드(Thread)
스레드는 사전적 의미로 한 가닥의 실이라는 뜻이다. 한 가지 작업을 실행하기 위해 순차적으로 실행한 코드를 실처럼 이어 놓았다고해서 유래된 이름이다. 하나의 스레드는 코드가 실행되는 하나의 흐름이기 때문에, 한 프로세스 내에 스레드가 두 개라면 코드가 실행되는 흐름이 두 개 생긴다는 의미이다.
- 프로세스 내에서 실행되는 흐름의 단위
- 각 스레드마다 call stack이 존재(call stack : 실행중인 서브루틴을 저장하는 자료 구조)
- 스레드는 다른 스레드와 독립적으로 동작
멀티 스레드(Multi-Thread)
운영체제는 멀티 태스킹을 할 수 있도록, 프로세스마다 CPU 및 메모리 자원을 적절히 할당하고 병렬로 실행한다. 멀티 프로세스가 애플리케이션 단위의 멀티 태스킹이라면, 멀티 스레드는 애플리케이션 내부에서의 멀티 태스킹이라고 할 수 있다. 멀티 스레드는 다양한 곳에서 사용된다.
- 대용량 데이터의 처리시간을 줄이기 위해 데이터를 분할하여 병렬로 처리하는 데 사용
- UI를 가지고 있는 애플리케이션에서 네트워크 통신을 하기 위해 사용
- 여러 클라이언트의 요청을 처리하는 서버를 개발할 때 사용
- 장점 : 시스템의 처리량향상. 응답 시간 단축. -> 여러 프로세스로 할 수 있는 작업을 하나의 프로세스에서 스레드로 나눠 수행하게 할 경우 메모리 공간과 시스템 자원의 소모가 줄어든다. 스레드 간의 통신이 필요한 경우에도 별도의 자원을 이용하는 것이 아니라 전역 변수의 공간 또는 동적으로 할당된 공간인 Heap영역을 이용한다. 따라서, 프로세스 간 통신 방법(IPC)에 비해 스레드 간의 통신 방법이 훨씬 간단하다.
- 문제점 : 멀티 프로세스 기반으로 프로그래밍할 때에는 프로세스 간 공유하는 자원이 없기 때문에 동일한 자원에 동시에 접근하는 일이 없지만, 멀티 스레딩을 기반으로 프로그래밍 할 때에는 공유하는 자원에 대해 고민이 필요하다. 서로 다른 스레드가 같은 데이터에 접근하고, 힙 영역을 공유하기 때문에 서로 다른 스레드가 서로 사용중인 변수나 자료구조에 접근하여 엉뚱한 값을 읽어오거나 수정하는 일이 발생할 수 있다.
- 멀티스레딩 환경에서는 동기화 작업이 필요하다. 동기화를 통해 작업 처리 순서를 제어하고, 공유 자원에 대한 접근을 제어해야 한다.
동시성 vs 병렬성
- 동시성(Concurrency) : 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으킴
- 병렬성(Parallelism) : 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨
가비지 컬렉션
프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것. 이 기능을 가진 언어(혹은 엔진)는 자바, C#, 자바스크립트 등이 있다.
let a;
a = 10;
a라는 변수는 스택에 저장된다. 10은 힙에 저장된다. a에 저장된 10이라는 값은 실제로는 10의 주소값이 저장된 것이다. 이렇게 사용 하다가 a를 사용하지 않게 되면, a는 스택에서 사라지는데, 10은 힙에 남아있게 된다. 이 때 a와 10의 연결이 끊기면서 가비지가 된다. 보통 하나의 js 파일이 끝났을 때, 가비지 컬렉션이 발생하는데 이때 가비지를 정리하는 동안 프로그램이 잠시 멈추기 때문에 가비지 컬렉션 발생횟수를 줄여야 한다.
웹 서비스에서의 캐시
캐시
일시적인 데이터를 저장하기 위한 목적으로 존재하는 고속의 데이터 저장공간이다. 첫 작업 이후에 이 데이터에 대한 요청이 있을 경우, 데이터의 기본 저장공간에 접근할 때 보다 더 빠르게 요청을 처리할 수 있다. 캐싱을 사용하면 이전에 검색하거나 계산한 데이터를 효율적으로 재사용할 수 있다.
작동원리
일반적으로 RAM(Random Access Memory)과 같이 빠르게 액세스할 수 있는 하드웨어에 저장되며, 소프트웨어 구성 요소와 함께 사용될 수도 있다. 캐시는 기본 스토리지 계층(SSD, HDD)에 액세스하여 데이터를 가져오는 더 느린 작업의 요구를 줄이고, 데이터 검색의 성능을 높인다.
속도를 위해 용량을 절충하는 캐시는 일반적으로 데이터의 하위 집합을 일시적으로 저장한다. 완전하고 영구적인 데이터가 있는 데이터베이스와는 대조적이다.
장점
- 애플리케이션 성능 개선
- 데이터베이스 비용 절감
- 백엔드 부하 감소
- 예측 가능한 성능
- 데이터베이스 핫스팟 제거
- 읽기 처리량 증가
웹서비스에서 캐시가 적용되는 예
- 클라이언트 : HTTP 캐시 헤더, 브라우저
- 네트워크 : DNS 서버, HTTP 캐시 헤더, CDN, 리버스 프록시
- 서버 및 데이터베이스 : 키-값 데이터 스토어(e.g. Redis), 로컬 캐시(인-메모리, 디스크)
'코드스테이츠 수강 TIL > Section 3' 카테고리의 다른 글
67일차 [배포] Amazon Web Service (0) | 2021.11.21 |
---|---|
Codestates HA3 Section3 회고 (0) | 2021.11.20 |
62일차 [인증/보안] OAuth (0) | 2021.10.27 |
61일차 [인증/보안] Token (0) | 2021.10.25 |
60일차 [인증/보안] Cookie/Session (0) | 2021.10.24 |