본문 바로가기
데이터베이스

데이터베이스편

by 흰색남자 2022. 9. 21.
  • 데이터베이스(Database, DB)란? : 데이터의 저장소. 
  • DBMS(Database Management System, 데이터베이스 관리 시스템)란? 데이터베이스를 운영하고 관리하는 소프트웨어.
    • 계층형, 망형, 관계형 DBMS 중 대부분의 DBMS가 테이블로 구성된 관계형 DBMS(RDMBS)형태로 사용됨. 
  • SQL(Structured Query Language)란? 구조화된 질의 언어라는 뜻으로 관계형 데이터베이스에서 사용되는 언어. 표준 SQL을 배우면 대부분의 DBMS를 사용할 수 있음.

 

MySQL 작동구조에 대해 정리해보자

MySQL 엔진

-클라이언트로부터 접속 및 쿼리 요청을 처리하는 커넥션 핸들러,

SQL 파서 및 전처리기, 그리고 쿼리의 최적화를 위한 옵티마이저,

DBMS의 두뇌에 해당하는 처리를 수행한다.

 

스토리지 엔진(Storage engine)

-스토리지 엔진은 실제 데이터를 디스크 스토리지에 저장하거나 읽어오는 부분을 전담한다.

 

핸들러API

-MySQL 엔진이 스토리지 엔진에게 쓰기 또는 읽기를 요청할 때 핸들러 API를 사용

 

 

 

MySQL threading 구조

-MySQL 서버는 프로세스 기반이 아닌 스레드 기반 작동

 

-포그라운드(foreground) 스레드와 백그라운드(Background) 스레드로 구분

 

-포그라운드(foreground) 스레드:

1)최소 MySQL 서버에 접속된 클라리언트의 수만큼 존재하며, 클라이언트 사용자가 요청하는 쿼리 문장을 처리하는 한다.

 

2)사용자가 커넥션을 종료하면 해당 커넥션은 스레드 풀로 되돌아 간다.

 

3)스레드 풀에 일정 개수이상의 대기중인 스레드가 있으면 스레드 풀에 넣지 않고 스레드를 종료시켜서 일정 개수의 스레드 풀에 존재.

 

4)스레드의 개수를 일정하게 유지하게 만들어주는 parameter가 thread_cache_size이다

ex)

SHOW VARIABLES LIKE 'thread_cache_size';

 

-백그라운드(background) 스레드:

1)인서트 버퍼를 병합하는 스레드

2)로그를 디스크로 기록하는 스레드★(쓰기 스레드)

3)버퍼 풀의 데이터를 디스크에 기록하는 스레드★(쓰기 스레드)

4)데이터를 버퍼로 읽어들이는 스레드

5)잠금이나 데드락을 모니터링 하는 스레드

6)모든 스레드를 총괄하는 메인 스레드

 

ex)

SHOW VARIABLES LIKE 'innodb_%_io_threads';

 

-읽기/쓰기 스레드의 개수를 지정하는 파라미터는 innodb_read_io_threads/innodb_write_io_threads

innoDB 에서는 데이터를 읽는 작업은 주로 클라이언트 스레드에서 처리되기 때문에 읽기 스레드는 많이 설정할 필요가 없지만, 쓰기 스레드는 아주 많은 작업을 백그라운드로 처리하기 때문에 일반적인 내장 디스크를 사용할때는 2~4개 정도로 설정하고, DAS나 SAN과 같은 스토리지를 사용할때는 4개 이상으로 충분하게 설정해야한다.

 

 

MYSQL이 쓰레드 기반으로 동작하는 이유 

MySQL 이 프로세스 기반으로 동작을 하게 된다면 하나의 쿼리 요청마다 하나의 프로세스가 생기게 되버려 스레드를 기반으로 했을 때와 다르게 메모리나 cpu 에 드는 비용이 클 것이다. 또한, 내부적으로 스레드 풀을 이용해서 스레드를 종료시키거나 하는 거에 대한 비용을 줄이려고 하는데 이 또한 프로세스를 이용하게 되면 무용지물이 될 것이다. 또한, 프로세스는 스레드와 다르게 서로 간에 데이터를 공유하지 않는다. 그렇기에 하나의 데이터를 가져오도록 lock 을 거는 것이나 이런 부분에서 개발하기 힘들 것 같다.

 

요약 :

프로세스 기반일 경우

쿼리를 날릴 때 마다 프로세스가 생성됨 > 프로세스는 컨텍스트 스위칭 비용이 비쌈 > 느림

 

쓰레드

쿼리를 날릴 때 마다 쓰레드가 생성 > 쓰레드는 공유하는 데이터가 많아 컨텍스트 스위칭 비용이 적음 > 비교적 빠름 

 

 

 

 

쿼리 실행 절차

MySQL 서버에서 쿼리가 실행되는 과정은 크게 세 단계로 나눌 수 있다.

  1. SQL문을 잘게 쪼개서 MySQL Server가 이해할 수 있는 수준으로 분리(파스 트리)한다.
  2. SQL의 파싱 정보(파스 트리)를 확인하면서 어떤 테이블부터 읽고 어떤 인덱스를 이용할 지 선택한다.
  3. 2번째 단계에서 결정된 테이블의 읽기 순서나 선택된 인덱스를 이용해 Storage Engine에서 데이터를 가져온다.

첫 번째 단계 SQL 파싱(Parsing)이라고 한다. MySQL Server의 SQL 파서라는 모듈로 처리한다. SQL 문법이 잘못되었다면 이 단계에서 걸러진다. 또한 해당 단계에서 SQL 파스 트리가 만들어진다. 

 

MySQL Server가 실제로 쿼리를 실행할 때는 SQL 문장이 아니라 SQL 파스 트리를 사용해서 쿼리를 실행한다.

 

두 번째 단계는 첫 번째 단계에서 만들어진 SQL 파스 트리를 참조해서 다음의 내용을 처리한다.

  • 불필요한 조건 제거 및 복잡한 연산의 단순화
  • 여러 테이블의 조인이 있는 경우 어떤 순서로 테이블을 읽을지 결정
  • 각 테이블에 사용된 조건과 인덱스 통계 정보를 이용해 사용할 인덱스를 결정
  • 가져온 레코드들을 임시 테이블에 넣고 다시 한번 가공해야 하는지 결정

물론 이 밖에도 수많은 처리를 한다. 해당 단계는 최적화 및 실행 계획 수립 단계이며, MySQL Server의 Optimizer에서 처리한다.

 

세 번 째 단계는 수립된 계획대로 스토리지 엔진에서 레코드를 읽어오도록 요청하고, MySQL 엔진에서는 스토리지 엔진으로부터 받은 레코드를 조인하거나 정렬하는 작업을 수행한다.

 

첫 번째, 두 번째 단계는 주로 MySQL 엔진에서 처리하며, 세 번째 단계는 MySQL 엔진과 스토리지 엔진이 함께 처리한다.

 

 

이 과정에서 가져온 데이터를 임시테이블에 저장할 것이고, 임시테이블에는 원하는 데이터가 남게 된다.

 

이 임시 테이블이 우리가 원하는 결과임

 

 

 

출처: https://devroach.tistory.com/33 [Rlog:티스토리]