Sky Archive

Cloud/Cloud Computing

[Cloud Computing] 기본적인 클라우드 컴퓨팅 용어

Anchovy ʕ-᷅ᴥ-᷄ʔ 2021. 8. 6. 14:01

AWS를 공부하며 정리한 클라우드(Cloud Computing) 관련 기초 개념 용어입니다.

정확히 모르던 개념, 가볍게 읽으며 확인하면 좋을 거 같아요.🐱‍🐉

 

VM
(Virtual Machine)
- 물리적 하드웨어 시스템에 구축되어 자체 CPU, 메모리, 네트워크 인터페이스 및 스토리지를 갖추고 가상 컴퓨터 시스템으로 작동하는 가상 환경.
- VM을 사용하면 macOS 노트북에 Linux를 설치한 경우처럼 단일 컴퓨터에서 다른 여러 운영 체제를 동시에 실행할 수 있다.
Faas
(Function-as-a-Service)
서버리스 컴퓨팅을 구현하는 방식.
서버리스는 개발자의 서버 및 리소스 할당 관리 또는 프로비저닝과 같은 인프라 문제를 추상화하고 이를 플랫폼에 적용하여 개발자의 코드 작성과 비즈니스 가치 제공에 집중할 수 있게 한다.
블록 스토리지
(Block Storage)
- 데이터를 별도의 블록으로 분리해 저장하여 쉽게 활용할 수 있도록 한다.
- 요청이 들어오면 데이터 블록을 다시 조합해 사용자에게 제공한다.
- 대규모 트랜잭션을 수행하는 기업과 대용량 데이터베이스를 배포하는 기업에서도 원활히 동작. 결국 더 많은 데이터를 저장해야 할수록 블록 스토리지 사용이 더 유리하다. 하지만 비용이 많이 드는 문제 발생
프로비저닝
(Provisioning)
IT 인프라를 설정하는 프로세스로 다양한 유형이 존재.

- 서버 프로비저닝: 필요한 리소스를 기반으로 네트워크에서 사용될 서버를 설정하는 프로세스

- 사용자 프로비저닝: 액세스 권한과 인증 권한을 모니터링하는 아이덴티티 관리 유형
- 네트워크 프로비저닝: 사용자, 서버, 컨테이너, IoT기기가 액세스할 네트워크를 설정하는 작업이 포함된다. 통신서비스를 제공하는 것을 지칭하는 방식으로 흔히 통신 업계에서 사용된다.
- 서비스 프로비저닝: 통신 업계에서 고객을 위한 서비스나 클라우드 컴퓨팅 인프라를 설정하는데 사용된다,
워크로드
(Workload)
고객 대면 애플리케이션이나 백엔드 프로세스 같이 비즈니스 가치를 창출하는 리소스 및 코드 모음 또는 주어진 기간에 시스템에 의해 실행되어야 할 작업의 할당량을 의미.
NFS
(Network File System)
- 스토리지 서버와 일반(WEB, DB)서버들이 네트워크를 통해 저장 공간을 공유하는 프로세스이다.
- NFS를 사용하면 일반서버들이 스토리지에 저장되어 있는 데이터를 로컬 서버의 디스크처럼 연결하여 사용할 수 있고 소유자 및 권한 설정하여 보안을 강화할 수 있음.
객체 스토리지 구조화되지 않은 데이터의 대량 저장을 위한 데이터 스토리지 아키텍처로서, 각 데이터 조각을 하나의 객체로 개별 저장소에 보관하여 메타데이터와 고유 식별자를 함께 저장하므로 데이터 액세스와 검색이 용이.
온프레미스
(On-Premise)
소프트웨어 등 솔루션을 클라우드 같이 원격 환경이 아닌 자체적으로 보유한 전산실 서버를 직접 설치해 운영하는 방식
반대 의미인 클라우드 방식은 오프 프레미스(off-premise)

 

데이터 베이스의 운영
비관리형
(Non-Managed)
- 사용자가 직접 관리
- 사용자가 데이터센터를 운영하는 경우
- 장비 운영, OS 설치 및 운영, 데이터베이스 솔루션 설치 및 운영까지 모두 담당
관리형
(Managed)
- 사용자와 AWS가 함께 관리
- AWS EC2 서버에 데이터베이스 솔루션을 설치하고 운영하는 경우
- 장비 운영, OS 설치 및 운영은 AWS가 담당하고, 데이터베이스 솔루션의 설치 및 운영은 사용자가 담당
완전관리형
(Fully-Managed)
- AWS가 모두 관리
- AWS에서 제공하는 RDS 솔루션을 이용하는 경우
- 장비 운영, OS 설치 및 운영, 데이터베이스 솔루션 설치 및 운영까지 AWS에서 모두 담당

 

데이터 웨어하우스
(Data Warehouse)
- 보다 정보에 입각한 의사 결정을 내릴 수 있도록 분석 가능한 정보의 중앙 리포지토리
- 데이터는 트랜잭션 시스템, 관계형 데이터베이스 및 기타 소스로부터 보통 정기적으로 데이터 웨어하우스로 들어간다.
- 데이터 웨어하우스는 데이터를 효율적으로 저장하여 보고서, 대시보드 및 분석 도구를 강화함으로써 데이터의 입출력을 최소화하고 다수의 사용자에게 동시에 신속하게 쿼리 결과를 제공한다.
데이터 레이크
(Data Lake)
- 대규모의 다양한 *원시 데이터 세트를 기본 형식으로 저장하는 데이터 리포지토리 유형
- 정제되지 않은 데이터를 볼 수 있으며, 데이터에 대해 전체적인 대규모 리포지토리를 엔터프라이즈 환경에서 데이터 관리 전략으로 보편화 가능
- 모든 데이터가 보존되며, 스토리지에 저장하기 전에 제거되거나 필터링 되지 않는다.
*원시 데이터: 특정 목적을 위해 처리되지 않은 데이터

 

데이터 웨어하우스 vs 데이터 레이크 비교
특징 데이터 웨어하우스 데이터 레이크
데이터 트랜잭션 시스템, 운영 데이터베이스 및 사업 부서 애플리케이션의 관계형 데이터 정형, 반정형 및 비정형 등 모든 데이터
스키마 일부 경우 데이터 웨어하우스를 구현하기 전 설계되며 분석과 동시에 작성 가능 분석 시에 작성됨
가격/성능 로컬 스토리지를 사용하여 가장 빠른 쿼리 결과를 얻음 저렴한 스토리지를 사용하여 쿼리 결과가 빠르게 제공되며 컴퓨팅 및 스토리지 분리
데이터 품질 신뢰할 수 있는 중앙 버전 역할을 하는 고도로 큐레이트 된 (만들어진) 데이터 큐레이트 될 수 있거나 될 수 없는 모든 데이터(, 원시데이터)
사용자 비즈니스 애널리스트, 데이터 사이언티스트 및 데이터 개발자 비즈니스 애널리스트(큐레이팅 된 데이터 사용), 데이터 개발자, 데이터 엔지니어 및 데이터 아키텍트
분석 배치 보고, BI(Business Intelligence) 시각화 기계 학습, 예비 분석, 데이터 검색, 스트리밍, 운영 분석, 빅 데이터 및 프로파일링

 

로드 밸런서
(Load Balancer)
하나의 인터넷 서비스가 발생하는 트래픽이 많을 때 여러 대의 서버가 분산처리 하여 서버의 로드율 증가, 부하량, 속도저하 등을 고려하여 적절히 분산 처리하여 해결해주는 서비스로 이중화 하여 장애 대비
- Scale-up: 서버가 더 빠르게 동작하기 위해 하드웨어 성능을 올리는 방법.
- Scale-out: 하나의 서버보다는 여러 대의 서버가 나눠서 일을 하는 방법.
CDN
(Content Delivery
Network)
지리적 제한 없이 전 세계 사용자에게 빠르고 안전하게 콘텐츠를 전송할 수 있는 콘텐츠 전송 기술을 의미.
- 서버와 사용자 사이의 물리적 거리를 줄여 콘텐츠 로딩에 소요되는 시간을 최소화
- 각 지역에 캐시 서버를 분산 배치해 근접한 사용자의 요청에 원본 서버가 아닌 캐시 서버로 콘텐츠를 전달.
MPP: 고도 병렬처리
(Massively Parallel Processing)
- 프로그램을 여러 부분으로 나누어 여러 프로세서가 각 부분을 동시에 수행시키는 것을 말한다.
EDW
(Enterprise Data Warehouse)
ODS를 거쳐 운영 데이터베이스 및 외부 데이터 소스로부터 필요 데이터를 추출하여, 경영분석/의사결정의 지원을 위해 최적화된 구조로 변환된 데이터베이스
ODS
(Operational Data Store)
운영계 시스템 데이터는 데이터 분석을 위해 DW(Data Warehouse)를 설계하고, 데이터를 보관하는데, ODSEDW로 데이터를 저장하기 전에, 임시로 운영계 데이터를 보관하는 장소이며, 이력성 데이터를 보관하게 된다.
ODS가 별도로 존재할 경우에는 운영계 시스템의 복사본으로 활용되며, DW의 일부일 경우에는 임시 저장소로 사용됩니다.

 

 

ref. han