msp : 운영 업무, cpu, 메모리 등 확인. 알람을 받고 1차적 트러블 슈팅
해결이 안되면 sa(솔루션 아키텍처)에 연락
cloud solution architecture : 클라우드 환경에서 서비스 및 응용 프로그램을 설계하고 구현하는 방법을 정의하는 것을 의미
고객이 이야기한 것을 최적의 아키텍처로 구성, 가능한 것 불가능한 것을 설계한다.
어플 로그, qa 등 다 해야함. 모든 영역을 커버한다. 영업 지원, 비용 계산, 야간 지원 등 다 해야함. 힘들다.
클라우드는 어떤 것으로 이루어져 있나?
os, network, storage, database, security, ci/cd, maintenance,
os
- account 관리 : 루트 계정 절대 사용 ㄴㄴ, 누가 어떤 작업을 했나 다 남겨야 함. 히스토리 관리
- kernel 관리 : yum 업데이트하면 커널 업데이트하는데 이러면 충돌 날 수 있다. 커널 업데이트 방지하는 것이 필요한 경우가 있다.
- dump 관리 : 메모리 덤프, 작업한 내용을 메모리에 남기고 디스크에 저장
- script 관리 : 특정 서버는 쉘 스크립트 변경을 통해 어플리케이션 변경을 해야할 수가 있다. 가이드만 해주고 직접 수정하지는 말 것. 설정 절대 직접하지 않는다. 잘못하면 다 내 책임이 될 수 있다.
network
- network 관리 : cidr 블록 할당, 네트워크를 구성할 때 cidr 블록을 할당하여 ip주소를 관리
서브넷 구성 및 관리, 필요에 따라 서브넷의 크기를 조절하여 ip 주소 관리
보안 그룹, acl 설정, 네트워크 트래픽 제어
규격화 하는 것이 중요하다. IP 대역이나 서버 이름 같은 것.
네이버는 1~5번은 사용중이라 오토 스케일링 할 때 ip 대역을 고려해서 서브넷을 생성할 것.
acg도 다 다르게 용도를 다르게 한다. 디폴트 사용 ㄴㄴ
acg 3개 바인딩 가능
nacl도 다 용도마다 다르게 구성할 것.
- multi / hybrid network
storage
- 용량 관리
고객 요구 사항, nas 설정 등등
오토스케일링 하려면 nas는 스크립트로 마운트 해야 함(네이버 클라우드)
블록 스토리지를 nas처럼 쓰려고 할 수도 있음. nas 성능 차이 때문.
- 백업 관리
증분 백업, 풀 백업 소산 백업 등등.
백업 서비스 이용료가 비싸다. 10기가 당 비용 청구. 백업 서비스를 사용하지 않고 tar 형식으로 백업하려 함.
database
- 관리
에러 로그 설정, 슬로우 로그 설정, 네이버 클라우드에 없거나 있는 것은 고객에게 말해줘야 함. 어떤 설정을 원하는지 알아 둘 것. read/write 분산은 기본임. master/slave 구성, 어떻게 구성할 지 알아둬야 한다.
바이너리 로그, 로그를 다 저장하는 것
로그 분석해서 트러블 슈팅 가이드 라인 작성해야 함.
쿼리 최적화 정도는 진행함. db를 만지는 일은 그렇게 많지 않다.
- 마이그레이션 및 탈출 관리
기존 데이터를 클라우드 데이터베이스로 마이그레이션하고 적절한 etl(extract, transform, load)프로세스를 구성하여 데이터를 적재
클라우드에 있는 데이터베이스를 다른 곳으로 이관하는 것에 대해 알려줘야 한다.
db만 아니라 서버 데이터도 이관하는 것에 대해 알려줘야 한다. 그룹웨어(네이버 웍스) 등등 기업에서 사용한 메세지 등등을 옮기는 방법 등 제시 (네이버 -> 카카오) 내용이 빠지는 것에 대한 방지(데이터 유실 방지) 계속 백업해서 데이터 유실 없도록 해야 한다.
실무와 가깝게 체크리스트 만들기, 직접 작업한 것에 대해 실무하는 것처럼 만들기.
서버 변경 일지, 계정 내용, 체크리스트, 버전 관리 등
security
- cloud 보안 관리
서버 별 보안 체크리스트, 계정 보안 관리
- vm 보안 관리
ci/cd
- source code 관리
ci/cd git 빌드 연결, ci/cd 연결, 연동만 잘 해주면 된다.
- script 관리
init/shell script 관리, 꼭 날짜 적기
version 관리
maintenance
- 모니터링 관리
고객 관리자 및 내부 관리자에 대한 모니터링 설정 진행
클라우드에서 지원하지 않는 모니터링은 직접 해야 한다.
- maintenance 관리
변경 내역 관리
장애 리포트 관리 - 언제 알았고 언제 확인했고 어떻게 조치했는지, 방지 어떻게 할지 고객에게 리포트 제공
서드 파티에서 지원하는 프로그램을 사용하면 된다.
직접 구축한 내용이면 직접
'배운 내용 > 클라우드 교육' 카테고리의 다른 글
12월20일 - NCP207 정리 (1) | 2023.12.20 |
---|---|
12월19일 - NCP202 복습 (0) | 2023.12.19 |
12월15일 - AWS 도커 실습, 서버 백신 설치 (0) | 2023.12.15 |
12월14일 - NCP 200(Compute, Storage, Container) 정리 (1) | 2023.12.15 |
12월13일 - (실습) Image Optimizer (0) | 2023.12.13 |