🔗 [인프라 실무의 정석] 시리즈 다시보기
1. 가상화의 유혹: "자원이 남는데 왜 안 주나요?"
가상화 환경을 운영하다 보면 고객(현업)으로부터 가장 많이 듣는 요청이 바로 CPU 증설입니다. 물리 서버 시절에는 상상도 못 할 일이지만, 클릭 몇 번으로 자원이 생성되는 가상화 세상에서 고객은 "호스트 사용률이 낮은데 왜 증설이 안 되냐"고 묻습니다. 이때 아키텍트에게는 나를 방어할 **'기준'**과 시스템을 지킬 **'통찰'**이 동시에 필요합니다.
2. 1:3 가이드라인: 왜 '할당(Provisioning)' 기준이어야 하는가?
VMware 등 가상화 솔루션에서 권고하는 물리 코어 대비 vCPU 비율 1:3. 많은 이들이 이것이 사용량 기준인지 할당 기준인지 헷갈려합니다. 결론부터 말하면, 대외적인 가이드라인은 '할당' 기준으로 세워야 합니다.
- 과적 방지 제한선: 1:3은 일종의 안전장치입니다. 모든 VM이 동시에 피크(Peak)를 치는 최악의 상황에서도 호스트가 즉시 마비되지 않도록 하는 최소한의 물리적 보루입니다.
- 운영의 명분: "사용량만 낮으면 무제한 가능합니다"라고 말하는 순간, 인프라의 통제권은 사라집니다. 할당 기준이 있어야 전체 서버 팜의 수용량(Capacity)을 산정하고 증설 계획을 세울 수 있습니다.

3. 아키텍트의 통찰: 하지만 진짜 성능은 '사용량'에 있다
그렇다면 할당 비율만 지키면 끝일까요? 아닙니다. 운영자라면 숫자의 이면을 봐야 합니다.
- 할당이 적어도 위험한 경우: 1:1로 할당했어도 특정 VM의 실제 사용량이 물리 코어 전체를 점유하면 호스트는 과부하에 걸립니다.
- 할당이 많아도 위험한 경우: 사용량은 낮지만 vCPU 개수가 너무 많으면, 하이퍼바이저가 물리 코어를 배정하기 위해 대기하는 **CPU Ready Time($%$RDY)**이 증가하며 시스템에 '렉'이 발생합니다.
결국, **1:3이라는 할당 기준은 '인프라를 보호하기 위한 방패'**로 삼고, **실제 사용량과 Ready Time 지표는 '성능을 최적화하기 위한 창'**으로 활용해야 합니다.
📖 오늘의 인프라 묵상
"모든 것이 내게 가하나 다 유익한 것이 아니요 모든 것이 내게 가하나 내가 무엇에든지 얽매이지 아니하리라" (고린도전서 6:12)
vCPU를 무한정 할당하는 것은 '가능'하지만, 전체 시스템의 안정성 측면에서는 결코 '유익'하지 않습니다. 물리적 수치의 유혹에 얽매이지 않고, 가이드라인(1:3)이라는 절제와 실사용량이라는 데이터 사이에서 균형을 잡는 것. 그것이 바로 인프라의 평화를 지키는 아키텍트의 지혜입니다.
📌 [참고] 기초 산수마저 왜곡하는 '엔지니어링 가스라이팅'의 실제 사례
가상화의 핵심인 오버커밋(Overcommit)을 숨기고, 자원이 무한정 남은 것처럼 데이터를 세탁하여 '허상의 왕국'을 건설하는 기술자들을 경계해야 합니다. 구축은 했으되 이해는 하지 못한 자들이 세운 성벽이 왜 위험한지 아래 연대기에서 확인해 보시기 바랍니다.
🔗 [[인프라 연대기 #5] 기적의 산수와 가상화의 명암, 거짓 기초석 위에 세운 허상의 왕국]
[다음 이야기 예고]
"클릭 몇 번이면 CPU 늘어납니다. 서비스 중단 없어요."
가상화의 꽃이라 불리는 'Hot-Add' 기능 덕분에 우리는 당당하게 말하곤 합니다. 하지만 정작 자원을 늘려준 뒤에도 "성능이 그대로인데요?"라는 고객의 항의를 받아본 적 없으신가요?
인프라가 밀어 넣어준 '새 포도주'를 어플리케이션(WAS)이라는 '부대'가 인지하지 못한다면, 그 증설은 수치상의 세탁일 뿐입니다.
왜 CPU 증설의 끝은 결국 '재기동'이라는 정석으로 귀결되는지, 인프라와 미들웨어 사이의 보이지 않는 장벽을 파헤쳐 봅니다.
👉 [[제6편] CPU 증설의 완성: 인프라의 '할당'과 AP의 '인식' 사이] 곧 공개됩니다.
'[인프라 실무의 정석]' 카테고리의 다른 글
| [인프라 실무의 정석 #7] P2V의 기술과 예술: 물리 서버를 가상화로 옮기는 '라이브 솔루션'의 신뢰성 (0) | 2026.05.24 |
|---|---|
| [인프라 실무의 정석 #6] CPU 증설의 완성: 인프라의 '할당'과 AP의 '인식' 사이 (0) | 2026.05.17 |
| [인프라 실무의 정석] 제4편. vMotion의 신뢰성: 주간 작업의 경계를 허무는 가상화 마이그레이션 (0) | 2026.05.03 |
| [인프라 실무의 정석 3편] 낮 시간에 당당하게 작업하는 기술: VMware Hot-Add와 아키텍트의 고뇌 (0) | 2026.04.26 |
| [인프라 실무의 정석] 제2편. 서비스 영향도 '제로'의 실체: 하드웨어 관리 키(UAK) 업데이트는 왜 낮에 하는가? (0) | 2026.04.19 |