[인프라 생존기]

[인프라 생존기 #41] 하이퍼바이저 실종 사건: 인벤토리 정합성을 무너뜨린 '데이터 오염'

기록자 느혜미야 2026. 5. 6. 08:30

지난번 [[베어메탈을 논리 서버라 우기며 1대를 2대로 만든 '창조 경제'(40편)]]. 물리 서버 리스트에도 있고 논리 서버 리스트에도 있는 그 유령 서버들은 결국 관리의 '무법지대'를 만들어냈습니다. 제가 그 누더기 현황판을 정석으로 되돌리기 위해 백업 담당자가 만든 문서를 열어본 순간, 저는 제 눈을 의심했습니다.

1. 설계자의 정석 vs 백업자의 편의

저는 초기 가이드에서 **HW(Physical)**와 **VM(Logical)**을 엄격히 구분했습니다. 가상화 호스트, 베어메탈, 유닉스, 스토리지 등은 '쇳덩이' 그룹에, Guest VM들은 '논리' 그룹에 넣었죠. 하드웨어의 실체를 파악하고 그 위에 올라간 자원을 관리하는, 인프라 관리의 가장 기초적인 문법입니다.

2. '서버 용도별 현황'이라는 이름의 데이터 무법지대

백업 담당자의 문서는 **'서버 용도별 현황'**이라는 거창한 타이틀을 달고 있었지만, 그 실상은 '혼돈' 그 자체였습니다.

  • 1번 그룹(용도별 통합): 용도별로 묶었다는 명분 하에 VM과 베어메탈이 아무 구분 없이 섞여 있습니다. 정작 이 서비스를 지탱하는 '가상화 호스트'는 리스트 어디에도 없습니다. 엔진 없는 자동차 명단이나 다름없었습니다.
  • 2번 그룹(OS 분류): RHEL만 딱 적어놓고, 나머지 CentOS나 Rocky, 자체 OS 등은 죄다 **'기타'**로 묶어버렸습니다. 나중에 보안 취약점 패치 대상이라도 뽑으려면 '기타'라는 미궁을 일일이 뒤져야 하는 구조였습니다.
  • 3번 그룹(물리 서버): 1번 그룹과 중복된 베어메탈은 물론이고, 심지어 LPAR(논리 분할) 대수까지 합산되어 있었습니다. 물리 장비 1대에 LPAR 10개 있으면 서버 11대로 보고할 기세였습니다.

3. "나도 나를 못 믿으니, 이상하면 알려달라"

도저히 이해가 안 가 백업 담당자에게 물었습니다. "대체 무슨 기준으로 이렇게 작성하신 건가요?" 돌아온 대답은 허탈함의 정점이었습니다.

백업 담당자: "아, 구축 문서 기준으로 했습니다. 사실... 저도 저를 못 믿거든요. 운영자님이 보시고 이상한 거 있으면 저한테 알려주세요."

 

'구축 문서'를 참고했다면서 운영 체계는 엉망이고, 본인이 만든 데이터에 책임은 지지 않겠다는 당당함. **"내 똥은 네가 치워라"**는 그 한마디에 저는 그저 실소하며 고개를 끄덕이고 말았습니다. '용도별 현황'이라는 예쁜 라벨은 그저 데이터 중복과 관리 부실을 덮기 위한 비겁한 면죄부였을 뿐입니다.

 

결국 저는 '해탈'한 마음으로 그 누더기를 옆으로 밀어두고, 처음부터 다시 엑셀을 켜야 했습니다.


📖 오늘의 인프라 묵상

"길을 굽게 하는 자는 드러나리라" (잠언 10:9)

 

현황판은 엔지니어의 지도와 같다. 자기 편의를 위해 방위를 멋대로 바꾸고 거리를 '기타'로 왜곡하며 "틀리면 네가 고쳐라"고 말하는 지도는 이미 가치를 잃은 종이 뭉치일 뿐이다.

 

[다음 편 보기] "참지 않는 팀장님, 그리고 엑셀과의 사투"

"나도 나를 못 믿으니 네가 알아서 봐달라"는 무책임한 말에 저는 굳이 남의 똥을 치우지 않기로 했습니다. 대신 제 영역인 'LPAR 정합성' 하나만 정교하게 다듬으며, 그들의 모래성이 언제 무너질지 지켜보았죠.

결국, 참다못한 팀장님이 칼을 빼 들었습니다.

"이 양식으론 도저히 안 되겠네요. 다 폐기하고 이걸로 다시 작성하세요."

드디어 시작된 '진짜 데이터'를 향한 여정. 하지만 판이 바뀌어도 빌런들의 생존 본능은 멈추지 않습니다.

👉 [[시즌 2-42편] : "방관자의 지혜, 그리고 새롭게 시작하는 질서"]