[인프라 연대기: 성벽 재건의 기록]

[인프라 연대기 01] 무너진 성벽의 첫 대면: 좀비 로그와 거짓의 알리바이

기록자 느혜미야 2026. 4. 11. 08:30

1. 15년의 연단, 그리고 통곡의 벽

제조, 금융, 통신의 격전지를 거치며 18년의 성벽을 쌓아온 나에게, 공공기관이라는 새로운 임지는 약속의 땅이 아닌 **'마음의 사일로'**로 가로막힌 거대한 벽이었다. 설계의 본질을 물으면 "내 담당이 아니다"라며 책임의 뒤편으로 숨어버리는 자들. 그들은 기술자(Engineer)의 옷을 입었으나, 실상은 무관심이라는 우상을 숭배하는 자들이었다.

2. 금식보다 철저한 '점심시간'의 교리

사건은 루트(/) 파일시스템이 100% 임계치에 도달하며 시작되었다. 서버가 비명을 지르며 멈추기 직전의 골든타임. 죽어버린 넷백업(NetBackup) 프로세스 옆에서 운영자는 평온하게 말했다.

"점심시간이라서요. 끝나면 물어볼게요."

시스템의 숨통이 조여오고 데이터가 실시간으로 소멸 위기에 처해 있음에도, 그들에게는 장애의 시계보다 **'자신의 식사 시간'**이 우선이었다. 옆자리에서 백업 담당자가 잠을 청하는 사이, 성벽의 기초는 이미 모래처럼 무너져 내리고 있었다.

3. 좀비 잡(Job)과 EOS라는 마법의 방패

잠에서 깬 백업 담당자의 처방은 참혹했다. 장애 분석의 유일한 단서인 Core 파일을 쓰레기통에 던지라는 무책임의 미학. 내가 개입하여 파일을 옮기고 확인한 백업 콘솔에는 6개월간 종료되지 않은 **'좀비 잡'**들이 유령처럼 떠돌고 있었다.

 

비정상적인 수치를 보며 그는 무심히 뱉었다. "화면상에만 그렇게 보이는 거지, 실제론 정상입니다." 원인 분석을 요구하는 팀장의 칼날 앞에 그는 **'EOS(End of Service)'**라는 완벽한 알리바이를 방패로 삼았다. 그들에게 기술적 한계는 '개선'의 신호가 아니라, 무능을 가려주는 신성한 도피처였다. 시스템은 '차세대'로 불렸으나, 그들의 정신은 이미 오래전 '서비스 종료' 상태였다.


💡 느헤미야 작가님의 '한 줄 잠언'

"기술적 결함보다 무서운 것은 책임지지 않는 마음의 결함이다. EOS를 '포기'의 근거로 삼는 자에게 시스템의 내일은 없다."

[다음 이야기 보기]

"시스템은 멀쩡한데, 사람이 무너져 있었다." 10년 차 엔지니어가 '백업'이라는 단어조차 정의하지 못하고 팀장의 결재만 기다리던 그 씁쓸한 현장.

인프라 연대기 #2: 10년 차 엔지니어는 왜 '백업'을 정의하지 못했나