[지난 이야기 다시보기: 사이다 특집]
인프라 엔지니어에게 메모리 교체는 단순한 메모리 교체 그 이상이다. 비휘발성 데이터를 다루기에 작업 절차가 까다롭고, 자칫하면 데이터 유실이나 OS 부팅 불가 상태에 빠질 수 있다. 수차례 반복된 작업이었지만, 나는 늘 원격에서 긴장의 끈을 놓지 않고 상황을 리딩했다. 하지만 정작 복병은 장비가 아니라 **'사람'**이었다.
1. "잠자코 있으세요" - 현장 관리자의 위험한 침묵
물리적 교체가 필요한 작업 특성상 데이터센터 현장에는 관리자 1명과 벤더 엔지니어가 투입되었다. 원격지의 나는 그들의 **'눈'**이 되어줄 보고를 기다렸지만, 현장 관리자는 소통을 거부했다.
나: "관리자님, 현재 엔지니어가 비휘발성 데이터 백업 단계 진입했나요? 로그 확인 부탁드립니다."
현장 관리자: "아, 좀 기다리세요. 하는 중이니까 잠자코 있어 보세요. 끝나면 얘기해 드릴게요."
현장 관리자는 단순한 참관인이 아니다. 엔지니어가 작업계획서대로 움직이는지, 지연이 발생한다면 원인이 무엇인지 파악해 공유해야 하는 **'현장 마스터'**여야 한다. 하지만 그는 정보를 독점했고, 나의 정당한 확인 요청을 '재촉'으로 치부하며 입을 막았다.
2. 정보 공백이 부른 팀장의 화살
작업이 예상보다 30분, 1시간 지연되기 시작하자 단톡방은 팀장의 불호령으로 도배되었다.
- 팀장: "지금 상황이 어떻게 된 거야? 왜 보고가 없어?"
- 나: (현장에서 들은 게 없으니 답답함만 커짐)
사실 현장 관리자가 한 줄만 공유했어도 끝날 일이었다. 하지만 팀장은 현장이 아닌, 리딩을 맡은 나를 타깃으로 삼았다. "리딩하는 사람이 상황 파악도 못 하고 뭐 하느냐"는 핀잔. 정보를 주는 사람이 없는데 어떻게 파악하란 말인가. 샌드위치 신세가 된 엔지니어의 비애였다.
3. 리딩(Leading)인가, 방관(Watching)인가
메모리 교체 같은 고난도 작업에서 현장 관리자의 무지는 치명적이다. 엔지니어가 헤매고 있을 때 가이드를 주거나, 지연 사유를 명확히 짚어내지 못한다면 그건 관리가 아니라 **'방관'**이다.
그가 나에게 "잠자코 있으라"고 했던 이유는, 어쩌면 본인도 지금 현장에서 어떤 일이 벌어지고 있는지 정확히 이해하지 못했기 때문이 아니었을까. 무지함을 감추기 위한 가장 쉬운 수단이 바로 **'침묵'**이니까.
4. 에필로그: 데이터센터 작업의 핵심은 '공유'
결국 작업은 우여곡절 끝에 끝났지만, 내 가슴속에는 깊은 허탈함이 남았다. 인프라 운영은 혼자 하는 예술이 아니라, 유기적인 협업의 결과물이다. 현장의 오만한 침묵은 결국 전체 팀의 리듬을 깨뜨린다.
성경은 말한다.
"지략이 없으면 백성이 망하여도 지략이 많으면 평안을 누리느니라" (잠언 11:14)
정확한 정보 공유라는 '지략'이 없으면, 엔지니어는 시스템이 아니라 '사람' 때문에 망하게 된다.
"강제로 켤까요? – 무지의 용기가 부른 새벽의 공포" (시즌 2-22편)
현장 관리자의 "잠자코 있으라"는 오만한 침묵이 가시기도 전, 주말 새벽 정적을 깨는 진동이 울렸습니다. 스토리지 노드 다운과 함께 켜진 선명한 장애 알람(Fault LED).
폐쇄망이라는 벽에 막혀 현장으로 달려가던 제게, 하드웨어 어드민은 귀를 의심케 하는 질문을 던집니다. "그냥 강제로 한번 켜볼까요?" 로그 분석도, 원인 파악도 없는 '무모한 재부팅' 제안. 침묵보다 더 무서운 건, 똥오줌 못 가리는 경력직의 '위험한 판단력'이었습니다.
인프라 생존기 시즌 2-22편, "도박은 대응이 아니다"를 기대해 주세요!
'[인프라 생존기]' 카테고리의 다른 글
| [인프라 장애 대응] "살아났으니 켜진 거죠" – 복구 뒤에 숨은 엔지니어의 무책임한 방관: 인프라 생존기 시즌2-23편 (0) | 2026.04.08 |
|---|---|
| [인프라 장애 대응] "그냥 켜볼까요?" – 전문가의 무지가 부르는 대참사: 인프라 생존기 시즌2-22편 (1) | 2026.04.07 |
| [리눅스 서버 점검] Swap 100%와 swappiness 설정의 함정: 인프라 생존기 시즌2-20편 (0) | 2026.04.03 |
| [서버 장애 원인 분석] 스토리지 I/O와 Swap 사용률 100%의 관계: 인프라 생존기 시즌2-19편 (0) | 2026.04.02 |
| [인프라 성능 점검] 서버 지연과 스토리지 I/O 장애의 상관관계: 인프라 생존기 시즌2-18편 (0) | 2026.04.01 |