헤드라인을 장식하는 사건은 간과했던 취약점을 날카롭게 상기시키며 해결이 필요하다는 사실을 알려주는 경우가 종종 있다. 이러한 사고는 시스템의 한 부분의 장애가 전체 시스템의 중단으로 이어지는 단일 장애 지점에서 발생하는 경우가 많다.
최근 발생한 크라우드스트라이크(CrowdStrike) 사태는 이러한 종류의 사고로, 단일 지점 장애와 관련된 위험성이 증가하고 있음을 보여주는 취약점이다. 2024년7월19일, CrowdStrike 보안 소프트웨어 오작동으로 인해 사상 최대 규모의 IT 중단 사태가 발생하여 많은 산업 분야에서 비즈니스를 하는 기업들에 100억 달러 이상의 손실을 입혔다. 널리 사용되는 Microsoft Windows 운영 체제의 구성 요소에 결함이 있는 업데이트로 인해 850만 대의 시스템이 다운되었다. CrowdStrike 테스트 및 검증 시스템 문제로 결국 결함이 있는 소프트웨어가 배포되었고 그 여파는 아직도 계속되고 있다.
소프트웨어 오류와 연쇄적인 영향은 마이크로소프트 윈도우 운영 체제에 대한 기업 의존도와 윈도우가 사이버 보안 서비스를 제공하는 한 공급업체의 소프트웨어에 의존하고 있다는 점을 강조하고 있다. 이 사건에 대한 초기 평가에 따르면 이러한 과도한 의존의 주요 원인은 공급업체 다양성을 축소시킨 업계 통합과 복잡한 IT 시스템의 상호 연결성이다.
다이아몬드 형태의 위험 Diamond-Shaped Risks
이는 공급망 업계에서는 익숙한 이야기다. 공급망 전문가들은 싱글 소싱이라고도 하는 단일 핵심 공급업체에 의존하는 것의 위험성을 잘 알고 있으며, 이러한 위험을 완화할 수 있는 방법을 개발해 왔다.
<무엇이 최고의 기업을 만드는가: 리질리언스! 기업 위기 극복의 조건 The Power of Resilience: How the Best Companies Managed the Unexpected (MIT Press, 2015)>에서는 이러한 문제를 자세히 설명하고 있다. 책에서는 전형적인 공급망을 나타내는 산업 공급망 구조를 지적하고 있는데 (그림 1 참조), 각 OEM(최종생산자)또는 브랜드 소유자가 많은 공급업체(협력사)를 보유하고 있고, 각 공급업체는 다시 많은 공급업체를 보유하고 있는 역 '트리구조'다. 이 구조는 다양한 공급 옵션이 있다는 점에서 얼핏 견고해 보인다.
그러나 실제 공급망 구조는 다이아몬드처럼 운영되고 있다는 사실을 인식하지 못하는 경우가 많다. (그림 2 참조). 이러한 경우 기업은 하위 공급망 계층에 깊숙이 자리 잡고 있는 단일 공급업체에 의존할 수 있다.
이러한 취약성과 그 결과의 한 가지 전형적인 사례는 2012년 독일 말(Marl)에 있는 에보닉(Evonik)의 사이클로도데카트리엔(CDT) 공장에서 발생한 화재다. CDT는 자동차 산업에서 널리 사용되는 고강도 플라스틱인 나일론 제조의 핵심 원료였다. 태양전지, 운동화, 광섬유 등 다른 제품에도 CDT가 사용되었다. 한 번의 화재로 전세계 CDT 생산 능력의 거의 절반이 파괴되었다. 게다가 태양광 패널 시장의 호황으로 인한 수요로 인해 공급이 부족했다. 자동차 산업은 커다란 위기를 맞이했다.
때로는 지역이나 국가가 걸림돌이 되기도 한다. 예를 들어, 대만은 다양한 유형의 반도체 칩을 단일 공급하는 국가다. 대만 기업들은 최첨단 반도체의 90% 이상을 생산하며, 대부분 대만 반도체 제조회사 (TSMC)라는 단일 회사에서 생산한다. 이러한 반도체 칩은 휴대폰부터 자동차 시스템, 가전제품에 이르기까지 모든 제품에서 사용된다. 이러한 의존도 때문에 미국 정부는 미국 내 반도체 칩 제조를 다시 활성화하려는 시도를 하고 있다.
더 많은 약한 링크 More Weak Links
그러나 단일 지점 장애(single-point failures)와 그로 인한 잠재적인 파괴적 영향은 부품 및 구성 요소의 공급 문제에만 국한되지 않는다. 중요한 물리적 인프라(기반시설) 마비 역시 단일 지점 장애로 인한 파급 효과를 가져올 수 있다. 2021년에 좌초된 컨테이너 선박으로 인해 수에즈 운하가 6일간 막히면서 많은 글로벌 해운 공급망에 파장이 일었다. 2023년에는 파나마 운하 당국이 가뭄 상황에 대응하기 위해 일일 통과 횟수를 줄이고 중량 제한을 도입했다. 예멘에 기반을 둔 이란의 지원을 받는 후티 반군은 2023년11월부터 홍해에서 수십 척의 상선을 공격하여 해운 회사들이 아프리카 주변을 항해하는 데 어려움을 겪고 있다. 우회로 인해 아시아에서 유럽까지의 항해 시간이 약 10일 정도 더 길어졌다. 앞에서 언급한 중단 상황들은 전 세계 해상운송 능력을 감소시켜 공급 부족과 소비자 물가 상승으로 이어졌다.
코로나19 팬데믹 당시 미국의 보건용 개인보호장비(PPE) 생산능력 부족이 적나라하게 드러났다. 이로 인해 많은 인구가 감염에 노출되었고 특히 병원 근로자들 사이에서 바이러스가 광범위하게 전파되어 병원 수용 능력이 감소하고 발병에 맞서 싸우기가 더 어려워졌다.
노동 관련 문제 역시 단일 지점에 혼란을 야기할 수 있다. 2005년 저서 <리질리언트 엔터프라이즈: 글로벌기업의 사업연속성 확보전략 The Resilient Enterprise: Overcoming Vulnerability for Competitive Advantage(MIT Press, 2005)>에서는 2002년 미국 태평양 연안의 모든 항구를 폐쇄한 항만 파업 사태에 대해 설명하고 있다. 이로 인해 미국 경제가 타격을 입자 당시 조지 W. 부시 대통령은 1947년 태프트-하틀리 법을 발동하여 항만을 강제로 정상화시켰다. 또한 2012년 LA항과 롱비치항에서 400명의 노조 소속 해운회사 직원들이 파업을 벌인 사건도 있다. 이 파업으로 인해 항만 단지의 4분의 3이 폐쇄되어 하루에 약 7억6천만 달러 상당의 물품 운송이 막히는 등 막대한 차질을 초래했다.
2023년 미국 작가 조합의 파업은 영화와 TV시리즈 제작에 있어 할리우드의 지배적인 위치를 주목하게 했다. 또한 할리우드가 작가와 노조에 얼마나 의존하고 있는지도 보여주었다. 이 파업으로 인해 배우, 사진작가, 세트 매니저, 대형 스튜디오에 의존하던 수천 개의 중소기업이 일손을 놓았다.
레드플래그(위험신호) 경고 Red Flag Warnings
단일 지점 장애의 범위와 심각성은 현재 기업이 직면하고 있는 위험의 범위가 확대됨에 따라 증가해왔다. 업계 통합, 시스템 복잡성 증가, 상호 연결성 증가(CrowdStrike 정전 사태를 촉발한 트렌드)로 인해 비즈니스 체인에서 단일 중요 링크에 대한 의존도가 높아지고 불투명해졌다. 기업들은 이러한 공급망 위협에 다양한 방식으로 대응해 왔다. 예를 들어, 앞서 설명한 에보닉 인더스트리즈 사태에 대응하여 자동차 업계 기업들은 주요 화학 제조업체들과 함께 CDT 수요를 합리화하고 대체 공급원을 개발하기 위해 협력했다. 이러한 노력으로 갑작스러운 공급 중단의 영향을 완화할 수 있었다. 같은 수직 계열에 속한 기업 간의 협업은 전체 산업이 의존하는 공급업체를 부각시킬 수 있다. 또한 여러 산업에 중요한 자재나 부품을 공급하는 공급업체는 공급망의 깊숙한 곳에 숨어 있을 수 있다. 공급망을 최대한 깊이 있게 매핑하는 것은 이러한 단일 지점 장애 위험을 발견하기 위한 중요한 단계다. 숨겨진 종속성을 발굴한 후 기업은 백업 공급업체를 개발할 수 있다. IT 인프라와 이를 지원하는 기업의 생태계는 일반적으로 공급망 관리자의 권한에 속하지 않는다. 그러나 위에서 설명한 일부 기술은 크라우드스트라이크와 같은 위기가 발생할 가능성을 줄이는 데 도움이 될 수 있다.
기술 업계에서 공급업체 통합을 촉진하는 시장의 힘을 통제하기 위한 규제 프레임워크도 검토가 필요할 수 있다. 두 OEM (최종생산자) 간의 합병에 대응하는 대신, 경우에 따라서는 관련 회사 또는 합병된 회사가 공급망이나 IT 인프라에 깊이 묻혀 있는 단일 지점 장애 위험에 대해 예의주시하도록 유도하는 것이 더 나을 수 있다. 미국 정부가 반도체 마이크로프로세서와 같은 전략적으로 필수적인 제품과 관련된 공급 관련 위험을 줄이기 위해 어느 정도 시도하고 있는 것도 바로 이 때문이다. 더 넓게 보면, 결국 크라우드스트라이크 사태는 기업과 정부가 복잡하고 전문화된 세상에서 발생하는 단일 지점 취약성에 주의를 기울여야 한다는 경종을 울렸다.
출처: 링크드인, MIT대 요시 셰피 교수 The Multi-Faceted Threat of Single-Point Failures August 13, 2024
저작권자 ⓒ 리스크인텔리전스리뷰, 무단 전재 및 재배포 금지