‘먹통 막기 위해 투자금액 세 배 쏟아붓겠다’는 카카오…과연?

입력 2022.12.07 (16:00)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.


[고우찬 / 카카오 비상대책위원회 재발방지대책 공동 소위원장]
"카카오는 언급한 개선 사항들을 추가하기 위해 향후 5년간은 지난 5년간 투자금액의 약 3배 이상 규모로 투자를 확대하겠습니다."

[남궁훈 / 카카오 비상대책위원회 재발방지대책 공동 소위원장]
"완벽하지 못했던 이중화를 비롯해 카카오가 부족했던 모든 부분을 개선할 수 있도록 미래에 대한 투자를 하도록 하겠습니다."

카카오가 업계 개발자들과 기술 분야를 공유하고 논의하는 카카오 개발자 컨퍼런스 'if kakao dev 2022'가 오늘(7일) 온라인상에서 개막했습니다.

통상의 카카오 개발자 컨퍼런스가 기술 개발과 IT 동향을 발표하고 공유하는 자리지만 이번은 조금 달랐습니다. 지난 10월 발생한 카카오 먹통 사태에 대한 회고와 대책을 공개하는 세션으로 포문을 열었습니다.

■ "이중화 미흡·복구 인력 및 자원 부족·위기 대응 거버넌스 부재"

먼저, 카카오가 밝힌 서비스 장애 원인은 크게 세 가지였습니다. 첫째는 데이터센터 간 이중화 미흡. 둘째는 시스템을 복구하기 위한 운영 도구 등의 이중화 미조치. 마지막으로 장애에 대응하기 위한 인력과 자원의 불충분입니다.

여기에 더해 '위기 대응에 대한 회사 차원의 거버넌스 부재'도 카카오 내부에서 언급된 것으로 알려졌습니다.

카카오 개발자 컨퍼런스 ‘if kakao dev 2022’  발췌카카오 개발자 컨퍼런스 ‘if kakao dev 2022’ 발췌

이는 과학기술정보통신부가 하루 전 발표한 판교데이터센터 화재 및 카카오 서비스 장애 원인과 크게 다르지 않았습니다. 앞서 과기정통부는 이중화 미흡으로 카카오의 대기 서버 시스템이 제대로 작동하지 않아 최대 127시간 33분간 서비스 장애가 일어났다고 밝혔습니다.

이종호 과기정통부 장관은 "카카오톡, 다음 등 카카오 서비스 대부분의 핵심 기능이 판교 데이터센터에 집중되어 있었다"며 "판교 데이터센터 사고 시 카카오 대부분 서비스가 즉각 영향을 받게 되는 구조"로 파악됐다고 설명했습니다.

■ 카카오가 발표한 재발 방지 대책은? '5년간 투자금액 세 배 쏟겠다'

그렇다면 카카오가 컨퍼런스를 통해 공개한 재발방지대책은 무엇일까요? 크게 아래 세 가지로 요약할 수 있습니다.

① 완벽한 이중화
재발 방지를 위한 기술적 개선으로 카카오는 '완벽한 이중화'를 선언했습니다.

이채영 카카오 비상대책위 재발방지대책소위원회 부위원장은 이날 키노트(Keynote)에서 "카카오는 모호하게 사용된 이중화라는 개념을 적극적으로 해석해 인프라 하드웨어 설비부터 서비스 애플리케이션 전체 시스템에 철저하게 실행해가겠다."라고 밝혔습니다.

이를 위해 현재 두 곳인 카카오의 메인 백본 센터를 세 곳으로 확대하겠다고 밝혔습니다. 이중화로 인해 데이터센터 간에 늘어날 트래픽에 대응하기 위해 확장성을 고려한 설비투자도 병행해 진행할 방침입니다. 대용량 트래픽 전송이 필요한 서비스의 데이터센터 간 삼중화를 위해 별도 전용망도 구성하겠다고도 말했습니다.

카카오는 현 시점으로 데이터센터 이중화를 완료했으며 이른 시일 안에 삼중화에 나서겠다고 강조했습니다.

② 위기 대응 인력과 자원 투자
이번 먹통 사태에 책임을 지고 공동대표 자리에서 내려온 남궁훈 비상대책위원회 재발방지대책 공동 소위원장은 키노트를 통해 "이번 사고를 통해 카카오에서 일어나게 될 다양한 변화 가운데 가장 큰 것은 인프라 조직의 재구성"이라고 말했습니다.

카카오 엔지니어링 전문가들로 이루어진 전담조직을 꾸려 안정적인 서비스 환경을 조성하고 투자하는 데 집중할 거라는 겁니다. 해당 조직은 기존 개발조직에서 분리돼 별도의 상위 조직으로 존재하게 된다고도 설명했습니다.

카카오 측은 또, 이번 재발방지대책에서 언급한 개선 사항들을 실현하기 위해 향후 5년간은 지난 5년간 투자금액의 약 3배 이상 규모로 투자를 확대하겠다고도 밝혔습니다.

③ 자체 데이터센터에 강화된 방화 설계 반영
현재 SK가 운영하는 판교 데이터센터의 상면 공간을 임차해 쓰고 있는 카카오는 2024년을 목표로 경기도 안산에 자체 데이터센터를 짓고 있습니다.

카카오가 키노트를 통해 밝힌 강화된 방화 설계를 보면, 안산의 자체 데이터센터는 UPS 실과 배터리 실이 방화 격벽으로 각각 분리 시공됩니다.

안산 카카오 데이터센터 조감도 (카카오 제공)안산 카카오 데이터센터 조감도 (카카오 제공)

이번 판교데이터센터 화재에 있어 배터리 실 발화가 지목되고 있는 만큼 안산 자체 데이터센터에 이를 반영해 배터리 실에서 불이 나더라도 나머지 시설 작동에 영향을 주지 않게끔 하겠다는 겁니다.

이 밖에도 층별로 배치된 소화 가스를 서로 연동해 가용 용량을 늘릴 계획입니다.

카카오 개발자 컨퍼런스 ‘if kakao dev 2022’  발췌카카오 개발자 컨퍼런스 ‘if kakao dev 2022’ 발췌

이를 통해서도 불을 끄기 어려울 경우 화재 발생 구간을 차단하고 안에 냉각수를 채워 방염과 방역을 하는 구조를 반영할 계획이라고도 카카오는 설명했습니다.

■ 재발방지 '장밋빛 청사진' 내놨지만…서비스 피해 보상 범위는 '안갯속'

카카오는 이번에 자체적으로 수립한 재발방지대책을 발표하면서 "이미 사고는 발생했기에 늦었지만, 지금이라도 반성하고 개선해 나가려고 한다"고 소회를 밝혔습니다.

"'나름대로 체계를 갖췄다고 생각해왔지만, 결과적으로는 부족했다'는 것이 이번 사고에서 얻은 교훈이었다"고도 회고했습니다.

카카오가 밝힌 재발방지대책은 어찌 보면 당연히 했어야 하는 것들이고 그리 혁신적인 대책은 아니었습니다.

실제 고우찬 카카오 비상대책위원회 재발방지대책 공동 소위원장은 키노트에서 "지금까지 말한 여러 가지 개선 사항들은 사실 엔지니어 입장에서는 발상해내기 어려운 획기적인 아이템들은 아닐 수 있다."라고 운을 떼기도 했습니다.

이어 그는 "하지만 몇백억 혹은 몇천억 단위의 과감한 투자 결정이 있어야만 실행할 수 있는 것들이 대부분이다."라면서 "착실하게 실행해 서비스 중단으로 받은 불편이 되풀이되지 않도록 최선을 다하겠다고"말했습니다.

카카오가 언급한 재발방지대책을 그대로 실현한다면 지난 10월 일어난 대규모 먹통 사태는 되풀이되지 않을지도 모릅니다. 하지만 대책의 강제성이 없고 검증도 쉽지 않다는 점에서 실효성에 대한 의문은 남습니다.

카카오의 대책이 선언적인 발표에 그치지 않으려면 이행에 대한 투명한 공개와 검증이 지속적으로 필요하다는 지적이 나오는 이유기도 합니다.

이와 별도로 진행 중인 카카오의 서비스 피해 보상도 여전히 '안갯속'입니다. 10만 5천 건에 달하는 피해 사례가 접수됐지만, 구체적인 보상 범위는 아직 정해지지 않았습니다. 이번 카카오 컨퍼런스에서도 서비스 장애에 따른 보상은 언급되지 않았습니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • ‘먹통 막기 위해 투자금액 세 배 쏟아붓겠다’는 카카오…과연?
    • 입력 2022-12-07 16:00:12
    취재K

[고우찬 / 카카오 비상대책위원회 재발방지대책 공동 소위원장]
"카카오는 언급한 개선 사항들을 추가하기 위해 향후 5년간은 지난 5년간 투자금액의 약 3배 이상 규모로 투자를 확대하겠습니다."

[남궁훈 / 카카오 비상대책위원회 재발방지대책 공동 소위원장]
"완벽하지 못했던 이중화를 비롯해 카카오가 부족했던 모든 부분을 개선할 수 있도록 미래에 대한 투자를 하도록 하겠습니다."

카카오가 업계 개발자들과 기술 분야를 공유하고 논의하는 카카오 개발자 컨퍼런스 'if kakao dev 2022'가 오늘(7일) 온라인상에서 개막했습니다.

통상의 카카오 개발자 컨퍼런스가 기술 개발과 IT 동향을 발표하고 공유하는 자리지만 이번은 조금 달랐습니다. 지난 10월 발생한 카카오 먹통 사태에 대한 회고와 대책을 공개하는 세션으로 포문을 열었습니다.

■ "이중화 미흡·복구 인력 및 자원 부족·위기 대응 거버넌스 부재"

먼저, 카카오가 밝힌 서비스 장애 원인은 크게 세 가지였습니다. 첫째는 데이터센터 간 이중화 미흡. 둘째는 시스템을 복구하기 위한 운영 도구 등의 이중화 미조치. 마지막으로 장애에 대응하기 위한 인력과 자원의 불충분입니다.

여기에 더해 '위기 대응에 대한 회사 차원의 거버넌스 부재'도 카카오 내부에서 언급된 것으로 알려졌습니다.

카카오 개발자 컨퍼런스 ‘if kakao dev 2022’  발췌
이는 과학기술정보통신부가 하루 전 발표한 판교데이터센터 화재 및 카카오 서비스 장애 원인과 크게 다르지 않았습니다. 앞서 과기정통부는 이중화 미흡으로 카카오의 대기 서버 시스템이 제대로 작동하지 않아 최대 127시간 33분간 서비스 장애가 일어났다고 밝혔습니다.

이종호 과기정통부 장관은 "카카오톡, 다음 등 카카오 서비스 대부분의 핵심 기능이 판교 데이터센터에 집중되어 있었다"며 "판교 데이터센터 사고 시 카카오 대부분 서비스가 즉각 영향을 받게 되는 구조"로 파악됐다고 설명했습니다.

■ 카카오가 발표한 재발 방지 대책은? '5년간 투자금액 세 배 쏟겠다'

그렇다면 카카오가 컨퍼런스를 통해 공개한 재발방지대책은 무엇일까요? 크게 아래 세 가지로 요약할 수 있습니다.

① 완벽한 이중화
재발 방지를 위한 기술적 개선으로 카카오는 '완벽한 이중화'를 선언했습니다.

이채영 카카오 비상대책위 재발방지대책소위원회 부위원장은 이날 키노트(Keynote)에서 "카카오는 모호하게 사용된 이중화라는 개념을 적극적으로 해석해 인프라 하드웨어 설비부터 서비스 애플리케이션 전체 시스템에 철저하게 실행해가겠다."라고 밝혔습니다.

이를 위해 현재 두 곳인 카카오의 메인 백본 센터를 세 곳으로 확대하겠다고 밝혔습니다. 이중화로 인해 데이터센터 간에 늘어날 트래픽에 대응하기 위해 확장성을 고려한 설비투자도 병행해 진행할 방침입니다. 대용량 트래픽 전송이 필요한 서비스의 데이터센터 간 삼중화를 위해 별도 전용망도 구성하겠다고도 말했습니다.

카카오는 현 시점으로 데이터센터 이중화를 완료했으며 이른 시일 안에 삼중화에 나서겠다고 강조했습니다.

② 위기 대응 인력과 자원 투자
이번 먹통 사태에 책임을 지고 공동대표 자리에서 내려온 남궁훈 비상대책위원회 재발방지대책 공동 소위원장은 키노트를 통해 "이번 사고를 통해 카카오에서 일어나게 될 다양한 변화 가운데 가장 큰 것은 인프라 조직의 재구성"이라고 말했습니다.

카카오 엔지니어링 전문가들로 이루어진 전담조직을 꾸려 안정적인 서비스 환경을 조성하고 투자하는 데 집중할 거라는 겁니다. 해당 조직은 기존 개발조직에서 분리돼 별도의 상위 조직으로 존재하게 된다고도 설명했습니다.

카카오 측은 또, 이번 재발방지대책에서 언급한 개선 사항들을 실현하기 위해 향후 5년간은 지난 5년간 투자금액의 약 3배 이상 규모로 투자를 확대하겠다고도 밝혔습니다.

③ 자체 데이터센터에 강화된 방화 설계 반영
현재 SK가 운영하는 판교 데이터센터의 상면 공간을 임차해 쓰고 있는 카카오는 2024년을 목표로 경기도 안산에 자체 데이터센터를 짓고 있습니다.

카카오가 키노트를 통해 밝힌 강화된 방화 설계를 보면, 안산의 자체 데이터센터는 UPS 실과 배터리 실이 방화 격벽으로 각각 분리 시공됩니다.

안산 카카오 데이터센터 조감도 (카카오 제공)
이번 판교데이터센터 화재에 있어 배터리 실 발화가 지목되고 있는 만큼 안산 자체 데이터센터에 이를 반영해 배터리 실에서 불이 나더라도 나머지 시설 작동에 영향을 주지 않게끔 하겠다는 겁니다.

이 밖에도 층별로 배치된 소화 가스를 서로 연동해 가용 용량을 늘릴 계획입니다.

카카오 개발자 컨퍼런스 ‘if kakao dev 2022’  발췌
이를 통해서도 불을 끄기 어려울 경우 화재 발생 구간을 차단하고 안에 냉각수를 채워 방염과 방역을 하는 구조를 반영할 계획이라고도 카카오는 설명했습니다.

■ 재발방지 '장밋빛 청사진' 내놨지만…서비스 피해 보상 범위는 '안갯속'

카카오는 이번에 자체적으로 수립한 재발방지대책을 발표하면서 "이미 사고는 발생했기에 늦었지만, 지금이라도 반성하고 개선해 나가려고 한다"고 소회를 밝혔습니다.

"'나름대로 체계를 갖췄다고 생각해왔지만, 결과적으로는 부족했다'는 것이 이번 사고에서 얻은 교훈이었다"고도 회고했습니다.

카카오가 밝힌 재발방지대책은 어찌 보면 당연히 했어야 하는 것들이고 그리 혁신적인 대책은 아니었습니다.

실제 고우찬 카카오 비상대책위원회 재발방지대책 공동 소위원장은 키노트에서 "지금까지 말한 여러 가지 개선 사항들은 사실 엔지니어 입장에서는 발상해내기 어려운 획기적인 아이템들은 아닐 수 있다."라고 운을 떼기도 했습니다.

이어 그는 "하지만 몇백억 혹은 몇천억 단위의 과감한 투자 결정이 있어야만 실행할 수 있는 것들이 대부분이다."라면서 "착실하게 실행해 서비스 중단으로 받은 불편이 되풀이되지 않도록 최선을 다하겠다고"말했습니다.

카카오가 언급한 재발방지대책을 그대로 실현한다면 지난 10월 일어난 대규모 먹통 사태는 되풀이되지 않을지도 모릅니다. 하지만 대책의 강제성이 없고 검증도 쉽지 않다는 점에서 실효성에 대한 의문은 남습니다.

카카오의 대책이 선언적인 발표에 그치지 않으려면 이행에 대한 투명한 공개와 검증이 지속적으로 필요하다는 지적이 나오는 이유기도 합니다.

이와 별도로 진행 중인 카카오의 서비스 피해 보상도 여전히 '안갯속'입니다. 10만 5천 건에 달하는 피해 사례가 접수됐지만, 구체적인 보상 범위는 아직 정해지지 않았습니다. 이번 카카오 컨퍼런스에서도 서비스 장애에 따른 보상은 언급되지 않았습니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료