• 검색

카톡 멈추는 날 사라질까?…카카오, 첫 IDC 열었다

  • 2024.06.12(수) 12:00

안정성에 '방점'…화재대응시스템 특허출원
정신아 "일상의 순간 멈추지 않도록 할 것"

카카오 데이터센터 안산의 입구./사진=김동훈 기자

"인터넷데이터센터(IDC)와 같은 인프라에 적극 투자해 개인 유저뿐 아니라 기업, 소상공인들의 일상의 순간이 멈추지 않도록 최선을 다하겠습니다."

정신아 카카오 대표는 지난 11일 안정성에 방점을 찍은 첫번째 자체 IDC '카카오 데이터센터 안산'에서 기자간담회를 열고 이같이 밝혔다.

경기도 안산시 한양대 에리카(ERICA) 캠퍼스에 위치한 카카오 데이터센터 안산은 연면적 4만7378㎡의 '하이퍼스케일'(10만대 이상의 서버를 운영할 수 있는 초대형 데이터센터) 규모를 자랑한다. 이를 통해 4000개의 랙, 총 12만대의 서버를 보관할 수 있고, 6EB(엑사바이트)의 데이터를 저장할 수 있다.

국내 정보기술(IT) 기업 가운데 가장 많은 트래픽을 발생시키는 서비스 중 하나인 '카카오톡'을 운영하는 카카오는 2022년 판교 SK C&C 데이터센터 화재로 인해 장기간 서비스 중단 사태를 겪은 뒤 지난해 9월 이번 자체 IDC를 준공하고 올해 1월부터 가동에 돌입한 바 있다.

정 대표는 "내부적으로는 '1015 사태'라고 부르는데, SK 판교 데이터센터 화재 발생으로 서비스가 긴시간 멈춰 있었다"며 "트라우마와 같은 뼈아픈 경험을 반복되지 않기 위해 철저하게 원인을 분석하고 규명한 결과를 데이터센터 안산의 설계에도 반영하고 끊임없이 보완했다"고 말했다.

정신아 카카오 대표가 11일 '카카오 데이터센터 안산'에서 기자 간담회를 진행하고 있다./사진=카카오 제공

국민메신저, 24시간 중단 없게

모바일 메신저 카카오톡은 월간 사용자만 4870만명에 달하는 국민 메신저다. 금융·콘텐츠·모빌리티 등 17만개가 넘는 외부 서비스와도 연동돼 사회 인프라 역할을 하고 있다. 이를 감안해 카카오는 데이터센터 안산이 24시간 무중단 운영이 가능하도록 각종 시스템을 구축했다고 강조했다.

전력회사로부터 전기를 공급받는 전력망부터 서버에 전기를 최종 공급하기까지 모든 과정과 통신회사에서 서버까지 통신을 제공하는 과정, 냉동기부터 서버실까지의 냉수 공급망 등 운영설비를 이중화한 것이 대표적이다. 

이와 함께 데이터와 운영도구도 다중화해 일부 시스템에 문제가 발생하더라도 이용자가 체감하는 불편을 최소화하고, 복구 시간을 최대한 줄일 수 있는 환경을 구축했다고 설명했다.

이런 까닭에 같은 층이라도 어떤 장비가 있는지에 따라 층고가 6미터가량 다른 특이한 구조를 갖춘 점이 눈길을 끌었다. 

카카오 관계자는 "서버룸, 전기실, 무정전 전원장치(UPS), 냉방에 요구되는 층고가 모두 다르고 배관이나 케이블에 따른 차이도 있어 6~11m 정도까지 층고가 다르다"고 설명했다. 높은 층고를 적용하다보니 데이터센터의 높이도 아파트 17층 수준에 달했다.

또한 대규모 서버를 차질 없이 운영할 수 있는 무정전 전력망도 갖췄다. 전력 공급 중단에 대비하기 위해 주전력의 100% 용량에 해당하는 전력을 즉시 공급받을 수 있는 예비 전력망을 마련하고, 두 곳의 변전소 모두 문제가 발생하더라도 비상 발전기를 통해 전력 중단없이 데이터센터를 가동할 수 있도록 설계했다.

데이터센터간 연결과 안정성도 강화했다. 서비스가 이루어지는 주 데이터센터 외에 물리적으로 이격된 최소 두 곳의 데이터센터에 데이터와 운영도구의 사본을 만들고 실시간으로 업데이트하고 있으며, 삼중화까지도 진행하고 있다. 이를 위해 각 데이터센터에 충분한 공간과 서버를 확보하고, 데이터센터 간 원활한 연결을 위해 약 10Tbps(초당 테라비트)의 대역폭을 확보하기도 했다.

카카오 데이터센터 안산의 전경./사진=카카오 제공

화재 예방 시스템 '이상무'

특히 카카오톡이 화재로 인해 서비스 중단 사태를 겪은 만큼 카카오 데이터센터 안산은 화재나 지진, 홍수, 해일, 태풍 등 각종 자연재해·재난에도 서비스가 중단없이 운영될 수 있는 재난 설계를 적용했다.

무엇보다 화재 조기 진화를 위한 대응 시스템이 강점이다. UPS실과 배터리실을 방화 격벽으로 분리 시공하고 모든 전기 판넬에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하도록 설계했다.

회사 관계자는 "화재 진압이 매우 어려운 리튬 이온 배터리 화재에 대비해 화재대응시스템을 자체 개발, 적용했다"며 "해당 시스템은 현재 특허 출원했다"고 말했다.

카카오가 개발한 화재대응시스템은 크게 4단계로 이뤄졌는데, 우선은 배터리에서 화재가 발생하면 내부 감시 시스템이 이를 자동으로 감지해 화재의 영향이 있는 배터리의 전원을 차단하고, 방염천 등으로 불이 옮겨붙는 걸 막는다.

이후 단계적으로 소화 약제를 분사해 초기 진화를 시도하고, 냉각수를 지속적으로 분사해 발화 원천을 차단한다. 이를 통해서도 불이 꺼지지 않으면 소방서와 연계해 데이터센터 맞춤형 화재 진압을 하게 된다는 것이다.

이 데이터센터는 LG에너지솔루션이나 삼성SDI가 아니라 SK온의 배터리 제품만 적용한 점도 눈길을 끌었다. 회사 관계자는 "특정사 배터리만 사용하는 부분이 문제될 것은 없다"며 "제조사마다 배터리의 장단점과 특징이 있을 것이지만 어떤 제조사 배터리를 사용하느냐보다는 화재 대응 시스템을 자체적으로 마련해 이를 예방하는 게 더 중요하다"고 말했다.

지진 대응을 위해 특등급의 내진 설계도 적용했다. 이는 국내 원자력발전소의 내진설계 기준에 준하는 수준으로, 리히터 6.5이상의 강진을 견딜 수 있는 성능이다. 안산시 지역 최대 풍속을 감안해 28㎧의 강풍도 견딜 수 있도록 대비했다.

홍수 피해로부터 데이터를 안전하게 지킬 수 있도록 지상1층 바닥을 주변 지표면보다 약 1.8m 가량 높이 설계했고, 서버와 배터리, UPS 등 주요 설비도 모두 지상층에 배치해 침수 가능성에 대비한 것도 특징이다. 평균 해발 고도 10m 지역에 자리잡고 있고, 시화방조제로부터 직선 거리로 18㎞ 이상 떨어져 있어 해일 발생 때도 안정적인 데이터센터 운영이 가능하다.

카카오 데이터센터 안산의 내부 시설 모습./사진=카카오 제공

안산은 끝 아닌 시작

이날 카카오는 데이터센터 안산이 가동된 이후에도 서비스 중단 사태가 발생했다는 점을 지적받기도 했다. 최근 과학기술정보통신부는 지난 5월에만 3차례 카카오톡 서비스 장애가 발생한 것과 관련 시스템 개선 계획과 함께 시정 결과를 3개월 내 제출하라고 요구했다.

 

고우찬 카카오 인프라기술 성과리더는 이에 대해 "최근 3번의 장애들은 데이터센터 안산과는 상관이 없다"며 "데이터센터 안산은 이번주에서 다음주 사이 해당 서비스에 투입돼 트래픽을 처리하게 될 것"이라고 말했다. 

카카오는 IDC를 계속해서 확보해 서비스 장애를 최소화하고 미래 서비스에도 대비한다는 구상이다. 현재는 부지 선정 작업에 들어갔다. 정 대표는 "카카오의 자체 데이터센터는 안산이 처음이지만 끝은 아니다"라며 "제2데이터센터 건립도 추진해 AI 기반 서비스와 미래의 기술 환경에 효과적으로 대응할 수 있도록 할 것"이라고 말했다.

새로운 IDC는 인공지능(AI) 기술 기반 서비스 운영을 포함해 미래 기술환경에 효과적으로 대응할 수 있도록 HPC(High performance computing) 데이터센터로 특화 설계할 계획이다. 데이터센터 안산과 마찬가지로 24시간 무중단 운영을 위한 전력, 통신, 냉방의 다중화를 적용하고 맞춤형 자연 재해 대응 시스템 등을 반영할 방침이다.

정 대표는 SM엔터테인먼트를 인수하는 과정에서 시세조종을 했다는 혐의로 김범수 창업자를 비롯해 주요 경영진이 수사를 받는 등 창사 이래 최대 위기를 겪고 있는 카카오그룹 운영 방향도 이날 일부 소개했다. 

그는 "위기 속에 대표이사가 되자마자 처음 붙은 키워드가 쇄신이었는데, 쇄신은 기존의 나를 부정해야 하는 것"이라며 "카카오에서는 문제의 근본 원인을 찾기 위해 많은 직원을 만나 단기,중기,장기 과제를 찾았고 구조, 프로세스, 문화를 바꾸고 있다"고 했다. 

이어 "카카오그룹의 경우 새로운 거버넌스와 의사결정체계를 만들기 위해 리더 선임 작업을 했다"며 "그동안 셋업 과정이 있었다면 앞으로는 이를 공고히 만드는 작업을 하게 될 것"이라고 전했다.

naver daum
SNS 로그인
naver
facebook
google