국내 첫 AI 데이터센터…역량 집결 자체 센터 ‘각 세종’에서 테크밋업 설계·서비스 이중화 통해 재난 대비 차세대 기술 액침냉각 POC 검증 중 풀스택 AI 역량 기반 GPUaaS 제공

“네이버의 첫 화면은 잠깐의 멈춤(다운타임·downtime)도 허용할 수 없다. 이중화를 통해 한 데이터센터에 문제가 생기더라도, 이를 우회해서 서비스를 정상화할 수 있다.”

이상준 네이버클라우드 CIO(최고정보책임자)는 지난 27일 세종시 ‘각 세종’에서 열린 테크밋업 행사에서 글로벌 수준의 인공지능(AI) 인프라 기술 역량을 통해 24시간 끊김없이 네이버 서비스를 운영하고 있다고 밝혔다. 데이터센터의 설계뿐만 아니라 서비스 이중화까지 마쳐 화재 등 장애 상황이 발생하더라도 곧장 복구할 수 있다는 의미다.

네이버클라우드는 자체 데이터센터를 통해 쌓은 AI 인프라 기술 역량을 ‘서비스형 그래픽처리장치(GPUaaS)’ 모델로 발전시킨다는 구상도 밝혔다. 데이터센터부터 AI 플랫폼까지 구축해 온 ‘풀스택’ 역량을 기반으로 국내 기업이 손쉽게 AI를 활용할 수 있는 생태계를 만들어갈 계획이다.

각 세종은 국내 첫 AI 데이터센터로, 기존 인터넷데이터센터(IDC)가 수행하던 저장·처리 기능을 넘어 AI 학습과 추론이 동시에 이뤄지는 고밀도 그래픽처리장치(GPU) 연산 공간이다. 축구장 41개 크기인 29만4000㎡(약 8만9000평) 부지에 자리 잡은 ‘하이퍼스케일 데이터센터’로 전체 증설 시 최대 270MW 전력을 공급받고, 60만 유닛(unit) 서버를 수용할 수 있다.

각 세종은 화재 등 장애 상황에서도 서비스가 멈추지 않도록 전력, 냉각, 서버 운용 체계를 완전히 분리하면서도 유기적으로 통합한 이중화 구조로 설계됐다. GPU 서버의 고전력 특성에 맞게 UPS(무정전 전원 장치)와 배전 설비를 재배치해 장애 전파를 구조적으로 차단했다. GPU 등 고성능 자원은 실시간 상태 감시와 자동 복구 기능을 통해 장애 발생 시에도 안정적인 서비스 연속성을 유지할 수 있다.

또 데이터센터 간 이중화를 통해 한 곳에 문제가 발생하더라도 서비스를 유지할 수 있도록 했다. 노상민 네이버클라우드 데이터센터 통합센터장은 “화재가 발생하면 진화에 한계가 있고, 복구에도 시간이 걸린다”며 “네이버는 자체 데이터센터인 ‘각 춘천’과 각 세종뿐만 아니라 수도권, 충청권, 경남권 등에서 상당히 많은 IDC를 임차해 서비스를 이원하하고 있다”고 강조했다.

더불어 GPU 전력 밀도가 높아짐에 따라 차세대 냉각 기술도 내재화하고 있다. 각 세종은 직접외기·간접외기·냉수를 병행하는 하이브리드 냉각 시스템을 적용한 데 이어 직접액침냉각(DLC) 기술검증(POC)도 진행 중이다. 노 센터장은 “당장 엔비디아 GPU B200부터 DLC가 필요해 기술을 준비하고 있다”며 “내년 4월까지 POC를 마친 뒤 2027년 2차 적용되는 서버실부터는 DLC를 구축할 예정”이라고 설명했다.

네이버는 데이터센터를 통해 자체 AI 플랫폼을 운영해 온 기술력을 기반으로 GPUaaS를 공급할 예정이다. 단순히 GPU를 확보하는 것을 넘어, 네이버가 그간 쌓아온 운용 역량을 기반으로 국내 기업에 AI 인프라 서비스를 제공한다는 구상이다.

노 센터장은 “네이버는 국내 IT 기업 중 가장 많은 서버를 사용하는 사업자로서, 트렌드에 대한 이해를 바탕으로 데이터센터를 만들고 운영할 수 있다”며 “반면 상업용으로 지어진 대부분의 AI 데이터센터 우선 구축한 뒤 고객에 맞춰 설비 구조나 보안을 변경해 한계가 있다”고 강조했다.

세종=권제인 기자