24년간 축적 다차원 데이터 학습

LLM ‘하이퍼클로바X’ 24일 공개

해외 빅테크 선점 시장에 도전장

“구글·MS 잡겠다” 네이버 1조 AI투자

구글 ‘팜2’와 마이크로소프트(MS) GPT4 등 해외 빅테크들이 선점한 초거대 인공지능(AI) 시장에 네이버가 정식으로 도전장을 내민다. 한국형 AI 거대언어모델(LLM) ‘하이퍼클로바X’를 24일 공개하고 네이버만의 경쟁 우위를 확고히 한다는 방침이다. 최수연(사진) 네이버 대표는 지난 21일 주주들에게 보내는 ‘CEO 주주서한’을 통해 “네이버는 그 어느 경쟁 플랫폼도 보유하지 못한 고품질의 광범위한 개인화된 데이터를 보유하고 있으며 이는 네이버의 AI 경쟁력을 더욱 공고히 해줄 것이라 확신한다”며 강한 자신감을 드러냈다.

23일 정보기술(IT) 업계에 따르면 네이버는 자사 대규모 언어 모델 하이퍼클로바X 정식 공개를 위한 마지막 준비에 한창이다.

네이버는 ▷지난 2021년부터 자체 보유한 700PF(페타플롭·1초당 1천조번의 연산 처리가 가능한 컴퓨터 성능 단위) 성능의 슈퍼컴퓨터와 ▷국내 검색어·240만개 오프라인 상점 및 식당에 대한 로컬 리뷰·월 1억건 이상의 결제 처리 건수 등 내부 데이터를 활용해 하이퍼클로바X를 개발해왔다. 국내 기업 가운데서는 최초로 내부 슈퍼 컴퓨터를 활용해 대용량 데이터 처리를 위한 인프라를 구축했다. 하이퍼클로바X를 비롯해 네이버가 기초 연구부터 애플리케이션 개발 및 연동에 이르기까지 지난 3~4년간 AI에 쏟아 부은 누적 투자 규모만 약 1조원에 달한다.

네이버는 이미 재작년에 2040억개 이상의 매개 변수(parameter)를 갖춘 하이퍼클로바를 공개했다. 매개변수는 외부에서 투입되는 데이터를 의미하는 것으로, AI 성능을 가늠할 수 있는 지표다. 전 세계적으로 1000억개 이상의 매개변수를 보유한 LLM은 네이버를 포함해 5곳에 불과하다. 구글의 팜이 5400억개, 오픈AI의 GPT-4를 기반으로 한 MS GPT-4는 조 단위의 매개변수를 갖춘 것으로 추정된다.

업계에서는 현재 구글과 MS가 주도하고 있는 LLM 개발 경쟁에서 국내 대표 플랫폼 기업인 네이버가 두각을 드러낼지에 관심이 쏠린다. 이번에 공개하는 하이퍼클로바X는 기존의 업그레이드 버전이다. 정확한 매개 변수 등은 공개되지 않았다. 기존에 공개된 하이퍼클로바의 경우 구글의 팜, MS GPT-4의 매개변수에 못 미치지만, GPT-3.5를 기반으로 한 오픈AI사의 챗GPT보다는 한국어를 6500배 더 많이 학습한 점이 강점으로 꼽혔다.

네이버는 하이퍼클로바X를 활용한 핵심 서비스 및 애플리케이션을 지속 개발하고 발전시켜 경쟁 우위를 공고히 하겠다는 전략이다. 24일 하이퍼클로바X를 공개하는 자리에서 대화형 AI 서비스인 ‘클로바X’와 차세대 생성형 AI 검색 서비스인 ‘큐:’를 함께 선보인다. 또 이들 서비스를 상거래(커머스), 창작, 금융 등 기존 사업과 결합한다는 방침이다.

최 대표는 주주서한을 통해 “네이버는 온라인 광고-컨텐츠 소비-커머스까지 통합된 유일무이한 플랫폼으로 발전했으며 이런 플랫폼 경쟁력은 생성형 AI 시대에 더욱 빛날 것”이라며 “지난 24년 동안 네이버가 축적한 다차원적인 데이터를 하이퍼클로바X와 결합해 초거대 사용자 행동 모델을 만들 것”이라고 공언했다. 박혜림 기자