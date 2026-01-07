네이버, 허깅페이스 인코더정보 생략 눈과 귀 넘어 핵심 ‘지능’ 中차용 주장 “인코더 확인 가능 논문명 기재한 것”

인공지능(AI) 독자기술 논란이 확산되고 있다. 네이버로까지 번졌다.

하이퍼클로바X를 앞세워 ‘AI 주권’을 강조해 온 네이버클라우드의 기술적 진정성이 시험대에 올랐다. 정부 주도의 ‘독자 AI 파운데이션 모델’(독파모) 프로젝트에서 중국산 모델의 지능을 차용한 수치가 드러나면서다.

네이버클라우드는 핵심 엔진의 자립도를 강조하고 있다. 반면 일각에선 외부 가중치를 사용한 것이 기술 종속이라는 지적도 나온다. 여기에 네이버가 핵심 정보를 상세히 공개하지 않았다는 논란까지 더해지고 있다.

▶“눈과 귀는 중국산” 정보 생략…도마 오른 네이버 AI 기술=7일 본지 확인 결과 네이버클라우드가 최근 선보인 ‘하이퍼클로바X 시드 32B 싱크’의 기술 정보 공개 방식은 이전 모델과 상당한 차이를 보인다.

네이버클라우드는 지난해 7월 모델 공개 시점까지만 해도 글로벌 플랫폼 ‘허깅페이스’(Hugging Face)의 모델 정보(Basic Information) 항목에 인코더의 종류를 상세히 명시해 왔다.

예컨대 ‘하이퍼클로바X 시드 비전 인스트럭트 3B’의 경우 모델 정보에 구글의 ‘SigLIP’을 비전 인코드로 채택했다는 내용이 명확히 공시돼 있다.

반면 하이퍼클로바X 시드 32B 싱크에서는 인코더 정보 항목을 돌연 삭제했다. 기술 보고서(테크 리포트)에서도 ‘큐웬(Qwen)’이라는 직관적인 모델명 대신 ‘Chu et al., 2024’라는 학술적 저자 인용 방식을 사용했다. 큐웬과의 직접적인 연결고리를 짐작하기 어려운 표기다. 또 통상 ‘가중치’(Weight)를 차용했을 땐 ‘borrowed’(차용)라는 학술적 용어를 사용하는 것과 달리, 네이버클라우드는 ‘adopt’(채택)로 표현한 점도 일반적이지 않다.

이와 관련 네이버클라우드 관계자는 “오히려 학술적으로 더 정확한 논문명을 기재한 것이며, 기술 보고서가 모델에 관한 상세한 설명과 명시를 한 리포트”라며 “모델 정보에 빠졌다고 숨기려는 의도는 없었고 바로 확인 가능한 정보”라고 해명했다. 또 12%라는 비중에 대해서는 “8B 옴니모델 자체가 작기 때문에 커보이는 것”이라며 “향후 모델이 스케일업 되면 이 부분은 이슈가 되지 않는다”고 강조했다.

업계에서는 네이버클라우드가 핵심 정보를 삭제한 배경에 주목하고 있다. 일각에서는 중국 모델 차용 사실을 희석하기 위해 인코더의 규모와 역할을 의도적으로 축소하려 한 것 아니냐는 의구심까지 제기하고 있다.

‘하이퍼클로바X 시드 32B 싱크’의 비전 인코더 62개 전체 레이어를 중국 알리바바의 큐웬(Qwen) 2.5와 비교하면 코사인 유사도는 99.5%, 피어슨 상관계수는 99%에 달한다. 오디오 인코더는 피어슨 상관계수가 100%로 나타났다. 하이퍼클로바X 시드 32B 싱크 기준, 인코더가 차지하는 파라미터는 전체의 12%에 이르는 12억8000개 가량이다.

이에 대해 네이버클라우드는 “글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려하여 검증된 외부 인코더를 전략적으로 채택했다”며 “기술적 자립도가 부족해서가 아니라, 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단”이라고 설명했다. 뿐만 아니라 비전 인코더를 “시각 정보를 모델이 이해할 수 있는 신호로 변환하는 ‘시신경’ 역할”이라고 강조했다.

업계의 반론도 거세다. 인코더가 데이터를 해석하는 방식인 ‘가중치’를 그대로 가져왔다면, 이는 설계도만 참고한 수준을 넘어 타사의 지능 체계를 그대로 이식한 것이나 다름없다는 것이다. 업계 관계자는 “눈과 뇌가 붙어 있는 완제품 모델을 가져와 놓고 단순히 시신경이라고 부르는 것은 기술적 평가절하”라며 “인코더 자체가 하나의 작은 LLM(대규모언어모델)”이라고 지적했다.

▶‘AI 주권확보’ 무색해진 ‘중국’ 그림자…과기부 판단 ‘촉각’=업계에서는 ‘프롬 스크래치’(From Scratch·바닥부터 개발)의 판단 기준을 ‘가중치의 직접 학습 여부’로 보고 있다.

따라서 네이버클라우드의 이번 사례가 정부가 표방한 독자 모델 취지에 부합하는지를 두고 이견이 분분하다. 효율성을 이유로 중국산 모델의 가중치를 채택한 게 당초 독파모 프로젝트 공모 지침인 프롬 스크래치 기준에 저촉될 가능성이 제기되기 때문이다.

과학기술정보통신부가 발표한 독파모 프로젝트 공모 안내서에는 “해외 AI 모델의 파인튜닝(미세조정) 등을 통한 파생형 AI 모델 개발은 본 사업의 독파모 개발로 간주되지 않는다”고 명시돼 있다.

업계 관계자는 “가중치가 있는 모델을 가져온 순간 독자 모델이라고 볼 수 없다”면서 “핵심 모듈의 가중치를 100% 가져다 쓰면서 국가대표 독자 모델임을 내세우는 것은 모순”이라고 꼬집었다.

‘라이선스 종속’에 대한 우려도 쏟아지고 있다. 당초 오픈소스로 제공되던 모델이라 하더라도, 알리바바가 향후 사용 허가를 철회하거나 정책을 변경할 경우 해당 모델을 기반으로 한 국내 서비스 전체가 마비될 위험이 상시 존재하기 때문이다.

과기정통부의 기술적 판단에 이목이 쏠린다. 네이버클라우드의 ‘엔지니어링 판단’ 수용 여부가 향후 국내 AI 모델의 독자성 판별을 위한 선례가 될 것으로 보인다.

박혜림 기자