올트먼, 임직원에 ‘코드 레드’ 발령 개인비서 등 기타서비스 출시연기 “경쟁사 공세…선두주자 우위 흔들”

미국 인공지능(AI) 챗봇 챗GPT 개발사 오픈AI의 샘 올트먼 최고경영자(CEO·사진)가 사내에 ‘적색 경보(code red)’를 발령했다. 챗GPT 출시 3년 만에 기술력이 구글 제미나이3.0 등 경쟁사들에 밀리고 있다는 평가가 나오자 위기감을 드러낸 것이다. 이는 선도 기업의 우위가 구조적으로 흔들리기 시작했음을 보여주는 것이란 분석이 나온다.

2일(현지시간) 월스트리트저널(WSJ)에 따르면, 올트먼 CEO는 전날 임직원 대상 사내 메모를 통해 ‘적색 경보’를 발령하고 챗GPT 품질 개선에 집중하고자 다른 서비스 출시를 연기하기로 했다.

올트먼 CEO는 이에 따라 “광고를 비롯해 건강·쇼핑 AI 에이전트, 개인비서 서비스 ‘펄스’ 등 오픈AI가 추진하던 프로젝트들을 미룰 예정”이라고 말했다.

그러면서 그는 “잠정적인 인력 재배치를 유도하고 챗GPT 성능 개선 담당자들과는 일일 회의를 할 것”이라고 언급했다.

올트먼 CEO는 “다음 주 출시 예정인 새로운 추론 모델이 구글의 최신 AI 모델을 앞서고 있으며 회사가 다른 여러 부문에서도 여전히 좋은 성과를 내고 있다”고 덧붙였다.

챗GPT 앱을 총괄하는 닉 털리 오픈AI 부사장은 같은 날 엑스(X·옛 트위터) 게시글에서 “현재 우리의 초점은 챗GPT를 더욱 유능하게 만들고, 성장을 지속시키며, 세상으로의 접근을 확장하는 것”이라며 “동시에 더 직관적이고 개인화된 느낌을 주도록 만들 것”이라고 말했다.

올트먼 CEO가 이 같은 사내 메시지를 보낸 것은 최근 구글 등 경쟁사들의 자체 AI 모델 출시 소식과 관련 있다.

챗GPT를 능가하는 성능의 AI 모델이 나오기 시작하면서 핵심 경쟁력이 뒤처질 수 있다는 우려가 반영된 것이다.

실제 구글의 제미나이 3.0은 챗GPT를 능가한다는 분석이 지배적이다. 제미나이 3.0은 AI챗봇 평가사이트 ‘LM아레나’ AI 성능 평가에서 1501점(LM아레나 리더보드 기준)으로 1위를 차지했다.

또 가장 어려운 AI 성능평가로 불리는 ‘인류 마지막 시험(HLE)’에서도 최고점수(37.5%)를 받으며 오픈AI의 GPT 5 프로(31.6%)를 앞섰다.

고급 과학 지식을 시험하는 ‘GPQA Diamond’ 시험에선 91.9%의 정확도를 기록해 박사급(PhD-level) 추론 능력을 입증했으며 챗GPT 5.1의 능력을 뛰어넘었다.

세일즈포스 마크 베니오프 CEO는 구글의 ‘제미나이 3.0’에 대해 “추론, 속도, 이미지, 비디오 등 모든 것이 더 선명하고 빨라졌다. 이는 정말 놀라운 발전이다”고 극찬했다.

AI 챗봇 ‘클로드’를 운영하는 앤트로픽도 추론과 전문 작업에 적합한 최상위 모델 ‘클로드 오퍼스4.5’의 신규 버전을 출시했다. 앤트로픽은 기업 고객들의 호평을 받으며 영향력을 확대 중이다.

니혼게이자이신문은 오픈AI가 챗GPT를 출시한 직후인 2022년 12월에 대화형 AI 경쟁에서 뒤처진 구글 경영진이 내부적으로 ‘코드 레드’를 발령한 점을 상기한 뒤 “이번에는 상황이 뒤바뀌어 오픈AI의 선도적 지위가 흔들리고 있음을 보여준다”고 분석했다.

이어 “구글·앤트로픽·xAI·딥시크 등 경쟁사들의 기술과 자본 공세가 동시에 가속화하면서 오픈AI는 향후 1~2년이 생존과 전략적 재정립의 분기점이 될 가능성이 커지고 있다”고 전했다. 김영철 기자