[헤럴드경제=김민지 기자] 40대가 되기도 전에 2개의 모바일 앱(애플리케이션) 서비스를 만들어 성공한 ‘창업 귀재’가 있다. 바로 AI 음성 전환 서비스 ‘비토(VITO)’를 운영하는 ‘리턴제로’ 창업자 이참솔(38) 대표다.
그는 2011년 카이스트 동기들과 함께 모바일 커머스 앱 ‘로티플’을 창업했다. 로티플은 가능성을 인정받아 설립 6개월도 채 되기 전에 소프트뱅크벤처스로부터 약 20억원의 투자를 받았다.
이후 이 대표는 카카오에 로티플을 매각하고, 본인도 카카오에 합류했다. 하지만 창업 본능을 막을 수는 없었다. 4년간 근무하던 카카오를 박차고 나온 그는 또다시 험난한 창업의 길에 뛰어들었다.
그렇게 만든 회사가 ‘리턴제로’다. 이달 160억원 규모의 시리즈B 투자를 유치, 누적 투자금 198억원을 이룬 유망한 스타트업으로 발돋움했다. 1년 안에 한국어 음성 인식기술을 영어·중국어 등 메이저 언어 수준만큼 끌어올리는 것이 그의 목표다.
▶커머스→AI 음성 인식…트렌드에 밝은 ‘앱 전문가’
“친구들과 함께 회사를 만들고 팀으로 재미있게 일하는 것, 대학 때부터 친구들과 기숙사에 모여 늦은 새벽까지 얘기하던 꿈이었습니다.”
이 대표는 카이스트 전산학부 재학 때부터 창업에 관심이 많았다. 그러나 졸업 후 비로소 현실적 여건을 갖추게 된 2000년대 후반은 IT 버블이 끝나가던 때였다. 벤처 창업에 너무 큰 위험이 따랐다.
그러던 중 기회가 왔다. 바로 ‘갤럭시’ ‘아이폰’ 등 스마트폰이 출시되며 본격적으로 ‘모바일 시대’가 열린 것이다. 그는 “누군가는 그냥 기능이 조금 더 많은 휴대전화라고 생각했지만 우리는 모바일이라는 새로운 시대가 시작됐다고 생각했다”고 말했다.
그가 2011년 처음 만든 서비스는 위치 기반 소셜커머스 앱 ‘로티플’이다. 로티플은 국내 최초로 사용자가 위치한 지역에서 할인 중인 업체를 찾아 모바일로 결제 후 사용할 수 있도록 했다.
당시 쿠팡, 티몬, 위메프 등이 e-커머스시장에서 각축을 벌이고 있었지만 정작 PC 기반 서비스만 제공할 뿐, 모바일 앱을 갖추고 있지 않았다. 이 대표는 이를 노려 모바일 앱을 공략했다. 가능성을 인정받은 로티플은 설립 6개월 만에 소프트뱅크벤처스로부터 두 번에 걸쳐 20억원을 투자받았다.
그러나 미성숙했던 모바일 결제시장이 걸림돌이 됐다. 실패를 인정하고 방향 전환을 준비하고 있을 때 마침 카카오에서 인수·합병 제안을 받았다.
이 대표와 친구들은 “우리가 부족했다. 다음을 기약하고 첫 시도를 작은 성공으로 마무리하자”며 엑시트(투자금 회수)를 결정하고 카카오에 입사했다. 거기서 카카오톡, 카카오재팬, 카카오택시, 카카오스토리 등 주요 서비스의 초석을 다졌다.
그러나 이 대표는 창업에 대한 꿈을 놓지 않았다. 결국 약 4년 만에 카카오를 퇴사했다. 그 후 2018년 모바일 시대보다 더 큰 파도가 다가오고 있다는 걸 느낀 그는 친구들과 재결합했다. 그때 탄생한 기업이 바로 AI 스타트업 ‘리턴제로’다.
▶“영어권에 뒤처진 한국어 음성 인식, 1년 내 따라잡을 것”
AI 음성 인식 서비스를 만들자고 뜻을 모았으나 그 과정이 쉽지만은 않았다. 전산학부 출신으로 B2C 서비스를 만드는 데 익숙했던 창업 멤버들은 인공지능과 머신러닝 분야에 대해 처음부터 다시 공부해야 했다.
이 대표는 “특히 음성 인식 분야는 역사가 깊어 경험이 없는 사람들이 일반적으로 시도하는 분야가 아니었다”며 “그러나 팀의 강점을 살려 많은 사람이 쓰는 B2C 서비스를 출시하고 그곳에 모이는 데이터를 바탕으로 안전하게 머신러닝을 설계한다면 빠르게 개선되는 AI 모델을 가질 것으로 생각했다”고 말했다.
그렇게 만들어진 서비스가 바로 AI 전화앱 ‘비토(VITO)’다. 지난해 4월 출시된 비토는 통화 내용을 문자처럼 텍스트로 변환해 보여준다. 약 1시간 분량의 통화도 단 몇 초 만에 문자화한다.
결과는 성공적이었다. 비토는 출시 9개월(지난해 말) 만에 가입자 15만명, 누적 통화 건수 1억건을 돌파했다. 이달 기준 누적 다운로드 수는 35만7000건이다. 누적 음성 인식 처리시간은 210만시간으로, 약 1년 전(13만 시간)과 비교해 16배 이상 성장했다. 비대면 업무가 확산되면서 사용량이 크게 늘었다.
비토의 성장에 힘입어 리턴제로는 이달 KTB네트워크, 에이티넘인베스트먼트, 하나벤처스, 컴퍼니케이파트너스, 엔젤투자자로부터 160억원 규모의 시리즈B 투자를 유치했다. 리턴제로는 이번 투자금을 기술 연구·개발(R&D), 인재 영입, 서비스 확대, 글로벌 진출 등에 사용, 성공을 뒷받침하기 위한 실탄으로 사용할 계획이다.
이 대표의 목표는 1년 안에 한국어 음성 인식 모델을 영어권 수준으로 끌어올리는 것이다. 그는 “한국어 음성 인식 분야는 데이터셋의 한계로 발전이 정체된 분야”라며 “영어·중국어 등의 메이저 언어에 비해 3~4년 이상 뒤처져 있는 것으로 평가돼왔다”고 설명했다.
약 5년 뒤에는 진정한 음성 인터페이스의 시대가 시작될 것이라고도 전망했다.
이 대표는 “한국어가 영어에서처럼 자유발화 음성 인식 결과를 충분히 신뢰할 수 있게 되면 각 기업의 전화 녹취는 챗봇이나 콜봇을 학습시키는 검색 가능한 스크립트 데이터가 된다”며 “장기적으로는 다양한 전화 업무에서 사람을 해방하고, 이용자들의 삶을 바꾸는 진정한 음성 인터페이스의 시대가 열릴 것”이라고 말했다.