기후위기시계
실시간 뉴스
  • [세상속으로] 데이터댐, 디지털혁신과 일자리창출 ‘두 토끼’를 노린다

요즘 우리에게 인공지능과 빅데이터라는 단어는 일상적으로 사용된다. 정부는 대한민국의 디지털혁신을 이끌어갈 디지털뉴딜 정책을 발표했다. 데이터를 모아 데이터댐을 만들어 디지털경제의 기반을 다지겠다고 한다.

하지만 데이터댐이란 무엇인지 아리송하다. 데이터를 백과사전에서 찾아보면 ‘우리말로 자료라고 하며 문자, 숫자, 소리, 그림, 영상, 단어 등의 형태로 된 의미 단위’라고 나온다.

이러한 데이터가 많이 쌓이면 마술을 부리기 시작한다. 데이터댐이 중요한 이유 역시 여기에 있다.

인공지능은 사람을 대신해 많은 일을 할 수 있다고 한다. 자동차를 스스로 운전하고, 인간과 대화하며, 신문 기사를 쓰기도 하고 그림을 그리기도 한다. 이렇게 인공지능을 똑똑하게 만들기 위해서는 수많은 데이터를 모아 인공지능을 학습시켜야 한다.

예를 들어 오픈AI(Open AI)라는 기관에서는 얼마 전 인공지능 모델 ‘GPT-3’를 발표했는데, 이 모델을 통해 인공지능이 만들어낸 문장들은 인간의 글과 구별이 되지 않을 정도로 자연스럽다. GPT-3라는 인공지능 모델을 학습시키기 위해 무려 3000억개의 단어를 모았다고 한다.

캐나다의 벤처기업인 블루닷(BlueDot)은 세계보건기구(WHO)보다 9일이나 앞서 신종 코로나바이러스 감염증(코로나19)의 확산을 경고했다. 블루닷은 인구수, 지리적 위치, 바이러스의 특징, 기존 다른 감염병의 확산 양상 등의 데이터와 항공권 이용정보와 같은 이동정보까지 포함해 바이러스가 다른 지역으로 퍼져나갈 확률을 계산했다. 이처럼 데이터가 많이 축적돼 인공지능 기술과 만나면 다양한 분야에서 신통한 일을 해낸다. 그래서 정부에서는 데이터댐사업을 통해 대한민국의 디지털혁신을 위한 시동을 걸고 있다.

데이터댐사업의 장점은 이것만이 아니다. 우리 사회는 지금 장기화된 저성장 기조에다 코로나19라는 예상치 못한 상황에 의한 저고용 문제에 시달리고 있는데, 데이터댐사업은 일자리 창출의 좋은 해결 방안이 될 수 있다.

인공지능을 학습시키기 위해서는 데이터를 수집하고 정제하고 가공하는 작업이 필요하다. 이는 여러 사람이 수작업 또는 반자동 작업을 거쳐 수행해야 하며, 이런 과정을 거친 데이터는 미래 디지털화를 위한 훌륭한 자산이 된다.

데이터에는 여러 종류가 있다. 영상데이터, 음성데이터, 의료사진데이터, 공장의 센서데이터 등 다양하다. 작업자는 해당 분야의 데이터 처리 과정을 훈련받고, 작업 과정을 통해 인공지능의 원리에 대해 어렴풋이나마 이해하게 되며 전문성이 축적되는 효과가 나타난다.

얼마 전 과학기술정보통신부와 한국정보화진흥원에서는 AI 허브를 통해 AI 학습용 데이터 구축사업에 참여하고 있는 크라우드소싱 활용 기업의 수만개 일자리에 대한 정보를 제공하겠다고 발표했다.

크라우드소싱 방식은 온라인으로 이뤄지므로 집이나 이동 중에도 데이터의 수집-정제-가공-품질관리 등 데이터 구축 전 과정에 참여할 수 있는 방식의 일자리로, 경력단절 여성, 장애인, 소년소녀가장, 은퇴자 등 다양한 인력에게 참여 기회를 제공한다.

인공지능 데이터 가공은 비교적 간단한 데이터 수집 업무에서부터 정교한 가공 작업, 품질 검수 등 다양한 난이도로 구성되므로 폭넓은 일자리 창출이 가능하다.

또한 인문 계통 우수 인력의 양질의 일자리도 만들어낼 수 있다. 한 마디로 데이터댐사업을 통해 미래의 디지털혁신과 일자리 문제 해결이라는 ‘두 마리의 토끼’를 잡을 수 있는 것이다.

처음 해보는 일이니 시행착오나 넘어야 할 많은 난관도 있을 것이다. 하지만 대한민국은 이미 ICT강국을 이뤄낸 저력이 있으니 자신감을 가지고 미래를 향해 힘차게 뛰어 보자.

이윤근 한국전자통신연구원 인공지능연구소장

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크