“건당 10원 받아요”  AI시대 청년들의 서글픈 자화상 [IT선빵!]
[123rf]

[헤럴드경제=유동현 기자] “10일 일해 20만원 벌었어요”

코로나19 장기화로 아르바이트 구하기조차 힘들어진 청년들이 ‘데이터 라벨링(labeling)’에 뛰어들고 있다. 데이터 라벨링은 인공지능(AI)의 학습에 필요한 데이터를 가공하는 작업이다. 가령 사진 속의 동물이 고양이인지 강아지인지, 국화인지 장미인지 등을 분류해 AI에게 알려주는 일이다. 어렵고 복잡한 일이 아닌데다 벌이가 크지 않아 과거 봉제 인형에 눈을 붙이는 ‘저임금 노동’에 비유된다.

데이터 라벨링은 지난해 정부가 발표한 ‘디지털 뉴딜’ 정책을 기점으로 주목받았다. 그 핵심인 ‘데이터 댐’ 사업은 각 분야 데이터를 축적하고 분석해 인공지능을 학습시키고, 학습된 인공지능을 교통, 교육, 금융, 의료 등 다양한 분야에서 활용하는 것이다.

이때 AI 학습용 데이터를 구축하는 작업이 데이터 라벨링이다. 당시 기획재정부는 "데이터 수집과 가공에 굉장히 많은 인력이 필요하다"며 "일자리 취업자가 줄어든 20~40대 청년층 일자리를 보완하는 측면에서 큰 기여를 할 것"이라고 설명했다.

“건당 10원 받아요”  AI시대 청년들의 서글픈 자화상 [IT선빵!]
데이터 라벨링 아르바이트로 돈을 벌었다는 후기. 데이터 라벨링은 4차 산업혁명시대 '단순 저임금'노동이라는 지적과 함께 '인형 눈알 붙이기' 작업에 비유된다. [데이터 라벨링 앱 캡처]

분야도 다양하다. 가령 자율주행차에 필요한 도로 주변의 사물 데이터 처리 작업을 하거나 차선이 점선인지 실선인지 구분하는 등을 작업한다. 언어 번역에서는 지명이나 인물명 등 고유명사가 정확하게 표기됐는지 검수 등을 진행한다. 이를 비롯 숨어 있는 고양이, 강아지 등 동물사진 찾기 등 단순 업무가 많다. 나아가 자신의 미소 짓는 사진을 올리거나, 음성을 녹음해 제공하는 개인 데이터 제공업무도 있다.

데이터 라벨링 업무는 정부 주도로도 진행되지만 산학계를 중심으로 필요한 데이터를 수집하는 방편으로 활용된다. 이를 중개해주는 앱의 사용량도 급증하고 있다. 모바일인덱스에 따르면 한 데이터 라밸링 앱은 12월 월간이용자 수가 출시된 8월 대비 132% 증가했다. 지난해 11월 출시된 또 다른 앱은 한 달만에 월간이용자가 249% 증가하며 약 3만 명에 다다른다.

“건당 10원 받아요”  AI시대 청년들의 서글픈 자화상 [IT선빵!]
데이터 라벨링 프로젝트를 제공하는 한 앱의 월간사용자 수 추이.[모바일 인덱스 캡처]

연령별 사용자 구성을 보면 20대 그룹이 50%넘게 차지하고 있다. 코로나19로 아르바이트 구하기조차 애를 먹는 청년들의 참여가 늘고 있는 것으로 풀이된다. 관련 앱이나 커뮤니티에는 “10일 일하면서 20만원 정도 벌었다” “한달 동안 수익금 50만원 달성했다” 등 청년들의 후기가 올라오고 있다. 건당 10원부터 출발하지만 자신의 사진이나 음성을 제공하는 작업에는 건당 만원에 육박해 어느 정도 돈벌이는 된다.

동시에 데이터 라벨링은 저임금 단순노동이라는 지적과 함께 ‘4차산업 혁명 시대 인형 눈알 붙이기’라는 비판이 꼬리표처럼 붙고 있다. 지난해 월드이코노믹포럼(WEF)는 데이터라벨링을 두고 “인공지능 시대 새로운 조립라인 노동”이라며 “저숙련 근로자, 개도국, 일자리 구하기 힘든 이들에게 적합하다”며 평했다. 반면 AI 자율주행 분야 등에는 데이터라벨링이 전체 작업의 50%이상을 차지할 정도로 AI시대를 맞이해 불가피하다는 의견도 있다.

“건당 10원 받아요”  AI시대 청년들의 서글픈 자화상 [IT선빵!]