기후위기시계
실시간 뉴스
  • AI가 통계 분류하는 시대 온다…현재 성공률 최대 96%
통계청 통계개발원, 3일 '인공기능 기반 산업분류 자동화 연구' 결과 발표

[헤럴드경제=홍태화 기자] '인공지능(AI) 기반 통계 분류 자동화'가 현실화되고 있다. AI는 대분류 수준에서 95.9% 산업분류 성공률을 보였다.

통계개발원은 김혜란 사무관·임경민 주무관의 '인공기능 기반 산업분류 자동화 연구' 결과를 실은 '데이터 리서치 브리프 6호'를 3일 발간하고 이같이 밝혔다.

통계청은 통계를 작성할 때 조사 대상자의 텍스트 응답을 토대로 사업체가 속한 산업을 한국표준산업분류에 따라 분류하는데, 이때 산업·직업 자동코딩 시스템을 활용하고 있다.

자동코딩 시스템으로 연계되지 않는 자료는 별도 인력이 내용을 검토해 산업 분류를 결정하는 구조다. 하지만 확인 대상 자료 증가에 따른 업무 과부하, 담당 인력 간 숙련도 차이 등이 한계로 지적돼왔다.

김 사무관과 임 주무관은 머신러닝 자연어 처리 기술을 활용해 기존 시스템의 사례사전(논리규칙)을 이용한 분류를 색인정보 임베딩과 지도학습 분류 모델로 대체하고, 색인어 사전 이용 분류는 사전학습 언어모델과 텍스트 추론 기반 분류항목 검색으로 대체하는 연구를 수행했다.

통계청 일부 조사자료에 이런 방법론을 적용한 결과, 대분류 수준에서는 95.9%, 중분류 93.8%, 소분류 91.4%, 세분류 88.9%의 정확도로 산업분류 부호를 예측할 수 있었다고 연구진은 밝혔다.

전영일 통계개발원장은 "AI 기반 통계분류 자동화 시스템이 구축되면, 300여개 국내 법률에서 준용하는 산업·직업·질병·사인 분류 활용 통계 등이 더 정확하고 시의성 있게 생산돼 범부처에서 통계 기반 정책이 강화될 것으로 기대된다"고 말했다.

th5@heraldcorp.com

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크