금융상품의 발행 및 거래정보 자동 추출

[헤럴드경제=유동현 기자] 채권평가 전문기업 에프앤자산평가가 대규모 언어모델(LLM)과 광학문자인식(OCR)을 결합한 금융상품의 발행 및 거래정보를 자동으로 추출하는 시스템을 구축했다고 8일 밝혔다.

에프앤자산평가는 서울대학교 KDT(K-Digital Training) 교육과정의 ‘캡스톤 프로젝트’에 참여해 이 같은 성과를 냈다고 밝혔다.

그간 텀시트(투자계약서)는 발행사나 상품별로 형식이 다르고, 스캔본 문서의 OCR 인식 오류 등으로 인해 단순 규칙 기반의 자동화가 어려웠다. 에프앤자산평가는 해결책으로 LLM의 맥락 이해 능력과 OCR 기술을 융합해 비정형 문서에서도 필요한 정보를 식별·추출하는 방식으로 접근했다.

서울대 빅데이터연구원이 주관하고 고용노동부가 지원하는 KDT 교육과정은 ‘빅데이터 AI 핀테크 고급 전문가 과정’으로, 금융과 인공지능 분야를 선도할 데이터 사이언스 인재를 양성하는 국비 프로그램이다. 이 과정의 마지막 단계인 캡스톤 프로젝트는 실제 기업 과제를 바탕으로 학생들이 최신 AI 기술과 데이터 분석 역량을 적용해 해결책을 제시하는 산학협력 프로그램이다.

에프앤자산평가는 이번 프로젝트를 통해 금융 실무에 AI 기술을 접목할 수 있는 가능성을 확인했으며, 향후 자연어처리(NLP), 컴퓨터비전(CV) 등 핵심 기술 역량을 고도화해 관련 사업 영역을 확장할 계획이다.

에프앤자산평가 관계자는 “이번 산학협력은 AI 기술이 금융 실무에 실질적으로 기여할 수 있음을 보여준 좋은 사례”라며 “앞으로도 첨단 기술을 적극 도입해 금융산업의 데이터 기반 혁신과 디지털 전환을 선도하겠다”고 했다.