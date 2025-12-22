CoT기반 멀티모달 AI 학습 데이터로 농작업 인지·판단 구조 정형화

초거대 AI 추론 기법 ‘CoT(Chain of Thought)’를 농작업 로봇 데이터 구조에 적용

5,303만 건 AI 학습용 데이터 구축 노하우와 자체 플랫폼 ‘LabelOn’기반 고난도 데이터 구축

AI 전문기업 ㈜유클리드소프트(이하 유클리드소프트)는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2025년도 초거대 AI 확산 생태계 조성 사업’에 선정돼, 단계적 사고 기반 농작업 로봇 데이터를 성공적으로 구축해 제출했다고 밝혔다.

해당 사업은 초거대 AI 학습에 필수적인 고품질 데이터를 구축·개방함으로써 AI 생태계 활성화와 산업 전반의 AI 활용 확대를 목표로 한다.

유클리드소프트는 경북대학교 산학협력단, 주식회사 써로마인드와 컨소시엄을 구성해 사과·배·복숭아·자두 등 주요 과수 4종을 대상으로 농작업 상황을 반영한 AI 학습용 데이터를 구축했다. 적화·적과·가지치기·수확 등 농작업 전 과정에 대해 RGB 및 Depth 이미지, 양손 센서와 압력·환경 센서 데이터, 작업 인지·판단 과정을 단계별로 구조화한 CoT 데이터 등을 포함한 총 3만 건 규모의 멀티모달 데이터셋을 완성했다. 특히 농작업 인식과 판단 흐름을 단계적으로 정형화한 데이터 구조 설계가 기존 시각 중심 데이터셋과 차별화되는 점이다.

이번에 구축된 데이터는 농작업에서 발생하는 다양한 상태 정보를 기반으로, 작업 대상 및 환경 인식, 작업 유형 판단, 다음 단계 판단 근거 등을 단계적 사고(Chain of Thought) 형태로 구조화했다. 이를 통해 초거대 AI 모델이 농작업 맥락을 단편적으로 인식하는 것이 아니라, 작업 흐름과 판단 구조를 함께 학습할 수 있는 데이터 환경을 제공한다.

‘단계적 사고 기반 농작업 로봇 데이터’는 △농촌의 인력난 해소 △농업 생산성 및 품질 향상 △정밀농업 및 스마트팜 기술 고도화 △차세대 로봇지능 연구 등에 활용될 수 있으며, 사업 종료 후 AI Hub를 통해 누구나 활용 가능하도록 공개될 계획이다. 나아가 농업뿐 아니라 물류, 제조, 건설 등 다양한 산업군에서의 확장 가능성도 기대된다.

유클리드소프트는 지금까지 총 5,303만 건의 AI 학습용 데이터와 약 3억 토큰 규모의 초거대 AI 학습용 말뭉치 데이터를 구축해왔다. 2022년에는 ‘인공지능 학습용 데이터 구축 사업’ 최종 평가에서 ‘대규모 시각 추론 학습 데이터’가 우수 과제로 선정되며 데이터 구축 분야의 전문성을 인정받았다. 또한 자체 데이터 구축 플랫폼 ‘LabelOn’을 통해 데이터 수집, 가공, 검수, 품질 관리까지 전 주기를 통합 지원하는 체계를 갖추고 있으며, 이번 과제에서도 고난도 멀티모달 데이터 구축을 안정적으로 수행했다.

박주한 유클리드소프트 대표는 “단계적 사고(Chain of Thought)는 주로 언어 모델의 추론 성능 향상을 위해 활용돼 왔다”며 “이번 사업은 이를 농작업 로봇 데이터의 인지·판단 구조 설계에 적용한 국내 공공 데이터 구축 사례라는 점에서 의미가 있다”고 밝혔다. 이어 “사람의 작업 판단 과정을 단계별로 구조화한 멀티모달 데이터를 통해, 농업 분야 AI 연구와 초거대 AI 학습을 위한 기반 데이터를 지속적으로 확장해 나가겠다”고 덧붙였다.

한편 유클리드소프트는 올해 ‘2025년도 초거대 AI 확산 생태계 조성 사업’을 통해 이번 ‘단계적 사고 기반 농작업 로봇 데이터’ 외에도 ‘방송통신기자재등 적합성평가 데이터’를 성공적으로 완료하여 공공·산업 데이터 생태계 조성에 기여하고 있다.