IT·과학

ETRI, ‘절차생성 AI’ 성능 자동평가 기술 첫 개발

입력 2024-03-07 09:05:27

- 복사완료!

구본혁

구본혁 기자

- 대형언어모델 절차 생성 성능 평가 비용·시간 단축, 객관적 평가

ETRI, ‘절차생성 AI’ 성능 자동평가 기술 첫 개발 — ETRI 연구진이 절차 생성 인공지능(AI)의 성능을 자동평가하는 로타벤치마크(LoTa-Bench) 기술에 관해 논의하고 있다.[ETRI 제공]

[헤럴드경제=구본혁 기자] 국내 연구진이 대형언어모델(LLM)을 기반으로 만들어진 절차들의 성능을 자동으로 평가하는 기술을 세계 최초로 개발했다.

한국전자통신연구원(ETRI)은 사람이 말로 작업을 명령하면 스스로 작업 절차를 이해하고 계획을 수립해 수행하는 절차 생성 인공지능(AI)의 성능을 자동 평가할 수 있는 로타벤치마크(LoTa-Bench) 기술을 개발했다고 밝혔다.

이 기술 개발로 향후 대형언어모델을 이용한 로봇 작업계획 기술의 성능평가 시간과 비용을 대폭 줄일 수 있게 됐다.

최근 대형언어모델은 언어처리, 대화, 수학 문제 풀이, 논리 증명 외 사람의 명령을 이해해 하위 작업을 스스로 선택하고 순서대로 수행해 목표를 달성하는 절차 이해 영역에서도 우수한 성능을 보여주고 있다.

이에 따라 대형언어모델을 로봇 응용과 서비스 구현에 적용하려는 시도가 폭넓게 이뤄지고 있다.

ETRI는 대형언어모델의 절차 수행 결과가 지시 명령 목표를 잘 달성했는지에 대한 절차 이해 기술 성능을 자동으로 평가하는 로타벤치마크 기술을 세계 최초로 개발했다.

기존에는 절차 이해 성능 평가를 자동으로 할 수 있는 벤치마크 기술이 없어서 사람이 직접 평가함으로써 손이 많이 갈 수밖에 없었다.

예컨대, 구글의 세이캔(SayCan)을 비롯 기존 연구에서는 여러 사람이 직접 작업 수행 결과를 관찰하고 성공 실패 여부를 투표하는 방법을 채택했다.

따라서 성능 평가에 매우 긴 시간과 노력이 들어 번거로울 뿐 아니라 평가 결과에 주관적 판단이 개입하는 문제가 있다.

ETRI가 개발한 로타벤치마크 기술은 사용자의 명령에 따라 대형언어모델이 생성한 작업 절차를 실행하고, 결과가 지시한 목표와 같은지 자동으로 비교하여 성공 여부를 판단한다.

이때문에 평가 시간과 비용을 최소화할 수 있고, 결과가 객관적이다.

장민수 ETRI 소셜로보틱스연구실 책임연구원은 “로타벤치마크는 절차 생성 AI 개발의 첫걸음이다. 향후 불확실한 상황에서 작업 실패를 예측하거나 사람에게 질문하며 도움을 받아 작업 생성 지능을 지속 개선하는 기술을 개발할 계획”이라고 말했다.

이 기사가 어떠셨나요?

이 시각 추천 AD

이 시각 주요기사

“연봉 1억원, 재택 근무 부활” 역대급 소식…‘부러움’ 폭발 난리났다?

“연봉 1억원, 재택 근무 부활” 역대급 소식…‘부러움’ 폭발 난리났다?

[헤럴드경제= 박영훈 기자] 아침마다 출근 전쟁을 벌이고 있는 직원들의 1순위 희망 사항 재택근무. 코로나 이후 사라졌던 재택근무를 주 1회 부활시킨 회사가 있어서 화제다. 바로 카카오다. 주 1회이기는 하지만 카카오의 재택근무 부활이 다른 회사 직원들의 부러움을 살 정도로 화제가 되고 있다. IT 기업마다 직원들의 재택근무에 대한 요구가 많았지만, 현재

당신을 위한 추천 AD

많이 본 기사

“비트코인, 예전에 남친 말 듣고 샀는데 마이너스 77%”…사상최고 찍었는데 무슨 일? [투자360]

“비트코인, 예전에 남친 말 듣고 샀는데 마이너스 77%”…사상최고 찍었는데 무슨 일? [투자360]

‘비트코인 vs. 버트코인’ 유사명칭 혼동 해프닝 노보그라츠 “비트코인 50만달러까지 오를 것” 캐시우드 “비트코인 2030년까지 150만달러 도달” [헤럴드경제=서경원 기자] 지난 21일 한 온라인 가상자산 투자 게시판에 한 게시물이 올라왔다. 이 글을 쓴 사람은 자신의 가상자산 투자 인증 사진과 더불어 올린 글에 “예전에 남친이 비트코인 사라고 해서 샀는데 이거 맞아?”라고 썼다. 이 사람이 올린 수익 현황을 보면 총 470만원 가량을 투자해 76.57%(약 360만원)의 손실을 보고 110만원 정도의 잔고를 기록 중이다. 하지만 자세히 보면 이 글을 올린 사람이 투자한 가상자산을 보면 비트코인(Bitcoin)이 아닌 버트코인(Vertcoin)이다. 남자친구의 말을 듣고 가상자산 검색을 정확히 하지 못해 나온 해프닝으로 보인다. 미국 대선에서 도날드 트럼프 전 대통령의 재선을 기점으로 사상 최고가를 경신 중인 가상자산 대장주 비트코인과 버트코인은 큰 차이가 있다. 가상자산 정보사

“만점 받아도 의대 어렵다” 국·수·영 다 쉬운 수능에 입시 ‘혼란’ 예고

“만점 받아도 의대 어렵다” 국·수·영 다 쉬운 수능에 입시 ‘혼란’ 예고

[헤럴드경제=박혜원·안효정 기자] #.“4개 이상 틀리면 의대는 못 간다는 분위기입니다.” 의대 입시를 주력으로 하는 강남의 한 종합학원 관계자는 올해 수능 이후 수험생들 반응을 두고 이렇게 말했다. 통상 정시 기준 의대 입학을 위해선 수능에서 10개 이내로 틀려야 하는 것으로 알려져 있다. 그러나 올해 의대 증원으로 기회가 넓어졌음에도 수능을 통해 의대에 가기는 되려 까다로워졌다는 이야기다. ▶역대급 졸업생 응시에도…수능 평이했다=2025학년도 대학수학능력시험(수능)이 마무리돼 대입 일정이 본격적으로 시작되는 가운데, 최상위권 수험생들 사이에선 혼란이 예상된다. 특히 주요 과목들이 모두 쉽게 출제돼 의대 입시를 노린 수험생들의 합격 여부를 가늠하기가 예년보다 어려워졌다. 올해 수능은 역대급 ‘불수능’으로 평가된 지난해 대비 평이했다는 평가가 많다. 당초 입시 업계에선 올해 의대 증원 여파로 최상위권 수험생이 대거

“만점 받아도 의대 어렵다” 국·수·영 다 쉬운 수능에 입시 ‘혼란’ 예고

“만점 받아도 의대 어렵다” 국·수·영 다 쉬운 수능에 입시 ‘혼란’ 예고

[헤럴드경제=박혜원·안효정 기자] #.“4개 이상 틀리면 의대는 못 간다는 분위기입니다.” 의대 입시를 주력으로 하는 강남의 한 종합학원 관계자는 올해 수능 이후 수험생들 반응을 두고 이렇게 말했다. 통상 정시 기준 의대 입학을 위해선 수능에서 10개 이내로 틀려야 하는 것으로 알려져 있다. 그러나 올해 의대 증원으로 기회가 넓어졌음에도 수능을 통해 의대에 가기는 되려 까다로워졌다는 이야기다. ▶역대급 졸업생 응시에도…수능 평이했다=2025학년도 대학수학능력시험(수능)이 마무리돼 대입 일정이 본격적으로 시작되는 가운데, 최상위권 수험생들 사이에선 혼란이 예상된다. 특히 주요 과목들이 모두 쉽게 출제돼 의대 입시를 노린 수험생들의 합격 여부를 가늠하기가 예년보다 어려워졌다. 올해 수능은 역대급 ‘불수능’으로 평가된 지난해 대비 평이했다는 평가가 많다. 당초 입시 업계에선 올해 의대 증원 여파로 최상위권 수험생이 대거

이 시각 관심 정보 AD