default_top_notch
default_news_top
default_news_ad1
default_nd_ad1

ETRI, 사람처럼 문서 이해하고 정보 찾아주는 AI 기술 개발

기사승인 2021.09.14  16:25:18

공유
default_news_ad2

- 한글 행정문서 질의응답·패러프레이즈 API 2종 공개

[데일리스포츠한국 박민석 기자] 국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다.

ETRI 연구진이 오피스문서에 활용할 수 있는 API 기술을 설명하고 있는 모습.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API 2종을 개발했다.

이 기술은 ETRI 공공 인공지능 오픈 API·데이터 서비스 포털에 공개돼 누구나 쉽게 이용할 수 있다.

ETRI는 “이번 기술로 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있다”고 설명했다.

먼저 행정문서 질의응답(QA) API(응용프로그램개발환경) 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식, 정답 및 근거 문장을 찾아준다. 예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면, ‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 제공한다.

해당 기술은 한글과컴퓨터에서 블라인드 평가로 정확도를 측정한 결과, 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

패러프레이즈(Paraphrase) 인식 API는 서로 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다.

ETRI는 “인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성 문제가 있었다”며 “딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다”고 전했다.

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보여 기존 오픈소스 딥러닝 기술보다 성능이 크게 개선됐다.

연구진은 향후에 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발해 공개할 계획이다.

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다”고 밝혔다.

 

박민석 기자 kepain@dailysportshankook.com

<저작권자 © 데일리스포츠한국 무단전재 및 재배포금지>
>박민석 기자의 다른기사 보기
default_news_ad5
default_side_ad1
default_nd_ad2

최신기사

default_side_ad2
ad37
ad43

포토

1 2 3
set_P1
default_side_ad3

섹션별 인기기사 및 최근기사

default_side_ad4
default_nd_ad6
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
default_news_bottom
default_nd_ad4
default_bottom
#top
default_bottom_notch
×