ETRI, 사람처럼 문서 이해하고 정보 찾아주는 AI 기술 개발

ETRI, 사람처럼 문서 이해하고 정보 찾아주는 AI 기술 개발

  • 기자명 박민석 기자
  • 입력 2021.09.14 16:25
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

한글 행정문서 질의응답·패러프레이즈 API 2종 공개

[데일리스포츠한국 박민석 기자] 국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다.

ETRI 연구진이 오피스문서에 활용할 수 있는 API 기술을 설명하고 있는 모습.
ETRI 연구진이 오피스문서에 활용할 수 있는 API 기술을 설명하고 있는 모습.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API 2종을 개발했다.

이 기술은 ETRI 공공 인공지능 오픈 API·데이터 서비스 포털에 공개돼 누구나 쉽게 이용할 수 있다.

ETRI는 “이번 기술로 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있다”고 설명했다.

먼저 행정문서 질의응답(QA) API(응용프로그램개발환경) 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식, 정답 및 근거 문장을 찾아준다. 예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면, ‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 제공한다.

해당 기술은 한글과컴퓨터에서 블라인드 평가로 정확도를 측정한 결과, 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

패러프레이즈(Paraphrase) 인식 API는 서로 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다.

ETRI는 “인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성 문제가 있었다”며 “딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다”고 전했다.

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보여 기존 오픈소스 딥러닝 기술보다 성능이 크게 개선됐다.

연구진은 향후에 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발해 공개할 계획이다.

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다”고 밝혔다.

 
저작권자 © 데일리스포츠한국 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전