카카오브레인, 초거대 AI 멀티모달 ‘민달리’ 공개

카카오브레인, 초거대 AI 멀티모달 ‘민달리’ 공개

  • 기자명 박민석 기자
  • 입력 2021.12.21 16:25
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

문자로 명령어 입력하면 이미지 생성… 교육자료 등에 활용

[데일리스포츠한국 박민석 기자] 카카오가 글을 쓰는 것을 넘어 그림까지 그릴 수 있는 인공지능(AI)을 개발했다.

카카오브레인이 개발한 한국어 초거대AI 민달리 모델이 그린 그림 예시.(카카오브레인)
카카오브레인이 개발한 한국어 초거대AI 민달리 모델이 그린 그림 예시.(카카오브레인)

카카오브레인은 초거대 AI 멀티모달(multimodal) ‘민달리(minDALL-E)’를 세계 최대 오픈소스 커뮤니티 깃허브에 공개했다.

민달리는 이용자가 문자로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1400만장의 문자와 이미지 세트를 사전 학습했다.

예를 들어 “바나나 껍질로 만든 의자 그려줘” “보름달과 파리 에펠탑이 같이 있는 그림 보여줘” “살바도르 달리 화가 스타일로 그려줘”라는 명령어를 입력하면, AI가 명령어의 맥락을 이해하고 바로 이미지를 도출한다. 검색을 통해 이미지를 찾아내는 것이 아니라, AI가 스스로 명령을 이해하고 직접 이미지를 그린다. 스토리텔링 콘텐츠의 삽화를 만들거나, 교육 자료 제작 등에 활용하는 등 다양한 콘텐츠 산업에 적용할 수 있을 것으로 카카오브레인은 기대했다.

카카오브레인은 지난달 공개한 KoGPT 모델의 성능 고도화에도 집중하고 있다. 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위·초당 100경 연산처리)를 뛰어넘는 국내 최대 규모 딥러닝 슈퍼컴퓨팅 인프라를 도입해 연구 효율을 높였다. 아울러 KoGPT 모델의 매개변수(파라미터)를 60억개에서 300억개 사이즈까지 5배 늘려 이전보다 더 정확하게 명령을 이행할 수 있도록 했다.

김일두 카카오브레인 대표는 “최근 공개한 언어 모델 KoGPT과 이번에 공개한 달리-E를 시작으로 순차적으로 초거대 AI의 다양한 모델을 공개할 것”이라며 “이는 차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈 소스로 공개해 국내 IT 생태계 기술 발전에 기여할 것”이라고 말했다.

저작권자 © 데일리스포츠한국 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전