오로라 이미지 보여주자 LG의 캡셔닝 AI가 내놓은 답은

입력
2023.06.19 20:00
수정
2023.06.20 08:10

이미지당 10초 내 평균 5개 문장·10개 키워드 생성
캐나다 컴퓨터 학회서 공개
맞춤형 이미지 검색·관리 시스템 구축 가능

LG 캡셔닝 인공지능(AI)이 이미지를 본 뒤 설명글과 키워드를 생성하고 있다. LG그룹제공

LG 캡셔닝 인공지능(AI)이 이미지를 본 뒤 설명글과 키워드를 생성하고 있다. LG그룹제공


사진 등 이미지를 보여주면 자동으로 설명과 관련 키워드를 10초 내 만드는 생성형 인공지능(AI)이 등장했다. LG그룹이 내놓은 AI 첫 상용화 서비스다.

19일 LG에 따르면 LG AI연구원은 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 'CVPR 2023'에서 '캡셔닝 AI'(Captioning AI)를 선보였다. 캡셔닝 AI는 챗GPT로 대표되는 대화형 생성 AI나 이미지 생성 AI와 다르게 사람처럼 이미지를 자연어로 설명하는 기술이다.

예컨대 캐나다 국기와 북극곰을 찍은 사진을 입력하면 '캐나다 국기 앞에 앉아 있는 북극곰'이라는 이미지 설명이 자동으로 생성되는 식이다. 추가 작업 없이 해당 이미지를 검색할 수 있는 정보 등 데이터를 만드는 AI여서 대량의 이미지를 관리해야 하는 기업의 업무 효율성과 생산성을 높일 수 있다는 설명이다.

앞서 LG 측은 CVPR을 데뷔 무대로 삼고 초거대 AI 엑사원에 이 기술을 적용해 시험해 왔다. 또 세계 최대 이미지와 영상 플랫폼 기업인 셔터스톡과 협력 관계를 맺고 학습부터 서비스 개발을 함께해 완성도를 높여왔다. LG 관계자는 "실용적이면서도 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성, 선정성 등 AI 윤리 검증과 저작권 투명성 등도 확보했다"고 설명했다.



LG 주요 5개 계열사, 캐나다서 우수 인재 확보 나서


이홍락 LG AI연구원 CSAI가 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열린 워크숍에서 캡셔닝 AI에 적용한 기술에 대해 설명하고 있다. LG그룹 제공

이홍락 LG AI연구원 CSAI가 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열린 워크숍에서 캡셔닝 AI에 적용한 기술에 대해 설명하고 있다. LG그룹 제공


현재 LG 캡셔닝 AI 기술은 해당 이미지를 본 뒤 평균 10초 내에 5개 문장과 10개의 키워드로 해석하는 능력을 갖고 있다. 이미지 범위를 1만 장으로 넓히면 이틀 안에 작업을 끝낼 수 있어 상대적으로 빠른 시간 내 맞춤형 이미지 검색·관리 시스템 구축이 가능하다.

세잘 아민 셔터스톡 최고기술책임자(CTO)는 "현재 10개 글로벌 고객사를 대상으로 얼리 액세스(앞서 해 보기) 프로그램을 진행하고 있다"며 "캡셔닝 AI는 고객이 반복 작업보다 좀 더 본질적이고 창의적 일에 집중할 수 있게 도울 것"이라고 덧붙였다.

LG AI연구원은 캐나다 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 캡셔닝 AI 서비스를 선보이며 캡셔닝 AI 기반 기술(제로샷 이미지 캡셔닝)을 주제로 이날 서울대 AI대학원, 셔터스톡과 함께 워크숍도 진행했다. 또 22일까지 이어지는 학회에서 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다.

김승환 LG AI연구원 비전랩장은 "이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획"이라고 말했다.

박관규 기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo

댓글 0

0 / 250
첫번째 댓글을 남겨주세요.
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.

기사가 저장 되었습니다.
기사 저장이 취소되었습니다.