"인간처럼 생각하고 글 써주는 AI 온다"... '초거대 AI' 개발 전쟁 발발

입력
2021.11.17 04:30
11면
스스로 소설 쓰고 코딩해주는 범용 AI로 주목
카카오, GPT-3 한국어 특화 버전 개발·기술 공개
네이버도 GPT-3 성능 넘는 '하이퍼클로바' 개발

'초거대 인공지능(AI)'을 선점하기 위한 정보기술(IT) 업계의 경쟁이 치열하다. 인간의 언어까지 이해하고 수많은 분야로 활용이 가능하단 점에서 초거대 AI는 IT업계에 새로운 '게임체인저'로 주목받고 있다. 초거대 AI는 슈퍼컴퓨팅 인프라로 대용량 데이터를 학습한 차세대 AI다. 기존 AI보다 사람의 뇌에 가깝게 설계, 학습과 판단 능력이 개선됐다는 평가다. 일론 머스크 테슬라 최고경영자(CEO) 등이 주도해 설립한 미국의 AI 연구기관 오픈AI가 지난해 'GPT-3'를 공개하면서 수면 위로 급부상했다. GPT-3는 AI의 성능을 측정할 수 있는 단위인 파라미터(매개변수)가 기존 AI 대비 수백 배 커졌다. 이에 기존 AI가 개발자가 입력한 빅데이터를 기반으로 해당 분야에서만 성능을 발휘했다면, GPT-3는 AI는 적은 데이터만 입력해도 해당 분야를 습득할 수 있는 지능을 갖췄다. 덕분에 소설 집필에서부터 코딩 수행도 가능해진 GPT-3는 지난해 9월엔 영국 언론 '가디언'에 칼럼을 기고하면서 화제를 뿌렸다.

카카오브레인은 16일 'GPT-3' 모델을 활용한 한국어 특화 초거대 AI 언어모델 'KoGPT'를 개발하고, 해당 기술을 오픈소스 커뮤니티인 '깃허브'에 공개했다.

카카오브레인이 개발한 'KoGPT'는 GPT-3 모델의 한국어 특화 버전이다. GPT-3의 경우 한국어 데이터 비율이 0.016%에 불과해 국내 개발자들이 활용하는 데 한계가 있었다. 카카오브레인은 GPT-3 모델에 2,000억 개의 한국어 데이터를 학습시켰다. 카카오브레인은 KoGPT 기술을 자사 서비스에 적용하는 것을 넘어 외부 개발자에 핵심 기술을 공개, 국내에서 초거대 AI 생태계 구축에 나설 계획이다. 이에 따라 카카오브레인의 KoGPT가 활용된 다양한 AI 서비스 출시도 기대되고 있다.

네이버, 카카오, LG, KT 등 초거대 AI 시장 선점 노려

초거대 AI의 매력은 역시 무궁무진한 확장성이다. 주요 IT업계가 앞다퉈 기술 개발 경쟁에 뛰어든 배경이다.

네이버는 지난 5월 초거대 AI 모델 ‘하이퍼 클로바’를 공개했다. 이는 GPT-3(1,750억 개)보다 많은 2,040억 개의 파라미터 규모로 개발돼 주목받았다. 네이버는 하이퍼 클로바 개발을 위해 지난해 10월 700페타플롭스(PF) 이상의 슈퍼컴퓨팅 인프라를 구축했다. 1PF는 1초당 1,000조 번 연산할 수 있는 능력을 말한다. 또 기존 AI 대비 3,000배 이상의 데이터를 학습하면서 스스로 생각할 수 있는 AI로 거듭났다. 이는 50년치 뉴스나 9년치 블로그 게시물에 달하는 양이다.

LG AI연구원에선 향후 3년간 1억 달러 투자 계획까지 밝히면서 초거대 AI 개발에 나선 상태다. 1초에 9경5,700조 번의 연산 처리가 가능한 AI 컴퓨팅 인프라를 구축하고 지속적으로 확장해 나갈 예정이다. LG AI연구원은 연내 6,000억 개의 파라미터를 갖춘 초거대 AI를 공개할 계획이다.

KT도 국내 주요 기업·연구기관과 AI 원팀을 꾸려 초거대 AI 모델을 개발하고 있다. AI 원팀 구성원은 KT, LG전자, LG유플러스, 동원그룹, 한국투자증권, 우리은행, 현대중공업그룹, 한양대, KAIST, 한국전자통신연구원(ETRI) 등이다. 내년 상반기 출시를 목표로, 제조·금융·물류 등 다양한 산업을 혁신하는 용도로 활용할 방침이다. IT업계 관계자는 "모든 영역에 활용할 수 있는 범용 AI를 개발하기 위해선 '초거대 AI' 기술을 거쳐갈 수밖에 없을 것"이라며 "초거대 AI를 남보다 먼저 선보이고, 관련 생태계를 확장하는 것이 미래 IT 생태계를 장악하는 키포인트가 될 것"이라고 말했다.

안하늘 기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo