AI 개발자가 GPT4 직접 써보고 놀란 이유 "'알잘딱깔센'까지 이해하다니!"

입력
2023.03.26 09:00
14면
생성 AI에 GPT4 적용해본 개발자들 "충격적"
한국어 유행어까지 이해할 정도 개선
책 50페이지 기억, 맞춤형 서비스 구현 가능
전 사회에 AI로 인한 '파괴적 자동화' 예상


"'알잘딱깔센'은 어떤 일을 정확하게 잘 처리하고 꼼꼼하게 해내는 사람을 뜻합니다."
GPT4를 적용한 생성 인공지능(AI) 서비스 '뤼튼'


미국의 인공지능(AI) 연구기관 오픈AI가 초거대 AI GPT4를 공개한 이후 AI 업계가 그 발전 속도에 충격을 받고 있다. 직전 모델이었던 GPT3.5를 적용한 생성 AI '챗GPT'를 공개한 지 불과 5개월 만에 상당히 빠르게 성능이 좋아지고 있다는 점을 관련 업계 관계자 누구도 부인하지 않고 있다. 특히 약점으로 꼽혔던 문제들을 눈에 띄게 개선하면서 점점 사람에 가까운 AI로 거듭나고 있다는 분석도 나온다.

26일 업계에 따르면 오픈AI는 생성 AI 업체들에 차례로 GPT4 애플리케이션 프로그램 인터페이스(API)를 제공하고 있다. 생성 AI 업체들은 GPT4 API를 자사 서비스에 접목해 AI 기능을 구현하는 식이다. 국내 생성 AI 업체 뤼튼테크놀로지스와 업스테이지는 최근 자사 AI 서비스에 GPT4를 적용해 업계에서 주목을 받고 있다. 한국일보는 두 업체에 GPT3.5와 GPT4의 수준 차이를 물어봤다.



'가, 나, 다, 라' 순으로 시작하는 한국어 소설도 써줘


GPT3.5 기반의 챗GPT는 영어 질문 대비 한국어 질문에 약점을 보였는데 영어에 비해 학습 데이터양이 부족했기 때문이라는 분석이 나온다. 반면 GPT4를 적용한 각 사의 생성 AI는 좀 더 창의적이고 난이도가 있는 한국어 질문에도 척척 답했다.

이세영 뤼튼테크놀로지스 대표는 "GPT4와 GPT3.5 모두 데이터 학습 기간은 차이가 없는 것으로 밝혀졌지만 내부적으로 테스트를 해봤을 때 알잘딱깔센 같은 한국어 유행어를 알아차리는 능력이 더 좋아졌다"며 "보다 질 좋은 한국어 데이터를 가지고 공부한 것으로 보인다"고 말했다.

업스테이지의 경우 '업스테이지라는 AI 기업이 우주를 탐사하는 로봇을 만들어 위기를 극복한다는 내용의 소설을 각 문단에 한글 자음 순서로 시작하도록 작성해줘'라는 질문을 GPT4를 적용한 AI 서비스 '아숙업'에 던졌다. 사람도 선뜻 대답하기 어려운 질문이다. 하지만 아숙업은 곧바로 가, 나, 다, 라로 시작하는 그럴듯한 답변을 만들어냈다.

이 질문은 오픈AI가 GPT4를 공개하면서 AI의 창의성을 선보이기 위해 '신데렐라 줄거리를 문장으로 설명하되, 각 단어는 반복되는 글자 없이 알파벳 A부터 Z로 시작해'라고 물어본 것과 비슷한 질문이다. 한국어 수준이 그만큼 높아졌다는 것이다.

챗GPT의 가장 큰 한계로 꼽혔던 사실 아닌 정보를 마치 사실처럼 알려주는 '환각(거짓 답변 현상)' 문제도 상당히 개선됐다고 한다. 뤼튼테크놀로지스는 GPT3.5와 GPT4를 각각 적용한 뤼튼에 '조선시대에 있었던 조직 '뤼튼'에 대해 알려줘'라고 물어봤다. GPT3.5 버전은 "뤼튼은 조선 중기 경복궁의 의궤 좌우에 위치한 창고의 지명"이라는 거짓 정보를 생성했지만, GPT4 버전은 "조선시대에 존재한 뤼튼이라는 조직에 대한 정보는 확인할 수 없습니다"라고 답했다.

기억력(저장능력)이 향상된 점도 눈에 띄었다. 오픈AI에 따르면 GPT3.5는 사용자와 주고받는 대화를 단어 8,000개까지 기억한 반면 GPT4에서는 6만4,000개로 늘어났다. 책으로 보면 50페이지 수준이다. 김 대표는 "이용자가 과거에 물어봤던 내용을 바탕으로 보다 최적화된 답변을 생성할 수 있다는 점"이라며 "맞춤형 서비스를 구현하는 데 도움을 받을 것 같다"고 말했다.



"추론형 질문, 환각 문제 여전히 약점…그럼에도 인간에 가까워져"


다만 GPT4가 GPT3.5와 마찬가지로 2021년 9월 이전의 정보만 학습했다는 한계는 여전하다. 2021년 이전에는 사실이었던 정보가 현재는 다를 경우 환각 문제는 여전히 발생할 수 있다.

지식을 단순히 불러올 뿐 아니라 이후 특정 연산을 통해 정보를 소화해야 하는 추론형 질문이나 온라인에 정보가 없는 질문의 경우 단점이 확인됐다. 박은정 업스테이지 최고과학책임자(CSO)는 "'업스테이지에 AI 엔지니어는 누구누구가 있어?'라는 질문에 사람은 링크드인 등 사이트에 들어가서 AI 엔지니어를 추릴 수 있지만 GPT4는 아직 그렇게 하지 못한다"며 "GPT4가 여전히 인간 수준의 AI에 도달하지 못했다고 보지만 훨씬 빠르게 가까워지고 있다"고 말했다.

GPT4는 GPT3.5보다 훨씬 큰 매개변수(파라미터)를 학습해 구현된 만큼 작동 속도가 다소 느려졌고, 가격도 비싸졌다. 챗GPT에 적용된 GPT3.5 모델보다 API를 빌려 쓰는 비용 또한 열다섯 배 높다.

그럼에도 AI 개발자들은 GPT4가 사회적으로 엄청난 변화를 일으킬 것이라고 확신했다. 박 CSO는 "GPT4의 등장으로 많은 분야에서 AI로 인한 파괴적 자동화가 발생할 것"이라며 "AI가 생성하는 콘텐츠가 폭발적으로 늘어나면서 인간이 만든 콘텐츠와 기계가 만든 콘텐츠를 나누거나 양질의 콘텐츠를 판별하는 게 검색계에서의 또 다른 과제가 될 것"이라고 말했다.

안하늘 기자