챗GPT 개발사 오픈AI가 미국 뉴스 통신사 AP통신과 기사 사용 등에 대한 계약을 맺었다고 13일(현지시간) 발표했다. 1985년부터 AP가 생산해 온 뉴스 콘텐츠를 챗GPT를 학습시키는 데 이용할 수 있도록 한 것이 계약 내용의 핵심이다. 그 대가로 AP는 오픈AI AI 기술에 대한 우선 접근권을 확보했다고 한다. AI 개발 업체가 언론 매체와 제휴 계약을 맺은 건 이번이 처음이다. 단 거래 금액은 공개되지 않았다.
이 같은 소식은 오픈AI가 이미지 생성 AI 달리(DALL-E)의 훈련을 위해 이미지·영상 콘텐츠 제공 업체인 셔터스톡과 계약했다고 밝힌 지 하루 만에 나왔다. 최근 "오픈AI가 챗GPT 훈련에 남의 데이터를 무단으로 가져다 쓴다"는 비판이 거세지고 있는데 연 이틀 데이터에 값을 지불하기로 한 것이다. 줄소송에 휩싸일 가능성이 커지자 부랴부랴 수습에 나선 측면이 크지만 AI 업계 선두 업체인 오픈AI의 움직임은 업계 전반에 데이터 비용 지불 관행을 확산시킬 것이란 기대가 나온다.
오픈AI가 늦게나마 AI 훈련용 데이터를 돈 내고 갖다 쓰겠다고 결정한 배경에는 "저작권 침해를 당했다"며 소송을 제기하는 이들이 최근 부쩍 늘어난 상황이 깔려 있다. 미국의 유명 코미디언이자 작가인 세라 실버먼은 7일 오픈AI와 메타를 상대로 소송을 냈다. 그는 두 회사가 저작권이 있는 자료를 동의 없이 AI 훈련에 활용했다고 주장하면서 저작권을 침해당한 미국 내 모든 사람을 대신해서 금전적 손해 배상을 요구했다.
이에 앞서 미국과 캐나다의 소설가 두 명도 지난달 챗GPT가 허락 없이 학습에 자신들의 작품을 이용했다면서 오픈AI를 상대로 소송을 제기했다. 여기에 미국 경제매체인 월스트리트저널(WSJ) 역시 소송을 검토 중이라고 최근 밝혔다. 챗GPT가 WSJ와 로이터·가디언 등 주요 언론사 뉴스를 참조했다는 사실이 드러났기 때문이다.
AI는 학습한 데이터가 많을수록 똑똑해진다. 얼마나 많은 데이터를 확보할 수 있는지가 경쟁력으로 이어진단 얘기다. 언론사의 뉴스는 비교적 정확한 팩트를 담고 있는 만큼 AI 성능을 끌어올리는 데 특히 도움이 된다. 그동안 온라인 뉴스 등 데이터를 공짜로 긁어와 챗GPT를 학습시켰던 오픈AI가 비용 지불을 기꺼이 감수하기로 한 이유다.
테크업계에선 오픈AI와 AP 사이의 계약이 업계 표준이 될 가능성이 있다고 본다. 뉴스산업 분석가인 켄 닥터는 "AP의 조직 규모, 다른 뉴스 매체와의 깊은 관계 등을 감안할 때 거래 효과는 AP를 넘어설 것"이라고 했다. 국내 AI 개발사들의 경우 아직 저작권 관련 분쟁에 휘말린 사례는 없으나 오픈AI의 사례를 교훈 삼아 AI 훈련용 데이터 저작권 보호 등에 대한 논의를 서둘러야 한다는 게 전문가들의 말이다.