국내 최대 포털 네이버가 오늘 초거대 인공지능(AI) ‘하이퍼클로바X’를 오픈한다. 구글, 마이크로소프트(MS) 등 해외 빅테크들의 생성형 AI 시장 독점이 심화하는 가운데 베일을 벗는 것인 만큼 기대가 크다. 하지만 반드시 짚어야 할 문제가 있다. 아무런 비용도 치르지 않고 AI 학습에 이용한 뉴스기사를 비롯한 수많은 콘텐츠들이다. 한국 AI 기술을 고도화하는 것이 중요하지만 콘텐츠 저작권보다 우선할 수는 없다.
초거대 AI는 대용량 데이터를 스스로 학습해 사람처럼 종합적 추론이 가능한 차세대 AI다. 챗GPT 등 생성형 AI도 이를 기반으로 한다. 문제는 하이퍼클로바X가 AI 학습에 활용했다는 50년치 제휴 언론사의 기사들이다. 네이버는 ‘서비스 연구를 위해서는 사전 동의 없이 정보를 이용할 수 있다’는 옛 제휴약관(8조3항)을 근거로 뉴스 콘텐츠를 학습에 이용했다는 입장이다. 지난 6월 언론계 반발로 동의 절차를 거치도록 약관을 개정했지만, 하이퍼클로바X의 개발을 이미 끝내놓은 뒤였다. 두루뭉술하게 만들어진 일방적 약관을 토대로 슬그머니 언론사들을 기망한 것에 다름없다.
신문협회는 그제 “정당한 법률 근거 없이 뉴스 콘텐츠를 AI 학습에 이용하는 것은 언론사의 권리 침해”라는 입장을 냈다. 네이버를 비롯해 카카오, 구글, MS 등 국내외 대형 AI업체들에 콘텐츠 이용기준 협의, 적절한 사용료 지급 등을 요구하는 내용도 담았다.
국내 언론이 무리한 요구를 하는 게 아니다. 해외 언론들은 훨씬 적극적이다. 미 뉴욕타임스(NYT)는 최근 챗GPT 개발사인 오픈AI가 웹페이지에 게시된 뉴스 콘텐츠를 자동으로 긁어가는 ‘GPT봇’의 접근을 막았다. 오픈AI를 상대로 법적 대응에 나서는 것까지 검토 중이라고 한다. 로이터, 니케이 등도 자사 데이터의 대량 수집을 막아뒀다고 한다.
토종 AI 발전도 저작권 보호의 토대 위에서 이뤄져야 한다. 공짜로 뉴스를 학습한 AI의 결과물이 언론사 콘텐츠와 경쟁을 하는 건 누가 봐도 불공정하지 않은가. 초거대 AI 시장이 건강하게 발전하길 바란다.