인공지능(AI)이 의사를 대체할 수 있을까.
논쟁적인 질문과 관련해 흥미로운 주장을 하는 논문이 있다. 구글 리서치와 구글 딥마인드가 지난해 말 발표한 '대규모언어모델(LLM)을 통한 정확한 감별 진단 노력'이다. 임상의 20명(무려 평균 경력 11.5년의 숙련 인재!)과 구글의 의료용 AI 메드-팜2(Med-PaLM2)가 같은 케이스(국제 학술지 뉴잉글랜드저널오브메디신에 올라온 사례 보고서 302편)를 두고 진단 대결을 펼치면 어느 쪽이 정확한가 비교 분석했다.
결과를 보고 놀랐다. 2016년 프로기사 이세돌 9단과 구글의 알파고가 벌였던 '세기의 바둑 대결'처럼 너무 일방적이라서다. 믿고 싶지 않으나 ①AI가 혼자 진단했을 때 정확도가 59.1%로 가장 높았다. 정확도는 ②임상의가 AI의 도움을 받았을 때 51.7% ③임상의가 인터넷 검색을 활용했을 때 44.4%였다. ④임상의가 홀로 진단하면 33.6%에 그쳤다.
연구진은 "(일부러) 진단하기 어려운 조건의 사례를 선정했다. AI는 복잡한 진단 과정에서 의료진을 돕는 보조적인 역할을 찾아가는 단계"라고 설명했다. LLM은 학습 데이터가 많이 쌓여야 정확도가 높아지고 오류는 줄어든다. 사례가 적은 희소질환 진단은 정확도가 떨어질 수밖에 없다. 아직 AI가 의사를 제치고 현장에서 쓰이긴 어렵단 뜻이다. 실제 일본 도쿄의과치과대 연구진이 오픈AI 챗GPT의 정형외과 질환 진단 정확도를 분석한 결과 척수병 관련 진단 성공률은 4%였다.
몇몇 연구로 AI가 의사 역할을 대체할 수 있다고 판단하는 건 당연히 무리다. 하지만 가까운 미래에 의사의 역할은 달라지지 않을까.
머지않아 의사는 LLM을 이용해 암을 더 빠르게(더 많이!) 진단하고, 시간에 쫓기는 3분 진료 대신 AI 챗봇에게 진료 내용 설명을 지시하고, 환자 기록 메모와 차트 정리도 AI 도움을 받아 쉽게 처리할 수 있을지 모른다. AI를 활용한 '업무 혁신'이 이뤄지면 진단의나 내과의의 일하는 시간과 역할도 줄어들 거라고 상상한다. 고도의 숙련이 필요한 외과의도 AI와 로봇을 활용해 수술을 쉽게 하면서 적정 수가를 보장받게 된다면, 피부과보다 외과 지원자가 많아지는 세상이 올 수도 있다.
이런 가능성이 무한하게 펼쳐진 상황에서 정부의 '의대 정원 대폭 확대'가 가져올 정책적 부작용이 걱정된다. 최상위 이공계 인재를 의대만 '싹쓸이'하면 우리나라의 반도체·AI 산업 인력은 어디서 구해야 하나. 먼 훗날 빅테크가 개발한 의료 특화 AI 서비스만 활용해야 한다면 전 국민의 민감한 건강 데이터 주권은 미국 정부에 넘어가지 않을까. (미국은 개인 정보 유출을 우려해 틱톡 금지법까지 추진 중이다!) 빌런의 조종에 의해 빅테크 AI가 일부러 잘못된 처방을 내리면 어쩌나. 반도체 경쟁이 보여주듯 이제 AI 원천 기술 확보에 힘써야 하지 않을까.
윤석열 대통령은 지난해 2월 국가 인재 양성 초석을 마련하는 제1차 인재양성전략회의를 신설하며 "글로벌 기술 패권 경쟁에서 살아남는 길은 오로지 뛰어난 과학기술 인재를 많이 길러내는 것"이라고 강조했다. 한정된 자원을 잘 배분하는 건 정부의 역할이다. 달걀을 어떻게 나눠 담느냐가 10년 뒤 국가 경쟁력을 결정지을 터. 정부가 AI보다 현명하게 지혜를 모아주길 바란다.