슈퍼컴이 3시간 걸려 하던 날씨 예보, AI는 1분이면 가능하다고?

입력
2024.09.20 04:30
24면
7월 미국 강타한 허리케인 '베릴' 이례적 경로
예보기관 예상은 빗나갔는데, 구글 AI는 적중
GPU 수천장 사용해 예측모델 만드는 빅테크
두달 뒤 날씨, 1년 뒤 허리케인까지 내다볼까
실전 투입은 아직... 블랙박스 현상 극복 관건

편집자주

우주, 인공지능, 반도체, 바이오, 에너지 등 첨단 기술이 정치와 외교를 움직이고 평범한 일상을 바꿔 놓는다. 기술이 패권이 되고 상식이 되는 시대다. 한국일보는 최신 이슈와 관련된 다양한 기술들의 숨은 의미를 찾고 사회에 미치는 영향을 심층 분석하는 '테크 인사이트(Tech Insight)'를 격주 금요일 연재한다.

지난 7월 미국 텍사스주를 강타한 허리케인 '베릴'은 여러모로 이례적이었다. 대서양 허리케인의 규모는 보통 8~9월에 정점에 달하지만, 베릴은 6월 29일에 이미 4등급 이상이 됐기 때문이다. 기상 기록상 가장 이른 시기에 초대형급으로 발달한 허리케인이다. 지구온난화로 해수면 온도가 치솟으면서 베릴의 덩치도 순식간에 커졌다.

베릴의 영향으로 텍사스에서만 45명이 목숨을 잃고 270만 가구의 전기가 끊겼다. 미국 국립허리케인센터 등 예보 기관의 경로 예측 실패로 피해가 더욱 커졌다. 멕시코에 상륙할 거라던 예보 기관들의 예상과 달리 베릴은 텍사스로 향했다. 정작 베릴의 경로를 정확히 맞춘 건 구글의 인공지능(AI) 기상예보 시스템 ‘그래프캐스트(GraphCast)’였다. 슈퍼컴퓨터로도 맞추지 못한 베릴의 경로를 개인용 컴퓨터 한 대로도 작동하는 AI 모델이 정확히 맞춘 것이다.

기후변화로 세계에서 기상이변이 속출하지만, 슈퍼컴퓨터는 이를 따라잡지 못하고 있다. AI가 기존 기상 예측의 한계를 극복할 ‘게임체인저’로 꼽힌다. 최근 2년여간 구글, 엔비디아 등 빅테크 기업들이 공개한 AI 예보모델들은 이미 기존 예보를 뛰어넘고 있다. 우리나라를 비롯한 각국 기상청도 AI 예보모델 구축 경쟁에 뛰어들었다. AI가 정말 슈퍼컴퓨터를 대체하고 완벽한 예보를 해낼 수 있을까.

물리방정식 푸는 수치예보 vs 데이터 속 패턴 찾는 AI

지난 2일 방문한 제주 서귀포 국립기상과학원에서는 AI 예보모델 ‘알파웨더’의 실증 작업이 한창이었다. 기상청은 한국과학기술원(KAIST·카이스트)과 함께 2021년부터 알파웨더를 개발해왔다. 6시간 이내 강수에 대한 초단기 예보가 모델의 핵심이다. 알파웨더는 기상청의 2014~23년 레이더, 위성, 지상관측 데이터를 학습했다. 그동안은 주어진 데이터 안에서 연습 문제를 풀었지만, 지금은 2024년 현재 날씨를 예측하며 실전 문제를 풀고 있다. 2026년부터 실제 예보에 투입하려는 준비다.

현재 알파웨더의 성능은 슈퍼컴퓨터를 이용한 수치예보모델보다 약 20% 더 정확한 수준이다. 사례별로 다르지만 대략 80~90%의 정확도를 보이고 있다. 각국 기상청이 수십 년간 사용해온 수치예보모델을 AI가 수년 만에 뛰어넘은 것이다.

수치예보는 현재 대기의 기압과 바람, 온도 등을 관측한 값을 물리방정식에 넣어 미래를 계산하는 방식이다. 계산 하나로는 정확도가 떨어지기 때문에 여러 계산을 통합한 시나리오인 ‘앙상블’을 만들고, 이를 예보관이 검토해 최종 예보를 낸다. 이 앙상블을 만드는 데 엄청난 양의 연산을 해야 하기 때문에 고가의 슈퍼컴퓨터가 필요하다.

반면 AI는 딥러닝(인공 신경망을 통한 기계학습)으로 과거 기상관측 데이터를 학습해 변수 간의 연관성을 파악하고 미래 기상을 추론한다. 알파웨더의 경우 생성형 AI가 과거 데이터로부터 한반도의 강수 패턴을 추출하고, 맥락을 이해하는 ‘트랜스포머’ 기법으로 6시간 강수를 예측한다.

AI가 데이터를 학습하려면 길게는 몇 달이 걸린다. 하지만 일단 학습을 마치면 슈퍼컴퓨터보다 훨씬 빠르게 예보를 생산한다. 슈퍼컴퓨터가 3시간에 걸쳐 계산해 내는 시나리오를 AI는 1분도 안 돼 만들 수 있다. 기후변화로 변동성이 커진 요즘 AI의 ‘스피드’는 더욱 중요해졌다. 수십 개의 예보 시나리오를 순식간에 생성해 촘촘히 비교할 수 있기 때문이다.

이혜숙 국립기상과학원 인공지능기상연구과장은 “기후변화가 심화하면서 경험이 많은 예보관일수록 오히려 예보 정확도가 낮아지는 일들이 발생하고 있다”며 “이럴수록 초기 예측장의 미세한 변화를 반영한 다양한 시나리오를 검토해야 하는데, 그럴 때 AI가 큰 도움이 될 것”이라고 말했다.

허리케인 베릴 사례처럼, AI는 관측 상식 밖의 현상을 분석하는 데도 강점이 있다. 한반도에는 지난해 5월 5일과 올해 5월 5일 두 차례에 걸쳐 하루 200㎜ 안팎의 이례적인 폭우가 내렸다. 전국 곳곳에서 5월 일 강수량 극값을 경신한 지역이 속출했는데, 알파웨더는 이 시기 강수 강도와 지역을 상당히 정확하게 예측했다. 이 과장은 “AI 모델을 월별로 따로 학습시켰다면 지난 5월 5일 사례처럼 기존 5월 패턴과 다른 현상을 예측하지 못했을 것”이라며 “관측 데이터에서 시간 정보를 빼고 위·경도나 지형 정보만 넣어 학습을 시키자 예측 성능이 높아졌다”고 설명했다.


[☞ 기상청 레이더(왼쪽)와 AI 예보모델 '알파웨더'(가운데, 오른쪽)가 지난해 5월 5일 한반도의 강수 지역과 강도를 예측하고 있는 모습을 담은 영상. 가운데 알파웨더 모델은 오른쪽보다 학습량이 2배 많다.]

한국 AI 예보모델에 협업 제안한 엔비디아

기상과학원이 초단기 예보 모델을 개발하는 이유는 재해 대응 골든타임이 6시간이라서다. 수치예보모델은 6시간 이후 예보부터 성능을 발휘하기 때문에, AI를 통해 빈틈을 채우겠다는 것이다. 딥러닝에 필요한 그래픽 저장장치(GPU)가 부족한 현실도 고려했다. 기상과학원이 보유한 GPU는 16장이고 한번에 최대 8장까지 사용이 가능하다. 여기에 광주의 인공지능산업융합사업단이 보유한 GPU를 빌려 어렵게 모델을 테스트하고 있다.

제약에도 불구하고 의미 있는 성과를 냈다. 기상과학원에 따르면 알파웨더는 오직 관측 데이터만을 활용해 초단기 AI 예보모델을 개발한 첫 사례다. 엔비디아를 비롯한 빅테크 기업들이 알파웨더의 사례를 보고 먼저 협업을 제안했다. 각국 기상청도 자문을 요청했다. 그러나 장기적, 실질적인 협업으로 이어질지는 미지수다. 빅테크 기업들이 수천 장의 GPU를 동원해 지구 전체를 무대로 한 다양한 예보모델을 만들고 있기 때문이다.

구글 그래프캐스트와, 화웨이 클라우드의 ‘판구-웨더’는 유럽중기예보센터(ECMWF)의 30여 년 치 전 지구 기후대기 관측 재분석 자료(ERA5)를 학습해 약 2주간의 날씨를 1분 만에 예측한다. 두 모델이 모든 데이터를 학습하는 데는 한 달도 안 걸렸지만, 예보 정확도는 현재 가장 뛰어난 수치예보모델인 ECMWF의 통합예측모델(IFS)을 넘어선다고 평가된다.

엔비디아는 아예 ‘디지털 트윈’ 지구인 ‘어스2’를 만들었다. 기후 흐름을 정확히 예측하려면 대기는 물론 해양, 지하수 등 모든 정보를 수집해 복합적으로 분석해야 한다는 이유다. 어스2를 기반으로 생성형 AI인 '스톰캐스트'가 태풍의 경로와 예상 피해를 예측한다. 현재 수치예보모델이 사용하는 것보다 12배 높은 해상도의 이미지를 1,000배 빠르게 처리하는 것이 핵심이다. 엔비디아는 궁극적으로 기상 예보를 넘어 기후변화를 예측하는 것을 목표로 하고 있다.

구글이 지난 7월 국제학술지 ‘네이처’에 발표한 '뉴럴GCM(NeuralGCM)' 역시 기후 예측이 목표다. AI가 학습 과정에서 관측 데이터는 물론 기존 수치예보모델의 대규모 역학방정식까지 흡수하는 ‘하이브리드’ 방식이다. 이를 통해 1년 뒤의 허리케인은 물론, 향후 10년간의 기후 지표를 예측할 수 있는 모델을 개발하겠다는 게 연구진의 계획이다.

한국과학기술연구원(KIST)도 약 2개월의 중·장기 날씨를 예측하는 모델인 ‘카리나(KARINA)’를 개발 중이다. 카리나는 빅테크 모델이 활용한 ERA5 자료의 해상도를 10배 낮춰 학습했다. 활용 가능한 GPU가 6장이라 이에 맞춰 모델을 가볍게 구성한 것이다. 강대현 KIST 선임연구원은 “카리나는 반나절에서 하루 정도면 학습을 마치고 정확한 예측을 할 수 있는 게 장점”이라며 “향후 에너지 수요 예측 등 산업계가 활용할 수 있는 기상 자료를 제공하는 게 목표”라고 말했다.


예보관 도와 기상 넘어 기후 예측까지

빠른 성장에도 불구하고 AI 예보모델로 실제 예보를 만들어낸 사례는 없다. 각국 기상청이 자체 모델이나 빅테크 기업의 모델을 활용하고 있지만 아직 테스트에 불과하다. AI가 예보를 만들어 내는 과정을 알 수 없는 ‘블랙박스 현상' 탓이다. AI가 경험치에 따른 예측과 차이가 큰 예보를 제공할 경우 인간이 이를 좀처럼 신뢰하지 못하는 문제가 생길 수 있다. AI의 예측이 틀렸을 때 그 원인을 파악하기도 쉽지 않다.

AI가 내놓은 최종 예보 결과를 이해하고 올바르게 해석할 수 있도록 돕는 ‘설명 가능한 인공지능(XAI)’이 필요한 이유다. 윤세영 카이스트 AI기상예측연구센터장은 “알파웨더의 예측 데이터를 예보관이 충분히 이해하고 활용하도록 돕기 위해 설명 가능 AI 모델도 개발 중”이라며 “AI의 예보가 100% 정확할 순 없겠지만, 지금보다 더 나은 예측을 제공해 기상이변에 좀 더 효과적으로 대응하는 데는 큰 역할을 할 수 있을 것”이라고 말했다.

신혜정 기자
세상을 보는 균형, 한국일보 Copyright © Hankookilbo