인공지능(AI) 반도체 제조사 엔비디아의 차세대 AI 칩 '블랙웰'이 서버 과열 문제를 겪고 있다는 보도가 나왔다. 사실이라면 엔비디아의 향후 판매 실적뿐 아니라 블랙웰 확보에 이미 거금을 쓴 AI 기업들의 사업 계획에도 차질이 불가피할 전망이다.
미국 기술전문매체 디인포메이션은 17일(현지시간) 소식통을 인용해 "엔비디아가 블랙웰 과열 문제로 인해 '서버 랙' 공급업체들에 설계 변경을 요청했다"며 "이에 따라 블랙웰 출시 지연에 대한 우려가 제기되고 있다"고 전했다. 서버 랙이란 서버와 관련된 장비를 수직으로 쌓아 올릴 수 있는 구조물을 말한다.
앞서 엔비디아는 지난 3월 최대 72개의 블랙웰 그래픽처리장치(GPU)와 중앙처리장치(CPU) 등을 하나의 서버 랙에 배치한 제품을 공개했다. 문제는 이렇게 많은 GPU를 엮으면 필연적으로 강한 열이 발생한다는 점이다. 이 열이 제품의 정상적 구동에 이상을 일으킬 수 있을 정도로 과도한 상태인 것으로 추정된다.
이에 대해 엔비디아는 "엔지니어링을 되풀이하는 것은 정상적이고 예상되는 일"이라고 답했다고 로이터통신은 전했다. 특별한 문제가 아니라는 취지다.
블랙웰은 이미 한 차례 제품 결함으로 생산이 지연됐다. 대만 TSMC에서 생산하는 과정에 문제가 생겨 당초 2분기 중이었던 출시 예정 시기가 4분기까지 미뤄졌다. 이 같은 소식에 엔비디아 주가는 한동안 급등락을 반복했다. 젠슨 황 엔비디아 최고경영자(CEO)는 지난달 23일 한 행사에 참석해 "블랙웰에 설계상 결함이 있었다"고 인정하면서도 "블랙웰 칩셋을 작동시키기 위해 7가지 유형의 반도체를 처음부터 다시 설계했다"고 말했다.
만약 새롭게 제기된 과열 문제가 사실이고 단기간 내 잡히지 않는다면 블랙웰 출시 시기는 또 연기될 가능성이 있다. 디인포메이션은 "(출시가 미뤄지면) 메타, 알파벳, 마이크로소프트 같은 고객사들에 영향을 미칠 가능성이 있다"고 전했다.