통계학 책에 빠지지 않고 등장하는 선거 여론조사 사례가 있다. 1936년 미국 대선 결과를 예측하려던 잡지 '리터러리 다이제스트'의 낭패다. 다이제스트는 재선을 노리던 민주당 프랭클린 루스벨트 대통령과 공화당 앨프 랜던 후보의 대결에서 랜던이 57% 지지를 얻어 이길 것으로 예상했다. 무려 1,000만명의 유권자에게 우편 설문지를 보내 이 중 240만명의 회신을 집계한 결과다. 하지만 투표함을 열었더니 정반대였다. 루스벨트의 득표율이 61%로 2개주를 빼고 모든 주에서 승리하는 역대급 압승이었다.
□문제는 설문지를 보낸 대상이 전체 유권자의 분포를 제대로 반영하지 않았다는 점이다. 다이제스트는 정기구독자와 전화번호부, 대학동창회나 사설클럽 회원 명부 등을 중심으로 설문 대상을 골랐다. 생활에 여유가 있어 공화당을 선호할 가능성이 높은 표본에 치우져 있었던 것이다. 표본의 크기보다 훨씬 중요한 것이 모집단의 특성을 얼마나 정확하게 반영하느냐라는 점을 일깨우는 여론조사 실패 사례다.
□반대로 컬럼비아대학 교수를 지내다 미국여론연구소를 세운 조지 갤럽은 인구학적으로 고른 분포를 지닌 1,500명의 표본으로 루스벨트의 승리를 예측했고, 그가 뒤에 세운 갤럽은 세계 최대의 여론조사기관으로 성장했다. 그러나 갤럽이라고 실패가 없었던 건 아니다. 트루먼과 듀이가 맞붙은 1948년 대선이나 오바마와 롬니의 2012년 대결을 잘못 예측했다. 결국 갤럽은 2015년 선거 승자 예측은 오차범위 내일 경우 무의미하며 승자가 누구냐에만 초점을 두게 만든다며 대선 결과 예측을 중단하겠다고 발표한다.
□기법이 나아졌다지만 4년 전 미국 대선 예측을 보면 여론조사가 실패할 가능성은 지금도 여전하다. 이번 대선은 그때와 달리 바이든 승리라는 전체 결과는 적중했다. 하지만 경합으로 예상된 플로리다, 텍사스, 오하이오에서 트럼프 선전을 여론조사로는 알 수 없었다. "세상에는 3가지 거짓말이 있다. 거짓말, 새빨간 거짓말, 그리고 통계다"는 마크 트웨인의 말은 지나치지만 여론조사의 결과는 늘 조심스럽게 받아들일 필요가 있다.