대통령 선거 예측을 잘했던 미국의 월간지 '리터러리 다이제스트'는 민주당의 프랭클린 루스벨트와 공화당의 앨프 랜든 후보가 맞붙은 1936년 대선에서 지지율 55%대 41%, 선거인단 투표에선 531대 370표로 랜든의 압승을 점쳤다. 사흘 뒤 투표 결과는 선거인단 523명을 획득한 루스벨트의 대승. 득표율도 60.8%로 예측치보다 20%포인트나 차이가 났다. 무려 240만 명을 대상으로 한 리터러리 다이제스트의 여론조사 실패는 자동차나 전화를 소유한 중류층 이상에 치우친 탓이다.
□루스벨트를 승계한 해리 트루먼 대통령과 토머스 듀이 공화당 후보의 1948년 대선 예측은 신문의 대형 오보를 낳았다. 선거기간 내내 열세를 보였던 트루먼은 선거인단 303명, 득표율 49%로 여론조사를 보란 듯이 비웃었다. ‘듀이, 트루먼을 이기다’라는 시카고 트리뷴 1면 기사를 들고 승리를 만끽하는 트루먼 사진은 여론조사 실패의 대표 이미지가 됐다. 망신살이 뻗쳤던 공화당의 도널드 트럼프와 민주당의 힐러리 클린턴의 2016년 대선 여론조사 역시 기법이 아무리 발전해도 표본 오류, 유권자 선택 편향의 우를 범한다는 사실을 상기시킨다.
□ 총선 여론조사뿐 아니라 수십만 명을 대상으로 한 출구조사마저 답답할 정도로 맞히지 못하는 게 우리 실정이다. 2016년 20대 총선이 특히 그랬다. 방송 3사 출구조사는 새누리당 123~147석, 더불어민주당 97~120석을 얻는 것으로 나왔지만 결과는 새누리당 122석, 민주당 123석으로 원내 1당이 뒤집혔다. 당시의 야권분열 편향이 분석에 반영된 탓이 아닐까 싶다. 2012년 19대나 2020년 21대 총선도 각 당 출구조사의 예상의석 극단에 있거나 범위를 벗어난 결과로 나왔다.
□ 이번 총선 사전투표율은 30% 이상 치솟아 역대 최대다. 조사대상 선택 편향에 따른 표본 오류, 무응답률 등 정확도를 좌우할 변수가 한층 커진 셈이다. 더욱이 오차범위 내 접전을 벌이는 경합지역만 50곳이 넘는다. 1~2%로 승부가 결정되는 ‘반집 승부’가 많다는 의미다. 여론조사기관이 전전긍긍하게 됐다.