2024-04-20 07:20 (토)
[기고] 재미난 통계이야기
[기고] 재미난 통계이야기
  • 승인 2008.10.08 19:40
  • 댓글 0
이 기사를 공유합니다

Sample은 전체를 대변한다. 요즘 미국에서는 대통령 후보로 공화당 메케인 후보와 민주당의 오바마 후보가 각축을 벌이면서 여론조사에서 오바마 후보가 조금 앞서는 걸로 보도된다.

그런데 1936년 미국의 대통령 선거는 공화당의 랜던 후보와 민주당의 루스벨트후보와의 대결이었는데 워낙 중요한 일이다 보니 한 잡지사에서 여론조사를 위해 무려 1,000만명의 유권자들에게 설문지를 보냈다.

그중 230만명이 응답지를 보내왔고, 잡지사는 이를 분석한 후 랜든 후보가 큰 표 차로 여유 있게 승리할 것이라고 예측 결과를 발표했다.

그러나 대통령으로 당선된 사람은 민주당의 루스벨트 후보였다. 그것도 압도적인 지지로 당선이 되었다.

그렇다면 230만명이 되는 사람을 조사했는데 왜 이런 일이 벌어진 것일까? 바로 표본에 문제가 있었다는 것이다.

이 잡지사가 설문지를 보낸 1,000만명은 잡지의 정기 구독자와 전화번호부를 근거로 선정된 사람들이었다.

그런데 당시 미국에서는 잡지 정기구독자와 전화를 갖고 있는 사람은 소득이 높은 계층에 속했다.

그해 선거에서는 소득이 낮은 계층은 민주당을, 높은 계층은 공화당을 특히 선호하는 현상이 심했다.

따라서 잡지사가 뽑은 표본 속에는 루스벨트 후보를 지지하는 사람이 상대적으로 적을 수밖에 없었고 대표성이 없는 표본은 크기가 아무리 크더라도 전체의 특성을 올바르게 알려줄 수 없다는 귀중한 교훈을 얻었다.

그러나 요즘은 통계가 발전함에 따라 오차는 그만큼 줄어 정확할 정도이고 보면 그 중요도는 미리 짐작이 될 만하다

△평균만 알면 되나

더운 여름날 한 장군이 병사를 이끌고 적진을 향해 가고 있었다.

그런데 큰 강이 앞을 가로막고 있어 배를 띄울지, 그냥 걸어서 진군할지 고민하던 장군은 참모에게 물었다. “강의 평균깊이가 얼마나 되나?” “예, 지도에 의하면 평균깊이가 140㎝가 됩니다” “음, 우리 병사들의 평균 키가 165㎝가 넘으니 걸어서 행군해도 되겠군, 진격하라!”

그러나 강을 건너는데 성공한 병사는 전체의 10%도 채 안 되었다. 아주 수영을 잘 하는 병사들뿐이었다.

왜 이런 일이 벌어졌을까? 평균이란 깊은 곳과 낮은 곳의 깊이를 모두 합해 중간 정도의 깊이를 가늠한 것이니, 깊은 곳은 2m 넘는 곳도 있을 수 있다는 것을 생각지 못했기 때문이다.

결국 평균을 너무 믿은 장군은 눈물을 머금고 다시 돌아 갈수밖에 없었다.

평균은 전체의 모양을 알 수 있는 좋은 방법이다. 그러나 평균을 너무 모르고 믿으면 이러한 엄청난 결과를 초래한다.

△퍼센트(%)는 요술쟁이

“엄마가 지난달에 용돈을 50% 줄였다가 이 달에 50% 다시 올려 주셨어” 이 말을 듣는 사람은 용돈이 원래의 금액으로 올라갔다고 생각할 수 있다. 그러나 사실은 그렇지 않습니다. 100원의 용돈에서 50%를 깎으면 50원이 되고 그 50원의 용돈에서 50%를 올려주면 75원밖에 되지 않으니까.

또 어느 도시의 한 경찰 관리는 지난 한 해 동안 살인 사건이 67%나 증가 했다면서 정부에 예산을 올려 달라고 요구를 했다. 살인 사건이 67%나 증가했다니 엄청나게 많은 범죄가 일어난 것 같았다. 그러나 실제로는 살인 사건이 3건에서 5건으로 증가한 것이었다.

이렇듯 21세기를 사는 우리들에게 통계는 한나라의 발전과 지속적인 경제성장은 물론 경제제도의 SOS(사회간접자본)임을 깨닫고 그 역할은 어느 것 보다도 중요한 만큼 이의 사용에 있어서도 하루속히 질적 향상을 위한 노력도 꾸준히 뒤따라야만 할 것이다.

방대홍 통계청진주출장소 농업통계팀장


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.