Skip to content

게시판 글은 제한없이 읽을 수 있으며, 쓰는 것은 간단한 이메일 형식의 회원가입만으로 자유롭게 쓸 수 있습니다. 좋은 정보는 공유 많이 해주세요~ 환영합니다.^^

2010.09.24 11:32

lie of statistics

http://jeonsa.com/notice/205 info 조회 수 22873 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 수정 삭제

http://weekly.khan.co.kr/khnm.html?mode=view&dept=114&art_id=201009151423451














[커버스토리]거짓말, 새빨간 거짓말, 그리고 통계
2010 09/28위클리경향 893호
통계는 사회 현상을 나타내는 다양한 수치다. 하지만 우리는 굳이 ‘평균’에 집착한다. 양극화가 점점 더 심해갈수록 나와 우리 가정의 현재 위치가 궁금하기 때문. 그러나 대부분의 경우 평균치 아래다. 상위 몇 %가 부와 권력, 정보를 상당량 점유하면서 평균치를 끌어올리기 때문이다. 하지만 반대의 경우도 존재한다. 학원 하나 보내지 못하는 빈민층에 비하면 당신의 가정은 평균치보다 훨씬 많은 사교육비를 지출하고 있다. 여기서 당신은 경제적으로 ‘중간인’ 또는 ‘평균인’이다. 경제적 조건뿐만 아니라 사회·문화적 조건을 충족한 ‘중산층’이 아닌, 평균 소득계층을 말한다. 현실과 동떨어진 각종 통계 결과에 대해 “평균만도 못 하네”라는 면박이나 자조는 불필요하다. 대신 통계 뒤에 숨겨진 진실을 함께 생각해야 한다.

통 계를 보는 우리의 시선은 ‘평균치’다. 그러나 숫자상의 중간은 의미가 없다. 현실과 너무 동떨어져 있기 때문이다. 올 추석 연휴 열차 승차권 예매가 시작된 18일 오전 서울역 매표소 앞에서 시민들이 표를 사기 위해 길게 줄을 서 있다. |박민규 기자


서울 상도동에 사는 김인석씨(40)는 최근 언론 보도를 보곤 깜짝 놀랐다. ‘천정부지로 오르던 사교육비가 최근 감소세로 꺾였다’는 내용과 ‘학생 1인당 월평균 사교육비 17만7400원’이라는 내용 때문이다. “아이들이 크면서 가계지출 중 사교육비 지출이 가장 많다”는 김씨는 “최근 사교육비 오름세가 꺾였다는 것, 월평균 사교육비 내용 등 모두를 믿지 못 하겠다”고 말했다. 현실과 너무 동떨어진 통계 결과라는 것이다.

사교육비가 낮아졌다고?
교육과학기술부는 지난 8월 13일, 통계청의 ‘분기별 가계동향 조사’ 결과를 토대로 “지난 2분기 가구당 월평균 학원·보습비는 17만7400원으로 작년 2분기의 17만8032원보다 0.3% 감소했다”고 발표했다. 교과부의 발표대로라면 사교육비가 전년보다 감소한 것은 2007년 1분기 이후 3년 만에 처음이다. 학원 심야교습 금지, 대학 입학사정관제 도입 등 사교육 절감대책을 추진해온 교과부는 보도자료를 통해 “가계소득과 가계소비지출이 지난해보다 늘어났음에도 불구, 사교육비가 줄어든 것은 사교육비 경감대책이 소기의 성과를 나타내고 있기 때문으로 보인다”고 밝혔다.

그러나 김씨의 ‘통계 괴리감’은 정확했다. 통계청 자료를 자세히 들여다보면 국민 대다수가 생각하는 ‘사교육’ 비용은 오히려 증가한 것으로 나타났다. 통계청의 ‘분기별 가계동향 조사’를 보면 올 2분기에 성인 학원·보습비는 지난해보다 6.7%(683원) 줄어든 반면 학생 학원·보습비는 오히려 0.056%(94원) 늘어난 것으로 분석됐다. 가구당 학원·보습교육비에는 유치원, 초·중·고교 학생, 대학생, 일반 성인의 학원비 지출액이 모두 포함된다. 일반적으로 국민들이 느끼는 사교육은 학생 부문에 해당하는 것으로, 이 부분은 미미하나마 상승한 것이다. 결국 정부가 학생 사교육비 감소를 위해 억지로 통계를 꿰맞춘 셈이다.

지 난 2월 당시 이주호 교육과학기술부 1차관이 발표한 “2009년 사교육비 증가율이 3.9%로 2008년 증가율(5%)보다 낮아졌고 사교육비 조사 이래 최저”도 통계의 함정이다. “정부의 사교육비 절감 정책이 효과를 거뒀다”고 자평한 그가 인용한 근거 자료는 통계청의 ‘2009년 월평균 초·중·고 학생 1인당 사교육비 조사 결과’. 하지만 이 통계 역시 자세히 들여다보면 학부모 부담이 큰 중·고생의 사교육비 증가율은 전년의 2배 이상 높아진 것으로 나타났다. 중학생은 3%에서 7.9%로, 고교생은 4.6%(일반고 3.8%)에서 5.3%(일반고 8%)로 가파르게 올랐지만, 증가율이 6.6%에서 1.2%로 둔화된 초등생과 마이너스를 기록한 전문계고생(-13%) 덕분에 평균 증가율이 낮아진 것이다.

김씨는 “학부모 대부분이 사교육비 부담이 더 커지고 있다고 하는데 교과부만 한가한 소리를 하고 있다”며 “국민들의 현실과 동떨어진 통계치가 과연 어떤 의도로 나왔고, 앞으로 어떻게 정책에 활용될지 생각하면 답답하다”고 말했다. 그는 “방학이 끼여 학원 수강이 많은 3분기 사교육비 추이는 어찌 나올지 궁금하다”고 덧붙였다.

평균 급여는 ‘중위 소득’이 아니다
“거짓말에는 세 가지 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계”. 영국 빅토리아 시대의 정치가 벤자민 디즈레일리의 이 말은 통계의 과학적 허구성을 꼬집을 때 자주 인용된다. 통계의 오류와 착시에 대한 지적이다. <벌거벗은 통계>의 저자 발터 크래머는 “많은 사람들이 진실을 밝히기 위해서가 아니라 자신의 주장을 뒷받침하려는 목적으로 통계를 들먹인다”고 말했다.

의도된 통계는 다양한 대푯값을 만들어낸다. 많은 사람들이 ‘평균’이라면 산술평균을 떠올리지만 통계학에서 기하평균, 중앙값, 최빈값 등 대푯값을 정하는 방식이 다양하다. 가령 노조와 사측의 임금 협상 때 사측은 임원의 연봉까지 포함된 평균값을 임금 평균으로 주장하고(산술평균), 노조는 가장 많은 수의 직원들이 받는 연봉을 평균 임금이라고 주장한다(중앙값).

정부의 통계 발표에도 이는 적용된다. 우선 통계치를 높여 산출해내는 방법이 있다. 지난 8월 13일 통계청이 발표한 ‘2010년 2·4분기 가계동향’에 따르면 가구당 월 평균 소득은 355만2000원으로 지난해 같은 기간 대비 7.7% 증가했다. 이 같은 증가율은 관련 통계를 작성하기 시작한 2003년 이후 가장 높다는 게 통계청의 설명이다.

이런 뉴스를 접할 때 직장인이라면 누구나 자기 월급과 평균임금을 비교하게 마련이다. 평균보다 높길 바라는 마음은 당연하다. 그러나 매달 발표되는 평균임금은 산술평균이기 때문에 기쁨도 서운함도 의미가 없다는 게 통계전문가들의 말이다. 가령 1명의 매니저 월급이 500만원이고, 9명의 종업원은 각각 100만원씩 받는다고 할 때 이 식당의 평균임금은 140만원(500만원×1명+100만원×9명/10명)이 된다. 평균 이상 받는 사람은 1명뿐이고, 나머지 9명은 평균 이하에 속하는 것. 이 경우 140만원은 이 식당의 임금 수준을 ‘진실에 가깝게’ 보여준다고 말할 수 없다.

문제는 통계청의 ‘월평균 소득 상승’이라는 발표 뒤로는 임금소득의 평균값과 중위값의 차이가 날로 커지고 있다는 것이다. 여기서 평균값이란 위에서 얘기한 산술평균값이고, 중위값(median)이란 가장 적게 받는 사람부터 가장 많이 받는 사람까지 한 줄로 섰을 때 한가운데 자리하는 사람의 임금을 말한다. 현재 노동부는 중위값 평균임금을 발표하지 않고 있지만 한국노동연구원의 2008년 자료에 따르면 2008년 월평균 임금은 255만9000원, 중위값은 202만6000원으로 나타났다. 53만300원 차이로, 이 같은 차이는 해마다 커지고 있다.

임금소득의 평균값과 중위값의 차이가 커진다는 것은 그만큼 임금소득의 양극화가 진행되고 있다는 것을 의미한다. 고임금을 받는 근로자가 늘어 산술평균으로 구한 평균임금이 상승했지만, 전체 임금이 골고루 상승한 것이 아니기 때문에 결과적으로 중위값이 평균값보다 훨씬 아래로 처지게 된 것이다. 통계청의 2009년 사회조사 결과에서 우리 국민의 절반 정도가 자신의 소득에 대해 불만을 가지고 있다고 대답한 이유이기도 하다.

‘상반기 성장률 7.6%’도 통계의 착시현상이다. 한국은행에 따르면 2010년 상반기 소비, 투자, 수출은 각각 전년 대비 4.7%, 23.6%, 15.2% 증가했고 GDP는 7.6% 증가했다. 정부와 보수언론에서는 이를 두고 “지난 상반기에 관한 한 747 공약 중 일부가 이루어졌다”는 분위기이지만 이는 지난 상반기의 ‘기저효과’로 인한 것이기 때문이다. 기저효과란 비교시점의 상대적인 위치에 따라서 현재의 지표가 실제보다 왜곡되어 나타나는 현상을 말한다. 즉 호황기를 기준시점으로 비교할 때 현재의 경제지표는 실제보다 더 위축되게 나타나고, 불황기를 기준시점으로 비교하면 실제보다 더 부풀려져 나타나게 되는 현상이다.

전체 취업률의 상승에도 불구하고 20대 청년실업률이 계속적으로 증가하고 있는 가운데 8월11일 서울의 한 대학교 취업 정보 게시판 앞에서 한 학생이 게시정보를 유심히 살펴보고 있다. | 김정근 기자


홍헌호 시민경제사회연구소 연구위원은 “수치는 상당히 높지만 대부분의 사람들은 이런 실적을 체감할 수 없다고 말한다”며 “단순지표 상으로는 크게 성장했으나 그것이 단지 2008년 수준을 회복한 것에 불과했기 때문”이라고 말했다. 2009년 실적이 워낙 나쁘다 보니, 2008년 수준으로 회복한 지표들이 상대적으로 크게 나타났을 뿐이라는 설명이다.

300만명 빼고 계산한 실업률?
반면 의도적으로 낮춰진 통계도 존재한다. 지난 8월 13일 교과부가 발표한 ‘2010년 2분기 학원·보습교육비’가 대표적인 경우다. 통계청은 “전년 동기 대비 0.3% 줄었다”며 마치 전 가구에서 비슷하게 사교육비 지출이 꺾인 듯 발표했지만 문제는 월소득 100만원 이하의 계층에서는 65.6%나 줄었다는 것. 이들 계층에서는 가뜩이나 적었던 4만6740원의 평균 사교육비가 2만8228원이 됐다.

계층 간 격차는 더욱 벌어졌다. 월소득 600만원 이상인 가구에서는 사교육비가 2009년 2분기 37만4856원에서 올해 35만3857원으로 5.9% 줄어들었을 뿐이다. 이마저도 2008년 2분기에 34만6101원이던 것과 비교하면 오히려 조금 늘어난 액수다. 월소득이 100만원 이하인 가구와 600만원 이상인 가구의 사교육비 격차는 2003년에는 7.66배이던 것이 2008년 10.14배, 2010년 11.28배로 가파르게 상승했다.

실업률 또한 정부의 입맛대로 통계를 내는 경우에 해당한다. 통계청이 지난 8월 11일 발표한 ‘2010년 7월 고용동향’에 따르면 7월 고용률은 59.8%로 전년 동월 대비 0.4포인트 상승했다. 7월 현재 취업자가 2430만1000명으로 전년 동월 대비 47만3000명 증가했다는 것이다. 이와 함께 실업자는 청년층 및 50·60대의 구직활동 증가로 93만1000명으로 4000명 늘어났으며 실업률은 3.7%로 전년과 같은 수준을 유지했다. 15~29세의 청년실업률은 8.5%를 기록해 지난달의 8.3%에 비해 0.2%포인트 높아지는 등 여전히 높은 실업률을 나타냈다. 통계청 관계자는 “본격적인 경기회복세 속에서 수출과 투자가 늘어나고 제조업 부문의 지속적인 호조로 취업자가 늘었다”고 밝혔다.

그러나 이를 곧이곧대로 믿는 분위기는 아니다. 국내 경제학자들이 국가 경쟁력을 갉아먹는 통계의 대표 사례로 꼽을 만큼 실업률 통계는 부실하기 때문이다. 특히 통계청이 지난해 10월 발표한 ‘우리나라 공식 실업률 3.2%’는 “실업률 3%대는 자발적인 구직·이직자들을 감안하면 완전고용이 이뤄졌다는 뜻”이라는 학계의 반발을 낳기도 했다.

지난해 7월, 전국언론노동조합 회원들이 KISDI 앞에서 정보통신정책연구원의 미디어법 보고서 통계 오류를 규탄하고 있다. |김세구 기자


실업률 통계의 큰 문제는 구직이 힘들어 진학을 하거나 결혼·육아·출산 때문에 경력이 단절된 주부들, 퇴직 후 일자리를 구하는 사람들이 ‘비경제활동인구’에 포함돼 실업률 계산 자체에서 빠지는 경우가 상당히 많다는 것이다. 노동계에서는 이들을 약 300만명으로 추산하고 있다. 임시 일용직을 포함하면 광의의 실업률은 15%에 육박한다는 게 노동계의 분석이다.

게다가 노동부가 조사하는 ‘경제활동인구’에서는 공공기관 근로자가 빠지고, 통계청의 ‘전국 사업체 조사’에서는 건설일용직·방문판매 등 옥외근로자들이 제외된다. 이런 상황에서 평균 임금이나 고용 현황, 생산성 등에 관한 통계는 상당히 왜곡될 수밖에 없다는 지적이다.

왜곡된 수치의 함정에서 벗어나야
통계에 관한 베스트 셀러 <새빨간 거짓말, 통계>의 저자 대럴 허프는 “통계야말로 도저히 믿을 수 없는, 절대 쉽게 믿어선 안 되는 거짓말 중의 거짓말”이라고 했다. 사람들을 선동하기 위해, 혹은 혼란스럽게 하기 위해 없는 사실을 부풀리고, 있는 사실을 은폐하는 수법 등으로 혹세무민하는 가장 좋은 방법이 바로 통계라는 주장이다. 그게 가능한 이유는 자세히 들여다보지 않으면 쉽게 파악할 수 없는 트릭이 곳곳에 숨어 있는 데다 증거와 근거를 중시하는 현대사회가 너무 쉽게 신뢰를 주었기 때문이라는 설명이다.

통계는 경제뿐 아니라 정치·사회·문화 등 온갖 곳에서 널리 사용되고 있다. 그리고 사람들의 행동양태에 일정 정도 영향을 주고 있다. 독자들은 신문에 실린 주식 폭등 그래프를 보고 쌈짓돈을 만지작거리고, 유권자들은 사표방지 심리 때문에 여론조사에서 당선권으로 나타난 정당후보에게 투표를 하게 된다. ‘1인당 국민소득이 2만달러’라는 산술평균값에 현혹돼 주위의 가난한 사람들을 놓치게 된다.

<괴짜 통계학>의 저자 김진호씨는 “통계에서 과장된 수치의 음모를 판별할 수 있는 힘을 길러야 한다”고 강조했다. “보고 싶은 것만 보고 듣고 싶은 것만 들으려는 사람들의 자세가 결국은 ‘음험한’ 통계 남용 세력의 온상이 되고 있다”며 “통계의 마술보다 더 나쁜 것은 이런 왜곡된 수치를 들이대면서 평균을 강요하는 사회”라고 말했다. 숫자는 거짓말을 않지만 거짓말쟁이들은 숫자를 이용하고자 늘 궁리한다는 지적이다.

빠지기 쉬운 통계의 함정

승 객이 이동한 100억㎞당 사망자는 철도의 경우 9명이고 비행기는 3명이다. 그렇다면 비행기가 더 안전할까? 기준을 거리가 아닌 시간으로 바꿔 놓고 보면 승객이 타고 보낸 1억 시간당 사망자는 철도 7명, 비행기 24명이다. 결국 숫자가 사람의 눈과 머릿속에서 장난을 친 셈이다.

통계엔 산술적 평균, 평균값의 함정이 존재한다. 농부 1명이 소 40마리를 가지고 있고, 농부 9명은 소 ‘0마리’를 가지고 있다면? 통계에서 나타나는 최빈값은 ‘0마리’이고 중간값도 ‘0마리’인데, 산술평균은 4마리나 된다. 산술평균 4마리는 흔히 인용되는 숫자이지만 이것이 의미있는 실체적 진실인가에는 의구심이 든다. 산술평균은 심각한 불평등을 은폐시키는 도구로 악용될 수 있기 때문이다. 1인당 국민소득의 규모로 전 세계 국가를 줄 세우기 하는 ‘국민총생산(GDP)의 신화’가 평균값의 대표적인 함정이다.

구체적인 숫자가 나열되어 있다고 확실하게 믿을 만한가? 성경에서 아담은 930살, 그의 아들 셋은 912살까지 살았다고 써 있다. <벌거벗은 통계>의 저자 발터 크래머는 “정교한 수치가 진실이라는 환상 때문에, 또한 두루뭉술하면 성의 없다고 느낄 것이라는 우려가 겹쳐져 나타난 숫자”라고 설명한다. 심지어 영국의 신학자는 천지창조의 시점을 ‘기원전 4004년 10월 21일 일요일 오전 9시’라고 정밀하게 계산해내기도 했다.

똑같은 사실도 발표자의 의도나 관점에 따라 조작될 수 있다. ‘오늘날 전기 이용이 가능한 미국 농가는 전체 농가의 4분의 3 이상입니다’. 1948년 미국의 전기회사들이 합동으로 게재한 이 신문광고는 ‘오늘날 전기 이용이 불가능한 미국 농가는 전체의 4분의 1이나 됩니다’라는 문구로 바꿀 수 있다. 더욱이 ‘이용 가능(available)’이란 애매한 표현은 도로에서 10㎞ 가량 떨어진 곳의 농가까지 포함시키기 위한 문구였다.

표본조사가 잘못될 경우 통계 자체가 완전히 틀릴 수 있다. 1936년 미국 대통령 선거에서 ‘리터러리 다이제스트’는 1000만명, 갤럽은 단지 5만명의 표본으로 조사해 다이제스트는 공화당 후보가, 갤럽은 민주당 후보가 당선될 것을 예측했다. 결과는 갤럽의 승리였고, ‘뉴딜’로 유명한 루스벨트가 대통령이 됐다. 다이제스트의 표본은 일반인들이 아니라, 정기구독자들로, 자동차·사교클럽 소속 등 친공화당 사람들이었다. 응답자의 성향도 통계의 주요한 요인이다. 영국 여성은 평생 동안 2.9명의 남자와 섹스를 하는 반면 영국 남성은 여성파트너가 11명이나 된다는 설문조사 결과. 이는 여성은 성문제와 관련해 내숭을 떨고 남자들은 자신의 남성성을 강조하기 때문이다. 양쪽 모두 축소했거나 부풀렸을 가능성이 있다.

국내에서도 이 같은 통계의 함정은 곳곳에 존재한다. 특히 4대강 사업은 그 효과를 부풀려 비용 증가를 합리화하려는 의도가 강하다. 정부는 4대강 살리기 사업이 녹색뉴딜 사업으로 지역경제 활성화를 견인할 것이라고 설명하면서 구체적으로 34만명의 일자리가 창출되고, 40조원에 이르는 생산유발 효과로 실물경기 회복에 기여할 것이라고 주장하고 있다.

그러나 정작 구체적인 경기활성화의 근거는 제시하지 못하고 있다는 지적이다. 우선 34만명의 일자리 창출과 40조원에 달한다는 생산유발 효과만 해도 정교하지 못한 연구 결과를 그대로 보여주고 있다. 정부가 4대강 살리기 사업의 생산유발 효과를 분석하면서 적용한 것은 한국은행의 ‘2006년 산업연관표’. 10억원을 투입할 때 17.3개의 일자리가 나오고, 투입 비용의 2.04배 가량 생산유발 효과가 나온다는 식으로 정부가 밝힌 본사업비와 직접연계사업비 중 순수 공사비 19조4000억원에 17.3과 2.04를 곱하면 34만명의 일자리와 40조원의 생산유발 효과가 나오게 된다는 결론이다.

그러나 전문가들 사이에선 “4대강 사업은 하천 정비 등 대규모 토목공사가 주를 이루고 있고, 토목공사는 대형 기계 장비가 투입될 수밖에 없어 일률적으로 취업유발계수를 적용하는 것은 무리”라는 지적이 끊이지 않고 있다. 결국 정부는 마스터플랜 최종안에 국책연구기관인 건설기술연구원이 진행했던 경제적 효과 산출 연구 결과를 넣지 않는 것으로 논란을 피해가려 했다.

전문가들은 통계에 대해 ▲누가 발표했는가 ▲어떤 방법으로 조사했는가 ▲숨겨진 데이터는 없는가 ▲상식적으로 말이 되는 내용인가를 주의깊게 살펴야 한다고 조언한다. 또한 그래프를 볼 때 가파른 화살표나 등락만 살펴보지 말고, 가로축과 세로축의 단위를 살펴볼 필요가 있다는 지적이다. 그래프의 세로축이 ‘0’부터 시작된 것인지 아니면 뚝 잘라내서 가파른 기울기를 의도적으로 만들어낸 것인지를 살펴봐야 한다는 것. 가로축도 마찬가지다. 가로축이 좁을수록 그래프는 가파르게 된다. 특히 주식시장에서 가파른 그래프란 주식가격의 폭등이나 폭락을 의미하는데, 투자자들을 정신적 공황상태로 몰아가는 나쁜 그래프가 된다
?

List of Articles
번호 분류 제목 조회 수 추천 수
77 info shopping mall - 4 tip 22074 0
» info lie of statistics 22873 0
75 info 토플러의 미래학자들 "2050년 일어날 40가지 전망 8171 0
74 경제용어 통계학 이란 15168 0
73 info windows VS os x VS linux file 17860 0
72 경제용어 투자신탁 8400 0
71 경제용어 유가증권 1 8732 0
70 경제용어 증권 [ Valuable Instrument Papers ] 10038 0
69 경제용어 투자신탁 8776 0
68 info apple 반도체의 수혜주 하이닉스 9760 0
67 경제용어 매매기법 - 동시호가 8578 0
66 info 스캘퍼(초단타 매매자) 관련 뉴스 6715 0
65 info 한국 최초의 애널리스트 대우증권 8357 0
64 info 자기소개서 및 면접 7972 0
63 info 삼부토건 - 법정관리 PF (Project Financing) 대출금 2 9146 0
62 info 케인즈에 반박한 한국인 8281 0
61 info 국내에 레버리지 낮은 상품(파생) 7772 0
60 info [신문][스크랩] 2011-04-29 2 7269 0
59 info 신문 스크랩 1 7736 0
58 info 기아차 - 기아는 주요 업체중 가장 높은 57% 판매신장률 기록 6815 0
Board Pagination Prev 1 2 3 4 Next
/ 4

Jeonsa.com Engine / 2008-2017

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소