기후위기시계
실시간 뉴스
  • 정부의 통계를 어떻게 믿을 수 있을까?

1960년대 초, 스탠퍼드대 사회학 교수인 폴 월린과 레슬리 C.월도는 사회계층이 어린이의 학교 성적에 어떤 영향을 주는지 알아보기 위해 8학년 학생 2002명에게, 아버지의 직업을 물었다. 아버지가 하는 일과 자녀에게 주어진 삶의 기회 사이에 연관성이 있다는 연구결과가 잇달아 발표되던 때였다. 그러나 신중하게 수집한 결과에도 불구하고 두 교수는 적절한 증거로 이를 활용하지 못했다. 무엇이 잘못된 걸까.

응답한 아이들은 ‘우리 아버지는 포드에서 일한다”“전화회사에서 일한다”“목사다”는 식으로 답을 했는데, 이는 겉 보기엔 모순이 없어 보이지만, 직위와 근로 환경을 알 수 없어, 계층을 분류할 수 없는 응답이었다. 이런 부적절한 데이터가 22%에 달했다.

세계적인 사회학자 하워드 베커는 상당수 사회학적 통계가 데이터를 수집하고 현상을 설명하는 데 많은 오류가 있음을 지적한다. 그에 따르면, 정부기관의 경우, 업무환경이 어떠한지, 그로 말미암아 어떤 압박을 받는지에 따라 데이터의 정확성이 달라진다. 또한 데이터를 수집하는 숙련되지 않은 고용된 사람들도 데이터의 정확성에 영향을 미칠 수 있다.

베커는 사회학자들이 다루는 대상은 자연과학과 차이가 나지만 과학자들처럼 대상을 최대한 정확히 관찰하고 산출하며 측정할 수 있는 방법을 찾아 현실을 파악해야 한다고 강조한다. 치열하게 수치 검증을 하고 변수 통제를 해야 한다는 것이다.

부정확한 데이터는 잘못된 정책으로 연결될 수 있다. 저자는 가장 기본적인 사회데이터인 미국 인구조사를 예로 든다. 가령 1980년에 자신을 흑인으로 밝힌 사람들이 1990년에는 백인으로 답하기로 결심했다고 치자. 이들은 80년,90년에도 흑인이라고 밝히는 이들에 비해 소득이 높다고 가정했을 때. 다른 변수가 없다면, 1990년 통계는 흑인 인구의 평균 소득이 하락했다는 결과가 나오게 된다.

이는 경제 정책에 큰 변화를 만들어낼 수 있는 차이다. 따라서 저자는 “데이터에서 무언가를 추론할 때는 신중해야 하며, 무엇보다 무작위적이므로 상쇄할 수 있다는 입증되지 않은 주장을 하면서 문제를 가벼이 보지 말라고 조언한다. 그 스스로 범했던 오류를 비롯, 데이터 오류의 실수를 줄이는 법 등을 체계적으로 소개해 놓았다.

이윤미 기자/meelee@heraldcorp.com

증거의 오류/하워드 S. 베커 지음,서정아 옮김/책세상

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크