기후위기시계
실시간 뉴스
  • 당신의 위선, 구글신은 알고있다
트럼프 지지자들의 흑인비하 단어에
낙태법·포르노 등 구글검색 수십만건

검색창에 숨겨진 인간의 욕망 읽어내
인간·사회 관찰하는 새로운 도구 부상

2008년 11월 4일은 버락 오바마가 대통령이 된 날이다. 미국 최초의 흑인 대통령이 탄생한 것이다. 그러나 그날 일부 주는 ‘최초의 흑인 대통령’보다 ‘깜둥이 대통령’을 더 많이 검색했다. ‘오바마’가 들어간 검색어 100개 중 1개에는 ‘kkk’나 ‘깜둥이’가 포함돼 있었다. 백인 국수주의자들의 사이트 검색과 가입도 평소보다 10배 늘었다. 사람들은 겉으론 아닌 척 했지만 사적 공간에서 흑인을 조롱하는 마음을 숨기지 않았다.

데이터 과학자 세스 스티븐 다비도위치는 이런 지역별 인종차별적 검색률을 바탕으로 미국의 인종주의 지도를 만들었다. 결과는 또 다른 놀라운 사실을 드러냈다. 바로 아무도 예견하지 못했던 트럼프 대통령 당선의 비밀이 숨어있었던 것. 다비도위치는 트럼프 지지층이 평소 심각한 흑인 비하 단어인 ‘깜둥이’를 검색하던 인종주의자라는 사실을 찾아냈다. 

“사람들의 정보 검색 그 자체가 정보다. 그들이 언제 어디에서 사실, 인용, 농담, 장소, 사람, 물건, 도움을 검색하는지는 그들이 정말로 어떤 생각을 하고, 어떤 욕망을 가지며, 무엇을 두려워하고, 무엇을 하는지에 관해 막연한 추측보다 훨씬 많은 것을 이야기해준다.”(‘모두 거짓말을 한다’에서)

다비도위치의 화제작 ‘모두 거짓말을 한다(Everybody Lies)’는 일상에선 발견하기 어려운 인종주의 뿐 아니라 성적 취향, 정신질환, 아동학대, 낙태 등 충격적인 인간 본성을 빅데이터를 통해 거침없이 보여준다.

그 중 현재 각국의 가장 뜨거운 이슈인 낙태 현실은 충격적이다.

저자는 낙태금지법에 영향을 받는 여성들의 구글 질문 데이터에 주목했다. 여성들이 임신중절수술을 하는 비공식적인 방법을 찾을 거란 판단에서였다. 그의 예상대로 낙태금지법이 통과된 미국의 주에서 검색빈도는 가장 높았다. 여성들은 자가낙태법을 구글 검색을 통해 찾았다. 2015년 검색건수는 70만건에 달했다. 낙태를 생각하는 여성의 상당수가 법 때문에 이를 혼자서 처리하려고 생각한 것이다.

구체적으로는 ‘임신중절약 온라인 구입’이 10만회 검색됐고, ‘허브나 비타민C’를 이용한 낙태, 옷걸이로 낙태하는 방법, 자궁에 표백제를 사용하거나 배 위에 구멍을 뚫는 방법 등의 질문이 많이 검색됐다.

구글 데이터는 실업률과 아동폭력의 연관성도 보여준다. 실업률이 1퍼센트 증가할 때마다 ‘아빠가 나를 때려요’ 와 같은 아동학대, 아동방임 검색률이 3퍼센트씩 늘어났다.그런데 실제 신고건수는 감소했다. 공식적인 통계보다 빅데이터에 진실이 있는 셈이다.

폭력영화와 범죄의 상관성은 어떨까? 1995~2004년 사이, 미 FBI의 시간별 범죄 데이터와 영화 흥행 순위, 영화의 폭력 수준 등 세가지 빅데이터 세트를 통합한 결과를 보면, 의외다. 폭력적인 영화가 주목을 받은 주말 범죄율은 오히려 떨어졌다. 이는 범죄잠재군, 알콜과 관련이 있다. 폭력영화가 상영되면 젊고 공격적인 남성은 영화를 보러 갈 확률이 높다. 또 영화관에선 술을 마실 수없기 때문에 알코올 관련 범죄가 급격히 감소한다. 


저자의 연구 중 가장 흥미로운 지점은 프로이트 이론을 데이터 과학으로 비판한 데 있다.

현대 심리학의 문을 연 프로이트는 꿈에 등장하는 대상을 성적 욕망의 상징으로 봤다. 가령 꿈에 바나나를 먹는 꿈을 꾼다면 남근에 대한 욕망을 갖고 있다고 본다. 당사자가 그저 바나나 꿈을 꿨을 뿐이라고 얘기해도 그만이다. 검증할 방법이 없기 때문이다.

데이터 과학은 이 유명한 이론을 시험대에 올린다. 저자는 꿈을 기록하는 앱의 거대한 데이터를 바탕으로 남근을 상징하는 대상이 얼마나 자주 꿈에 등장하는지 음식을 대상으로 살폈다. 즉 바나나, 오이, 핫도그 등 남근 모양의 음식이 다른 음식보다 꿈에 얼마나 자주 나오는지 빈도를 살핀 것. 꿈에 자주 나오지 않는다면 남근 상징은 그렇게 의미있는 요인이 아니기 때문이다. 결과는 우리가 일상에서 얼마나 자주 음식을 먹느냐와 관련이 있었다. 바나나는 꿈에 두 번째로 자주 등장하는데, 우리가 두 번째로 많이 먹는 과일이기도 하다. 오이는 일곱 번째로 꿈에 자주 등장하며, 역시 일곱 번재로 많이 소비되는 채소다. 잠잘 때 오이가 자주 떠오르는 이유를 설명하기 위해 오이의 모양을 문제삼을 필요가 없다는 얘기다.

저자는 ‘프로이트의 실수’라고 말하는 흔히 말실수나, 잘못쓰기 방식으로 무의식적인 성적 욕구를 드러낸다는 가설도 사람의 오타습관을 프로그래밍한 로봇 ‘에러봇’을 통해 연관성이 없음을 입증한다.

그렇다고 프로이트가 모두 틀린 건 아니다. 프로이트가 말한 오이디푸스 콤플렉스의 흔적을 포르노 사이트 데이터에서 발견한 것이다. 저자에 따르면, 포르노 사이트 방문자 중 충격적일 정도로 많은 수의 사람들이 근친상간을 묘사한 포르노를 찾았다.

저자는 “작고 네모난 빈칸에 단어나 문구를 입력하는 일상적인 행동은 작은 진실의 자취를 남기며 이 자취 수백만 개가 모이면 결국 심오한 현실이 드러난다”며, 빅데이터가 가진 힘과 적용에 유의할 점 등을 위트있게 보여준다.

이윤미 기자/meelee@heraldcorp.com
맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크