1부
수 평가하기
개연성
통계 자료는 숫자이다 보니 우리에게 엄연하고 명백한 사실로 보인다. 마치 자연적으로 발생한 사실을 나타내는 듯하며, 관건은 그런 자료를 찾아내는 데 있는 듯싶다. 하지만 ‘사람’이 통계를 낸다는 점을 잊어서는 안 된다. 무엇을 계산할지, 어떻게 계산할지, 계산 결과 중 어떤 수치를 우리에게 말해줄지, 그런 수치를 설명하고 해석하는 데 어떤 말을 사용할지는 사람이 선택한다. 통계자료는 사실이 아니다. 해석이다. 그리고 어쩌면 당신의 해석이 통계 자료를 알려주는 사람의 해석 못지않거나 그보다 나을지도 모른다.
때로는 수치가 아예 잘못된 경우도 있는데, 보통은 먼저 간단한 개연성(그럴듯함) 검사부터 해보는 편이 가장 무난하다. 그다음에는 설령 수치가 개연성 검사를 통과하더라도 ‘수치를 어떻게 수집하고, 해석하며, 그래프로 나타냈는가’ 하는 3가지 오류가 당신에게 착각을 불러일으킬 수 있다. 수치를 어떻게 수집했는가 머릿속으로 혹은 메모지에 간단한 계산을 해보면, 대부분의 경우 주장의 개연성 여부(주장이 그럴듯한지)를 빨리 확인할 수 있다. 어떤 주장이든 그냥 곧이곧대로 받아들이지 말고, 그 내용을 조금 따져보라.
개연성을 검사할 때 정확한 수치에는 신경을 쓰지 않아도 된다. 언뜻 생각하기에는 그러면 안 될 것 같기도 하겠지만, 정확성은 여기서 중요하지 않다. 우리는 상식적으로 다음과 같은 여러 주장을 평가할 수 있다. 만약 한 친구가 크리스털 와인글라스가 식탁에서 떨어져 두툼한 카펫과 부딪혔는데 깨지지 않았다고 당신에게 말해준다면, 그 말은 그럴듯하게 들릴 것이다. 하지만 와인글라스가 40층짜리 건물 꼭대기에서 떨어져 인도와 부딪혔는데 깨지지 않았다고 또 다른 친구가 말해준다면, 그 말은 그럴듯하지 않을 것이다. 당신이 살아오면서 현실 세계를 관찰해 얻은 지식에 비춰보면 그렇게 여겨질 것이다. 이와 비슷하게, 만약 누가 자신이 200살이라거나, 라스베이거스의 룰렛 게임에서 매번 이길 수 있다거나, 한 시간에 65km를 달릴 수 있다고 말한다면, 그런 말은 그럴듯한 주장이 아니다.
다음과 같은 주장에 대해서는 어떻게 생각하는가?
캘리포니아 주에서는 대마초 금지법의 시행이 중단된 이후로 35년간 대마초 흡연자의 수가 해마다 두 배씩 증가해왔다.
그럴듯한가? 어디서부터 시작해야 할까? 가령 35년 전 캘리포니아 주에 대마초 흡연자가 한 명 있었다고 해보자. 1982년 미국의 대마초 관련 체포 사례는 전국적으로 50만 건 정도였으니, 이것은 실제보다 아주 적게 잡은 가정치다. 아무튼 흡연자 수가 해마다 두 배씩 35년간 증가한 것으로 계산하면 170억이 넘는 수치가 나온다. 이는 전 세계 인구보다 많은 수치다. - 당신이 직접 계산해보라. 해마다 두 배씩 21년간 증가한 것까지만 계산해도, 100만이 넘는 수(1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1,024, 2,048, 4,096, 8,192, 16,384, 32,768, 65,536, 131,072, 262,144, 524,288, 1,048,576)에 이른다는 사실을 확인할 수 있다. - 따라서 이 주장의 내용은 그럴듯하지 않을 뿐 아니라, 있을 수 없는 일이다. 안타깝게도 수치를 보면 겁이 나서 이에 대해 명료하게 생각하기 힘든 사람이 많다. 하지만 보다시피 여기에 필요한 것은 기껏해야 초등학교 수준의 산수와 약간의 타당한 추정뿐이다.
또 다른 예를 들어보겠다. 당신이 어떤 텔레마케팅 업무를 막 시작했다고 해보자. 그 직장에서는 판매원들이 순진한 – 그리고 아마도 짜증이 날 – 잠재 고객들에게 전화를 건다. 당신의 상사는 당신에게 동기를 부여하기 위해 이렇게 주장한다.
우리 최우수 판매원은 하루에 1,000건의 판매를 성사시켰어.
이 주장은 그럴듯한가? 지금 당장 아무 전화번호나 눌러보자. 아마 최대한 빨리하면 5초 정도 걸릴 것이다. 전화벨이 울리는 시간으로 5초를 더 잡자. 이제 모든 전화 통화가 판매로 이어진다고 가정하자. 물론 실제로 그러기는 힘들지만, 이 주장에 되도록 유리한 조건을 만들어주고서 그 내용이 우리에게 먹혀드는지 확인해보자. 구매를 권유하고 그런 설득에 성공하는 데 최소한 10초는 걸리고, 그 다음에 구매자의 신용 카드 번호와 주소를 알아내는 데 40초가 걸린다고 하자. 그렇다면 1분(5+5+10+40=60초)에 한 통화를 하는 셈이니, 한 시간에 60건의 판매가 이루어져서, 여덟 시간 동안 쉼 없이 몹시 바쁘게 일하면 480건의 판매가 성사될 것이다. 추정치를 가장 낙관적인 수준으로 잡아도 1,000건이라는 수치는 전혀 그럴듯하지 않다.
어떤 주장은 평가하기가 더 힘들다. 다음은 2013년 『타임Time』지의 한 기사 제목이다.
화장실을 가진 사람보다 휴대폰을 가진 사람이 더 많다.
이 주장은 어떻게 다뤄야 할까? 우리는 화장실이 없는 개발도상국 사람들의 수를 생각해볼 수 있고, 잘사는 나라에는 휴대폰을 2대 이상 가지고 있는 사람이 많다는 관찰 결과도 생각해볼 수 있다. 이 주장은 ‘그럴듯한’ 것 같다. 이는 우리가 그것을 받아들여야 한다는 뜻이 아니라, 그냥 그것을 터무니없는 주장으로 일축해버릴 수가 없다는 뜻이다. 이 주장은 다른 방법으로 평가를 받아야 하겠지만, 개연성 검사에는 통과한다.
때로는 당신이 직접 조사를 해보지 않으면 주장을 쉽게 평가할 수 없는 경우도 있다. 물론 신문과 웹사이트가 우리를 위해 조사해줘야 마땅하지만 그들이 항상 그렇게 하지는 않는데, 제멋대로인 통계 자료는 바로 그런 식으로 주도권을 잡는다. 몇 년 전에 널리 보도된 통계 자료 중 하나는 다음과 같았다.
미국에서는 해마다 15만 명의 소녀와 젊은 여성이 거식증으로 죽는다.
자, 그러면 이 주장의 개연성을 검사해보자. 우리는 자료 조사를 조금 해봐야 한다. 미국 질병관리센터에 따르면, 15~24세의 소녀와 성인 여성 가운데 한 해 동안 ‘온갖 원인으로’ 죽는 사람의 수는 8,500명 정도다. 25~44세의 여성을 포함시켜도 5만 5,000명이라는 수치밖에 안 나온다. 한 해 동안 거식증으로 사망하는 사람의 수가 ‘전체’ 사망자 수의 세 배일 리는 없다.
『사이언스Science』지에 실린 한 논문에서 루이스 폴락Louis Pollack과 핸스 와이스Hans Weiss는 콤샛COMSAT이라는 미국 통신 위성 회사가 설립된 이후 다음과 같은 변화가 있었다고 보고했다.
전화 통화료는 1만 2,000% 인하되었다.
요금이 100% 인하되면, 원래 요금이 얼마였든지 간에 0원이 된다. 요금이 200% 인하되면, 당신이 서비스 이용 대가로 ‘공급자에게’ 지불하던 금액만큼을 공급자가 ‘당신에게’ 지불하게 된다. 100% 인하도 극히 드문 일인데, 하물며 1만 2,000% 인하라니 과연 그것이 가능하기나 할까. 상호 심사 저널인 『경영 개발 저널Journal of Management Development』에 실린 어떤 기사에서는 새로운 고객 관리 전략을 실시한 후에 고객 불만 건수가 200% 감소했다고 주장했다. 심지어 저술가 댄 케펠Dan Keppel은 자기 책에 다음과 같은 제목을 붙이기도 했다. 『내는 만큼 받자: 주식, 뮤추얼펀드 투자비, 온갖 금융 비용을 200% 절약하자Get What You Pay For: Save 200% on Stocksm, Mutual Funds, Every Finacial Need』. 그는 경영학 석사 학위MBA 보유자다. 이 정도는 알 만한 사람이 왜 그랬을까.
당연한 이야기지만, 몇몇 백분율을 각각이 나타내는 실제 수치와 관련해 제대로 비교하려면 모든 백분율을 동일한 기준치에 적용해야 한다. 임금을 50% 인하한 후에 낮은 새 임금을 50% 인상해준다고 해서 그 액수가 원래 수준으로 돌아가는 것은 아니다. 기준치가 달라졌기 때문이다. 주당 1,000달러씩 받고 있었는데 급료가 50% 깎여 500달러가 된 경우, 그 급료가 50% 올라봐야 750달러를 받게 될 뿐이다.
백분율은 매우 간단하고 명백한 듯하지만, 종종 혼란을 일으킨다. 이자율이 3%에서 4%로 오르면, 1%p 혹은 33%가 증가한다. 1%p가 3이라는 기준치에서부터 오르므로 1/3=0.33=33%가 증가하는 것이다. 이자율이 4%에서 3%로 떨어지면, 1%p가 감소하지만, 33%가 감소하는 것이 아니라 25%가 감소한다. 이제는 1%p가 4라는 기준치에서부터 떨어지기 때문이다. 연구자와 기자들이 항상 이렇게 %p와 %를 철저히 구별해서 쓰지는 않지만, 원래는 누구든 그렇게 해야 마땅한 것이다.
(본문 중 일부)
★ 저작권법에 의해 한국 내에서 보호를 받는 저작물이므로 무단전재와 복제를 금합니다.