Loading [MathJax]/jax/output/CommonHTML/jax.js
본문 바로가기

책/310.통계학

310 [노경섭] 제대로 시작하는 기초 통계학

반응형

한빛아카데미. 2016.06.10 초판 1쇄. 2018.03.12 초판 3쇄.

 

 

[1]

 

(p.11) 통계학은 풀이가 목적인 학문이 아니라 현실에서 발생하는 현상을 이해하는 것이 목적인 학문이다.

 

수험생의 공부에서 유익을 바라기는 어렵다. 변별에 목숨을 거는 환경에 제대로 된 가르침과 배움이 있을 리 만무하므로.

 

(p.11) 안타깝게도 우리는 고등학교에서 통계가 실생활에 어떻게 적용되고, 또 애매모호한 것들을 얼마나 이해하기 쉽게 만들어주는지를 배우지 못했다.
       (p.12) 고등학교에서는 정답을 맞추는 것에 집중했기 때문에 통계를 접하면 풀어야만 한다는 강박관념이 있다. 그러나 인문/사회과학의 통계학에서는 복잡한 수식 풀이보다는 상황에 맞는 적절한 적용이 더 중요하다. 통계학에 대한 접근은 수식 풀이가 아닌, 하나의 도구로 사용한다는 관점으로 이루어져야 한다.

 

수험생이라는 굴레를 벗고 나서야 비로소 의미 있는 공부가 시작된다. 저자는 고등학교 통계가 문제 풀이에 급급하다고 지적하지만, 이혜정의 <서울대에서는 누가 A+를 받는가>나 오찬호의 <진격의 대학교>를 보면 대학이라고 해서 사정이 별반 다르지 않은 듯.

 

 

[2]

 

학교수학에서는 고등학교의 “확률과 통계” 과목의 “모평균의 추정” 단원에서 신뢰구간을 다루는데, 그 서술이란 게 대강 이런 흐름이다:

 

              (1) 정규분포를 따르는 모집단에서 크기가 n인 표본을 임의추출한다.

              (2) 표본의 평균을 표준화한 확률변수 Z는 표준정규분포를 따른다.

              (3) 그렇다면 P(1.96Z1.96)=0.95.

              (4) 이 부등식을 적당히 변형하면 ˉX1.96σnmˉX+1.96σn이고, 이를 신뢰도 95%의 신뢰구간이라 한다.

              (5) 신뢰도 95%의 신뢰구간은 표본을 여러 번 추출하여 신뢰구간을 만들 때, 이들 중 95%는 모평균 m을 포함한다는 의미.

              (6) 한편 신뢰도 99%인 신뢰구간은 ˉX2.58σnmˉX+2.58σn.

 

       수학적 관점에서는 최선의 서술 방식인지는 모르겠으나, 처음 배우는 입장에서는 뜬금없이 확률변수 Z가 0.95의 확률이 되는 범위를 언급하는지라 영문을 알기 어렵다. 일상적인 대화로 보자면 “거기 가서 그것 좀 가져 와”에 해당하는 언사. 정규분포고 임의추출이고 전에 신뢰구간이 뭔지부터 이야기하는 게 통상의 매너다.

       수학을 전공한 양반들은 신뢰구간을 나타내는 부등식을 얼른 유도하려 안달이 나겠지만, (5)번이 가장 앞서야 마땅하다. 그런 구성으로 신뢰구간이라는 주제를 서술해 낼 깜이 되는지는 모르겠으나.

 

(p.20) 통계분석은 전체 모집단을 대상으로 분석을 진행한 것이 아니라 표본에서 결과를 얻기 때문에 그 결론이 100% 맞을 수는 없다. 물론 신뢰수준을 100%로 하는 결과로 표현할 수는 있다. 신뢰수준이 100%가 된다는 의미는 어떠한 경우에도 통계 결과가 맞는다는 의미이다. 그러면 결과 값의 범위는 예측이 불가능한 천재지변이 일어나더라도 반드시 맞아야 하므로 신뢰구간에 해당하는 값이 마이너스 무한대에서 무한대의 범위를 가져야 하는데, 이는 어디에도 활용할 수 없는, 즉 수치로서 의미가 없는 통계 결과이다. 이때 범위가 줄면 줄수록 신뢰구간은 100%에 점점 더 멀어진다. 즉 독자가 보기에 명쾌하고 정확한 결과가 도출될수록 그 결과가 틀릴 가능성은 점점 높아지는 것이다.
반응형