책 이미지
책 정보
· 분류 : 국내도서 > 경제경영 > 기업 경영 > 세무/재무/회계
· ISBN : 9788965022893
· 쪽수 : 184쪽
책 소개
목차
프롤로그
‘통계학’이 뭐지? ―‘돈’과 ‘노동력’의 낭비를 막는다!
통계학에 대해 사람들이 ‘오해하는 것’
전부를 조사하지 않아도 전체상을 어느 정도 알 수 있다
통계학은 ‘편향되지 않을 것’이 전제
편향된 데이터가 필요할 때도 있다
무작위는 의외로 어렵다
과부족 없이 하기도 어렵다
1장 히스토그램, 평균값, 분산, 표준편차
―‘통계학’은 여기서부터 시작하자!
가장 대중적인 통계학 ‘히스토그램’
누구나 할 수 있는 주사위 히스토그램
‘도수’와 ‘계급값’이란 무엇인가
평균값, 분산을 계산해보자
통계학에서 ‘평균값’을 구하는 방법
데이터가 퍼진 상태를 나타내는 ‘분산’
직접적인 수치를 나타내는 표준편차
편찻값을 계산하는 방법을 알고 있나?
편찻값이 무엇일까?
편찻값을 계산해보자
표준편차로 편찻값이 오른다? 내린다?
단 한 번의 시험으로 학력을 측정할 수는 없다
2장 정규분포
―가장 대중적인 ‘분포의 왕’
‘정규분포’란 무엇일까?
좌우대칭의 산처럼 생긴 그래프
어떤 데이터가 정규분포를 그리는가
평균값과 분산이 중요한 이유
가우스가 증명한 표준정규분포
‘오차’란 무엇인가
표준정규분포는 왜 특별한가
데이터를 ‘정규화’한다
정규분포가 통계학을 수월하게 하는 이유
통계학은 먼저 ‘가정’을 한다
3장 이항분포
―세상의 ‘온갖 현상’이 여기에 있다
이항분포란 무엇인가?
이항분포는 확률분포의 일종이다
이항분포를 이해하기 위한 전제 ‘조합’
‘조합’과 ‘순열’을 알아보자
‘조합’이란?
순열이란?
조합은 ‘중복’, 순열은 ‘별개’라고 생각한다
수학은 공식을 몰라도 풀 수 있다
주사위를 이용해서 이항분포를 이해하자
베르누이 시행이란 무엇인가
여러 가지 값의 범위 ‘확률변수’
주사위로 해석하는 ‘이항분포’
이항분포 정리식을 이해하자
4장 정규분포와 이항분포
―중요한 아 두 분포는 어떤 관계인가?
통째로 외우면 좋은 ‘중심극한정리’
‘중심극한정리’란 무엇인가?
중심극한정리와 이항분포
‘숫자 3개’로 그래프를 이해한다
이항분포의 ‘평균’과 ‘분산’
정규분포의 특징은 이항분포에도 적용된다
5장 시청률.출구조사의 원리
―세상의 수수께끼를 통계학으로 해명한다
총세대수 5800만
8400분의 1의 샘플로 어떻게 시청률을 알 수 있는가
시청률은 정말로 정확할까?
역시 무작위는 어렵다
시청률에는 ±2%의 오차가 있다
시청률의 ‘평균값’과 ‘분산’
왜 샘플이 90세대분이면 안 되는가
선거 출구조사로 어떻게 당선 확정을 알 수 있는가
출구조사란 무엇인가
후보가 3명인 선거구의 경우
출구조사 결과에서 알 수 있는 내용
‘무작위’가 전제조건이다
통계학을 배우기만 하고 끝이면 안 된다
후기
리뷰
책속에서
통계학은 미세한 오차는 그냥 넘어간다. 데이터를 단순하고 알기 쉽게 정리해서 처리하기 쉽게 하는 것이 목적이기 때문이다. 어떤 현상이건 어느 정도 데이터가 있으면 히스토그램을 만들 수 있다. 한 사람이 주사위를 3만 번 던지기는 힘들지만 100번 정도는 가능할 것이다. 100번을 던져서 1~6까지 6개의 숫자가 나오는 횟수를 기록한다. 그러면 쉽게 히스토그램을 만들 수 있다. 가족이나 친척의 신장을 조사해서 히스토그램을 만들어 보는 것도 좋다. 이것이 통계학을 공부하는 첫걸음이다. 일단 한 번 직접 히스토그램을 그려보자. 실전만큼 뛰어난 학습법은 없기 때문이다. 나는 지금도 통계 데이터가 있으면 히스토그램을 만들어본다. 게다가 요즘에는 엑셀에 데이터를 입력해 히스토그램을 손쉽게 만들 수 있으니, 정말 편리한 세상이다.
지금까지 통계학 초보의 초보, 첫걸음 중에서 이제 반걸음 정도 나아갔다. 편하게 올 수 있었는지? 아니면 숨이 차서 쫓아올 수 없을 지경인지? 숫자라면 무조건 뒷걸음질 치는 사람에게는 다소 골치 아픈 이야기였을 것이다. 그러면 우리 주변에 있는 대표적인 ‘편차’ 이야기를 해보자. 바로 ‘편찻값’에 대해서다. 중고등학교 시절, 시험을 보면 시험 점수 옆에 ‘편찻값’이 기재되어 있었을 것이다. 이 편찻값은 대입을 결정하는 시험에서도 중요한 기준으로 이용된다. 독자 여러분은 편찻값에 대해 얼마나 알고 있을까? 점수를 잘 받으면 편찻값이 커지고 점수가 나쁘면 작아진다는 정도는 알 것이다.
표준편차는 데이터가 퍼진 정도를 나타낸다. 즉 표준편차가 크면 데이터는 넓게 퍼지고 표준편차가 작으면 데이터는 중심으로 모인다. 퍼진 정도가 작다는 것은 시험 결과 데이터의 경우, ‘평균점 주변에 데이터가 비교적 많이 모여 있다’는 뜻이다. 반대로 퍼진 정도가 크면 시험 점수는 낮은 득점에서 고득점까지 골고루 있다는 뜻이다. 표준편차가 작은 시험에서 0점을 맞거나 100점을 맞는 것은 평균점에서 크게 벗어나는 것이다. 다시 말해 둘 다 희소성이 있다. 그러므로 0점인 사람은 극단적으로 편찻값이 작아지고 100점인 사람은 극단적으로 커진다. 이것은 두 사람의 편찻값의 차이도 커진다는 뜻이다. 한편 표준편차가 클 때는 정반대 현상이 나타난다. 점수는 평균점 근처에 모이지 않고 흩어져 있으므로 0점이나 100점도 평균점과 벗어난 정도가 상대적으로 작아진다. 숫자만 봐서는 잘 모르겠다면 그림을 그려 보면 훨씬 잘 이해할 것이다. 참고로 수학을 잘하는 사람은 숫자를 보자마자 머릿속에 그와 같은 그림이 떠오른다.