책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791175981430
· 쪽수 : 264쪽
· 출판일 : 2026-02-20
책 소개
데이터는 비로소 답을 말한다!
AI·빅데이터 시대,
확률과 통계를 다시 배우는 것만으로도
데이터 분석의 관점은 완전히 달라진다
확률과 통계는 외워야 할 공식이 아니라,
이해하면 바로 쓰이는 데이터 분석의 언어다!
21년 현업 경험과 강의 노하우를 담은
권상호 교수의 데이터 분석가를 위한 확률 · 통계 입문서
확률과 통계는 데이터 분석의 기본이지만, 비전공자에게는 늘 어렵게 느껴진다. 수식이 먼저 나오고 설명이 따라오는 방식은 이해를 돕기보다 포기를 부른다. 이 책은 그 순서를 거꾸로 잡았다. 수식보다 개념을 먼저, 공식보다 이유를 먼저 보여준다.
이 책은 확률과 통계를 그림과 실생활 예제, 그리고 손으로 직접 풀어보는 계산 과정을 통해 설명한다. 저자가 직접 그린 도식과 익숙한 사례를 따라가다 보면, 숫자와 공식이 왜 필요한지 자연스럽게 이해하게 된다. 막연했던 통계 개념이 눈에 보이는 구조로 정리된다.
AI와 빅데이터 분석이 보편화된 지금, 확률과 통계는 피할 수 없는 기초 역량이다. 기업의 사내 자격 기준은 물론, ADsP와 빅데이터분석기사 시험에서도 중요한 비중을 차지한다.
이 책은 문제 풀이 요령이 아니라, 시험과 실무에 공통으로 필요한 개념 이해에 초점을 맞춘다.
손으로 계산한 결과를 Python과 R 코드로 함께 확인하며, 이론과 실제 분석을 연결한다. 대학 교재로 활용하기에도 적합하고, 자격증을 준비하는 학습자가 헷갈려하는 개념을 정리하는 데에도 도움이 된다.
확률과 통계를 ‘어려운 과목’이 아니라 이해하고 활용할 수 있는 도구로 만들고 싶은 독자를 위한 책이다.
목차
머리말
1장 확률의 개념
1. 확률의 의미
2. 라플라스(Laplas) 확률
3. 경험적 확률
4. 표본공간과 사건
5. 사건의 종류
2장 조건부확률과 베이즈 정리
1. 조건부 확률
2. 독립사건
3. 전 확률(Total Probability)
4. 베이즈 정리(Bayes’ Theorem)
3장 확률변수와 통계치
1. 확률변수
2. 이산확률변수와 연속확률변수
3. 확률변수의 기댓값과 분산
4. 확률변수의 공분산과 상관계수
4장 이산확률분포
1. 베르누이 분포(Bernoulli Distribution)
2. 이항 분포(Binomial Distribution)
3. 다항 분포(Multinomial Distribution)
4. 기하 분포(Geometric Distribution)
5. 초기하 분포(Hyper-Geometric Distribution)
6. 포아송 분포(Poisson Distribution)
5장 연속확률분포
1. 개요
2. 균등 분포(Uniform Distribution)
3. 정규 분포(Normal Distribution)
4. t-분포(t-Distribution)
5. 카이제곱 분포(Chi-squared Distribution)
6. F-분포(F-Distribution)
7. 지수 분포(Exponential Distribution)
8. 확률밀도함수의 첨도(Kurtosis)와 왜도(Skewness)
6장 통계 추정(Statistical Inference)
1. 개요
2. 점 추정
3. 구간 추정
7장 통계 검정 개요
1. 가설검정의 개요
2. 제1종 오류와 제2종 오류
3. 검정 통계량(Test Statistic)
4. 기각역(Critical Region)
5. 유의 수준(Significance Level)
6. 유의 확률(Significance Probability)
8장 통계 검정(Statistical Test)
1. Z-검정
1) 단측 검정
2) 양측 검정
3) 비율 검정
2. t-검정
1) 단측 검정
2) 양측 검정
3) 이표본(독립표본) 단측 검정
4) 이표본(독립표본) 양측 검정
5) 대응표본 t-검정(Paird t-Test)
3. 카이제곱(χ2)-검정(모분산 검정)
4. F-검정(모분산 차이 검정)
9장 교차 분석
1. 적합성 검정(Goodness of Fit Test)
2. 독립성 검정(Test of Independence)
3. 동질성 검정(Test of Homogeneity)
10장 분산분석
1. 개요
2. 일원분산분석(One-Way ANOVA)
3. 이원분산분석(Two-Way ANOVA)
1) 반복이 없는 이원분산분석
2) 반복이 있는 이원분산분석
11장 회귀분석
1. 개요
2. 단순회귀분석(Simple Regression)
3. 다중회귀분석(Multiple Regression)
4. 최적회귀방정식(Optimal Regression Equation)
저자소개
책속에서
다른 장에서 각 분포에 대해 자세히 살펴보겠지만, 데이터를 분석하는 사람이나 처음 확률과 통계를 접하는 비전공자들에게 중요한 것은 각 분포의 함수식을 외우는 것이 아니라, 각 분포의 개념을 정확히 이해하고, 어떤 경우에 해당 분포가 어떻게 활용되는지를 잘 알아야 한다는 것이다. 일반적으로 데이터분석을 하기 위한 것이든, 자격증 공부를 하기 위한 것이든, 관련 전공 학생 또는 비전공자가 확률과 통계를 어려워하는 부분은 일반적으로 대부분의 확률 통계에 대한 교재나 책이 이론과 수식 등을 많이 나열해 놓았지만, 정작 개념의 이해나 어떻게 활용되는지에 대해서는 내용이 부족해서 일 것이다. 저자는 이를 극복하기 위해 개념을 이해시키는데, 많은 시간을 할애했으며, 많은 예제를 통해 어떻게 활용되는지에 대해서도 자세히 설명하여 독자들이 쉽게 이해할 수 있도록 하였다.
t-분포는 다양한 통계 추정과 통계 검정에 활용된다. 통계 추정에서는 모집단의 표준편차를 모르는 상황에서 표본으로부터 95%, 또는 99% 신뢰구간을 구할 때 사용된다. 통계 검정에서는 표준편차를 모르는 하나의 데이터 집단에서 추출된 표본을 가지고, 이미 알려진 데이터 집단의 평균과 같은 지, 또는 큰지, 작은 지 검정할 경우 사용한다. 또한 표준편차를 모르는 두 개의 데이터 집단에서 추출한 두 개의 표본을 가지고 모집단간 평균이 다른 지, 어느 한쪽이 큰지, 작은 지 검정할 경우에도 사용한다. 그리고 대응표본(Paired Sample)의 차이검정에서도 사용한다. 회귀분석(Regression Analysis)에서는 종속변수에 영향을 많이 미치는 독립변수를 찾는 데도 사용한다. 이렇듯 t-분포는 많은 통계 추정, 검정에 활용됨으로 잘 알아 둘 필요가 있다.
이제 유의확률을 구해보자. 유의확률, p ‐ value는 [그림 4]에서 검정통계량이 위치한 빨간점 위의 파란선 오른쪽의 면적이다. 이를 파이썬 또는 R코드로 구하면 다음과 같다.




















