책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791192932927
· 쪽수 : 648쪽
· 출판일 : 2024-12-20
책 소개
본 교재의 목표는 독자가 확률과 통계의 기본적인 이론을 이해하고, 이를 파이썬이라는 프로그래밍 언어를 통해 실제 데이터에 적용할 수 있도록 하는 것입니다. 이를 위해 우리는 먼저 파이썬 프로그래밍 환경을 설정하는 방법을 배웁니다. 이후 파이썬의 기본적인 사용 방법과 데이터 분석을 위한 다양한 라이브러리의 사용법을 학습하며, 확률과 통계의 기본 개념과 실제 데이터를 수집하고 정리하는 방법을 배우게 됩니다.
이 책은 기초 미분적분학은 배웠지만, 통계학이나 확률에 대한 경험이 없다는 점을 염두에 두고 이 분야를 쉽고 명확하게 이해할 수 있는 내용으로 준비했습니다. 통계학은 단순히 숫자를 다루는 학문이 아니라, 이 숫자들이 우리 주변 세계를 어떻게 설명하고 예측하는지를 이해하는 과정입니다. 이 책을 통해 여러분은 데이터를 분석하고, 정보를 추출하며, 불확실성 속에서 의사 결정을 내리는 방법을 배우게 될 것입니다.
이 과정에서 파이썬이라는 강력한 도구를 사용합니다. 파이썬은 그 자체로 배우기 쉽고, 강력한 프로그래밍 언어입니다. 우리는 이 언어를 통해 데이터를 처리하고 확률 및 통계적 개념을 실제로 적용해 보는 방법을 배울 것입니다.
이 책은 크게 다섯 부분으로 구성됩니다. 첫 번째, 환경 구축입니다. 파이썬과 관련 도구들을 설치하고 설정하는 방법을 배웁니다. 두 번째, 확률과 통계 기초 학습입니다. 집합과 함수, 미분과 적분 등의 기초적인 수학적 개념을 다룹니다. 세 번째, 기술통계학입니다. 자료의 정리 및 수치적 특성을 이해하고 파이썬을 통해 실습합니다. 네 번째는 확률과 확률분포입니다. 확률의 기초부터 복잡한 확률분포까지 학습합니다. 마지막으로 추측통계학입니다. 표본분포, 추정, 가설검정, 분산분석 등을 통해 데이터의 의미를 추론합니다.
각 장마다 이론 설명과 함께 실제 파이썬 코드 예제, 연습문제가 포함되어 있어 학습한 내용을 즉시 실습해볼 수 있습니다. 본 교재는 파이썬을 기반으로 하고 있지만, 프로그래밍에 대한 사전 지식이 없는 분들도 충분히 따라올 수 있도록 구성되어 있습니다. 따라서 이 교재는 데이터 분석에 관심이 있고 이 분야를 학습하고자 하는 학생들에게 적합합니다.
마지막으로, 본 교재를 통해 확률과 통계의 세계에 발을 디딜 모든 독자들이 데이터를 더 깊이 있게 이해하고 그들의 분야에서 더 나은 의사 결정을 내릴 수 있는 능력을 키우기를 바랍니다.
목차
PART 01 환경 구축
CHAPTER 01 파이썬 도구 설치
1.1 구글 코랩 개요
1.1.1 코랩의 주요 특징
1.2 코랩 환경 설정
1.2.1 코랩 메뉴 살펴보기
1.2.2 코드 셀과 텍스트 셀
1.2.3 노트북
1.2.4 새 노트북 만들고 저장하기
1.3 아나콘다 개요
1.3.1 아나콘다 다운로드와 설치
1.3.2 아나콘다 다운로드
1.3.3 아나콘다 설치
1.3.4 아나콘다 내비게이터 시작
1.3.5 넘파이, 맷플롯립, 심파이, 사이파이 설치 확인
1.3.6 주피터 노트북
1.3.7 주피터 노트북 시작하기
1.3.8 주피터 노트북 사용하기
1.3.9 마크다운으로 전환하기
1.3.10 노트북의 저장과 종료
1.3.11 주피터 노트북의 메뉴 기능
1.4 데이터 분석용 파이썬 패키지
■ 연습문제
CHAPTER 02 파이썬 기초
2.1 파이썬 개요
2.1.1 문자열 출력
2.1.2 변수와 상수
2.1.3 연산자와 수식
2.1.4 변수의 유형과 문자열
2.1.5 리스트
2.1.6 튜플
2.1.7 조건문
2.1.8 for 문
2.1.9 while 문
2.1.10 함수
2.2 NumPy 개요
2.2.1 NumPy 임포트(가져오기)
2.2.2 NumPy의 배열 생성
2.2.3 배열의 형태
2.2.4 배열 연산
2.2.5 배열 요소에 접근하기
2.2.6 함수와 배열
2.2.7 NumPy의 다양한 기능
2.3 matplotlib 개요
2.3.1 matplotlib 가져오기(임포트)
2.3.2 데이터를 선 그래프로 나타내기
2.3.3 그래프 모양 꾸미기
2.3.4 히스토그램 그리기
2.4 SciPy 개요
2.4.1 SciPy 가져오기
■ 연습문제
PART 02 확률과 통계 기초
CHAPTER 03 집합과 함수
3.1 집합
3.1.1 집합의 정의와 표현 방법
3.1.2 부분집합과 집합의 연산
3.1.3 멱집합과 집합의 카디널리티
3.1.4 유한집합과 무한집합
3.1.5 가산집합과 비가산집합
3.2 함수
3.2.1 함수의 정의와 종류
3.2.2 함수의 상과 역상
3.2.3 일대일 함수와 전사 함수
3.2.4 역함수와 합성함수
3.2.5 함수의 그래프와 시각적 해석
3.3 수열과 급수
3.3.1 수열의 정의와 일반항
3.3.2 급수와 수열의 합
3.3.3 등차수열과 등비수열
3.3.4 무한급수와 수렴
3.4 지수함수와 로그함수
3.4.1 지수함수의 정의와 성질
3.4.2 로그함수의 정의와 성질
3.5 파이썬 실습
3.5.1 집합 연산 구현
3.5.2 함수의 그래픽 표현
3.5.3 수열과 급수 계산
3.5.4 지수 및 로그함수 시각화
■ 연습문제
CHAPTER 04 미분과 적분
4.1 함수의 극한과 연속
4.1.1 극한의 정의 및 계산법
4.1.2 연속함수의 특성과 종류
4.1.3 극한과 연속의 실제 응용
4.2 미분법
4.2.1 미분의 기본 정의 및 규칙
4.2.2 도함수
4.2.3 함수의 극대점과 극소점
4.3 적분법
4.3.1 부정적분과 정적분의 개념
4.3.2 적분의 응용
4.3.3 통계학에서 적분의 응용
4.4 편미분
4.4.1 편미분과 편도함수
4.4.2 편미분의 기하학적 의미
4.4.3 편미분의 응용
4.5 중적분
4.5.1 중적분의 기본 개념 및 계산법
4.5.2 중적분의 응용
4.6 파이썬 실습
4.6.1 함수의 그래프 그리기 및 극한 계산
4.6.2 함수의 연속성과 불연속성 시각화
4.6.3 미분의 기본 정의와 규칙
4.6.4 적분의 응용
4.6.5 편미분과 편도함수
4.6.6 편미분의 기하학적 의미
4.6.7 중적분의 응용
4.6.8 편미분의 응용
4.6.9 중적분의 기본 개념 및 계산
■ 연습문제
PART 03 기술통계학
CHAPTER 05 자료의 정리
5.1 자료의 종류와 정리
5.1.1 질적 자료와 양적 자료
5.1.2 자료의 척도
5.1.3 도표의 종류
5.2 대푯값
5.2.1 대푯값의 종류
5.2.2 범위: 데이터의 최댓값과 최솟값
5.2.3 분산과 표준편차
5.2.4 변동계수
5.3 상자그림
5.3.1 상자그림: 데이터 분포의 시각화
5.4 파이썬 실습
5.4.1 대푯값 계산
5.4.2 산포도 관련 통계량 계산
5.4.3 상자그림 그리기 및 해석
5.4.4 도수분포표를 활용한 데이터 분석
■ 연습문제
PART 04 확률과 확률분포
CHAPTER 06 확률의 개념
6.1 표본공간과 사건
6.1.1 표본공간의 정의와 예제
6.1.2 사건
6.1.3 사건의 종류
6.1.4 사건의 연산
6.2 확률
6.2.1 확률의 고전적 정의
6.2.2 확률의 조건과 성질
6.2.3 확률의 상대빈도 정의
6.2.4 동등발생 정의
6.3 파이썬 실습
6.3.1 표본공간과 사건 시뮬레이션
6.3.2 사건의 연산 구현
6.3.3 확률의 고전적 정의 실습
6.3.4 확률의 상대빈도 정의를 이용한 실험적 확률 계산
■ 연습문제
CHAPTER 07 조건부 확률
7.1 조건부 확률
7.1.1 조건부 확률의 정의
7.1.2 조건부 확률의 계산 및 예시
7.1.3 사건의 독립성과 조건부 확률
7.2 독립사건
7.2.1 독립사건의 예
7.2.2 곱셈공식의 확장
7.3 전확률과 베이즈 정리
7.3.1 베이지안 통계
7.3.2 전확률
7.3.3 베이즈의 정리
7.3.4 베이즈 정리의 응용 예시
7.3.5 베이즈 정리를 통한 사후 확률 계산
7.4 파이썬 실습
7.4.1 조건부 확률 계산
7.4.2 조건부 확률 및 베이즈 정리의 구현
■ 연습문제
CHAPTER 08 확률변수와 확률분포
8.1 확률변수
8.1.1 확률변수의 정의
8.1.2 이산확률변수와 연속확률변수
8.1.3 확률질량함수와 확률밀도함수
8.2 확률분포
8.2.1 확률분포
8.2.2 확률분포의 종류
8.3 확률변수의 기댓값과 분산
8.3.1 기댓값의 정의와 성질
8.3.2 확률변수 기댓값의 특성
8.3.3 분산과 표준편차의 개념
8.4 결합확률분포
8.4.1 두 확률변수의 결합확률변수
8.4.2 결합확률분포의 정의
8.4.3 주변확률분포
8.5 공분산과 상관관계
8.5.1 공분산의 정의와 계산
8.5.2 상관계수와 그 의미
8.6 파이썬 실습
8.6.1 파이썬을 사용한 확률변수의 분포 시각화
8.6.2 기댓값과 분산의 계산
8.6.3 결합분포 및 상관관계 분석
■ 연습문제
CHAPTER 09 이산확률분포
9.1 이산형 균일분포
9.1.1 이산형 균일분포의 정의 및 특성
9.1.2 균일분포의 기댓값과 분산
9.2 베르누이 분포
9.2.1 베르누이 시행
9.2.2 베르누이 분포의 정의 및 특성
9.3 이항분포
9.3.1 이항분포의 정의 및 특성
9.3.2 이항분포의 기대값과 분산
9.3.3 이항분포의 응용
9.4 푸아송 분포
9.4.1 푸아송 분포의 정의 및 특성
9.4.2 푸아송 분포의 기댓값과 분산
9.4.3 푸아송 분포의 응용
9.5 기하분포
9.5.1 기하분포의 정의 및 특성
9.5.2 기하분포의 평균과 분산
9.5.3 기하분포의 응용
9.6 파이썬 실습
9.6.1 균일확률분포의 확률질량함수
9.6.2 이항분포의 확률질량함수
9.6.3 푸아송 분포의 확률질량함수
9.6.4 기하분포의 확률질량함수
■ 연습문제
CHAPTER 10 연속확률분포
10.1 연속형 균일분포
10.1.1 연속형 균일분포의 정의 및 특성
10.1.2 연속형 균일분포의 확률밀도함수
10.1.3 연속형 균일분포의 평균과 분산
10.2 정규분포
10.2.1 정규분포의 정의 및 특성
10.2.2 정규분포의 확률밀도함수
10.2.3 표준정규분포표
10.2.4 정규분포의 평균과 분산
10.3 감마분포
10.3.1 감마함수
10.3.2 감마분포의 정의 및 특성
10.3.3 감마분포의 평균과 분산
10.4 지수분포
10.4.1 지수분포의 정의 및 특성
10.4.2 지수분포의 확률밀도함수
10.4.3 지수분포의 평균과 분산
10.5 카이제곱분포
10.5.1 카이제곱분포의 정의 및 생성 과정
10.5.3 카이제곱분포의 평균과 분산
10.6 파이썬 실습
10.6.1 연속확률분포의 시각화
■ 연습문제
PART 05 추측통계학
CHAPTER 11 표본분포
11.1 모집단분포와 표본분포
11.1.1 모집단과 표본의 정의
11.1.2 모집단 분포와 표본분포의 차이
11.1.3 표본추출 방법과 표본분포의 중요성
11.2 표본평균과 표본분산의 분포
11.2.1 표본평균과 표본분산의 개념
11.2.2 정규모집단에서의 표본평균의 분포
11.2.3 중심극한정리와 그 의미
11.3 표본비율의 분포
11.3.1 표본비율의 정의
11.3.2 표본비율의 분포 특성
11.4 두 표본평균 차이의 분포
11.4.1 두 표본평균 차이의 평균과 분산
11.4.2 두 표본평균 차이의 정규분포 근사
11.5 파이썬 실습
11.5.1 표본평균의 분포 시뮬레이션
11.5.2 중심극한정리의 실제 데이터 적용
11.5.3 표본비율 분포의 계산 및 시각화
■ 연습문제
CHAPTER 12 추정
12.1 점추정과 구간추정
12.1.1 추정의 개념 및 중요성
12.1.2 점추정: 정의 및 예시
12.1.3 구간추정: 정의 및 중요성
12.2 모평균의 구간추정
12.2.1 모평균 추정의 중요성
12.2.2 모평균의 신뢰구간(모분산을 알고 있을 때)
12.2.3 모평균의 신뢰구간(모분산을 알지 못할 때)
12.3 모비율의 구간추정
12.3.1 모비율 추정의 중요성
12.3.2 모비율의 구간추정 방법
12.3.3 신뢰구간의 해석 및 응용
12.4 모분산의 추정
12.4.1 모평균 n를 알고 있을 때 모분산 v2의 구간추정
12.4.2 모평균 n를 모를 때 모분산 v2의 구간추정
12.5 표본의 크기 결정
12.5.1 표본 크기 결정의 중요성
12.5.2 표본 크기 결정의 원리 및 방법
12.5.3 표본 크기와 추정 정확도의 관계
12.6 파이썬 실습
12.6.1 모평균 추정
12.6.2 모비율 추정
■ 연습문제
CHAPTER 13 가설검정
13.1 통계적 가설검정
13.1.1 가설검정의 개념 및 절차
13.1.2 귀무가설과 대립가설의 설정
13.1.3 기각역
13.1.4 양측검정과 단측검정
13.1.4 p-값
13.2 오류의 유형
13.2.1 제1종 오류
13.2.2 제2종 오류
13.3 유의수준과 검정력
13.3.1 유의수준
13.3.2 검정력
13.4 모평균의 가설검정
13.4.1 모평균에 대한 가설 설정
13.4.2 단일 표본 t-검정과 z-검정
13.5 모비율의 가설검정
13.5.1 모비율에 대한 가설 설정
13.5.2 모비율의 z-검정
13.6 파이썬 실습
13.6.1 가설검정의 구현
13.6.2 실제 데이터 세트를 이용한 가설검정
■ 연습문제
부록
1. 누적표준정규분포표
2. t-분포표
3. 이항분포표
4. 푸아송분포표
5. 카이제곱분포표