책 이미지
책 정보
· 분류 : 국내도서 > 대학교재/전문서적 > 경상계열 > 통계
· ISBN : 9788968490774
· 쪽수 : 264쪽
책 소개
목차
Workbook 1.
1) Variable & Scale / 11
2) Descriptive Statistics & Normality test / 12
Workbook 2.
1) Independent ttest / 27
2) Paired ttest / 33
3) MannWhitney U test / Wilcoxon ranksum test / 37
4) Wilcoxon signedrank test / 45
Workbook 3.
ANOVA (Analysis of Variance) / 53
1) Oneway ANOVA / 54
2) Twoway ANOVA / 60
3) Kruskal-Wallis test / 74
Workbook 4.
1) Oneway Repeated-measures (RM) ANOVA / 83
2) Twoway Repeated-measures (RM) ANOVA
including within factors / 90
3) Twoway Repeated-measures (RM) ANOVA
including one between factor and one within factor / 101
4) Friedman test / 110
Workbook 5.
1) x2_test / 117
2) Fisher’s exact test / 131
3) x2-test for trend / 135
4) Mc-Nemar’s test / 139
5) CochranMantelHaenszel (CMH) x2-test / 143
Workbook 6.
Sample size and power / 151
1) for independent t-test / 154
2) for paired t-test / 157
3) for one-way ANOVA / 160
4) for two independent proportions / 167
5) for one-way RM ANOVA / 173
Workbook 7.
Analysis of Covariance (ANCOVA) / 179
1) with one covariate / 181
2) with multiple covariates / 188
Workbook 8.
Regression analysis / 203
1) Simple regression / 204
2) Multiple regression / 220
3) Log transformation / 237
Appendix
부록 A. Guideline for Statistical Analysis / 249
부록 B.
부표 B1. 이항분포표 / 252
부표 B2. 표준정규분포표 / 254
부표 B3. t-분포표 / 255
부표 B4. x2-분포표 / 256
부표 B5. F 분포표 / 258
저자소개
책속에서
머리말
통계학은 의학, 치의학, 간호학, 생물학, 사회학 등 다양한 학문에서 얻어진 데이터를 분석할 때 매우 중요한 역할을 하고 있으며, 이런 추세는 향후 빅 데이터를 처리해야 하는 멀티미디어 시대에는 더욱 확산될 것이다. 이러한 데이터를 가지고 통계 소프트웨어를 이용하여 비교적 간편하게 분석 결과를 얻을 수 있는데 시중에 기초 통계학 책들이 많이 있음에도 불구하고 주로논문에서 사용되는 필수적이고 기본적인 통계 분석 방법들과 이론이 겸비된 책은 찾기 어려운 실정이다. 이에 저자는 전남대학교에서 해온 강의와 의치의학 분야에서 통계 컨설팅 경험에 기반하여, 분석에 필수적인 통계 방법들과 이론들로 이 책을 구성하고자 하였다. 이론을 모른 채 통계 소프트웨어만을 사용했을 때 경험할 수 있는 블랙홀로 빠지는 듯한 느낌을 없애고자 실질적인 데이터 분석 처리 과정뿐 아니라 그 이론적 근거 및 최종결과의 산출 및 해석을 자세하게 이 책에서 보여주고자 하였으며, 예제를 이해하기 쉬운 예제로 하여 통계 분석을 하고자 하는 관련 분야의 많은 전문가들에게 도움이 되고자 하였고 학부 및 대학원 강의교재로 활용할 계획이다.
본서는 저자 본인이 강의를 하면서 필요성을 느낀 부분을 초고로 만들어 그 후 여러 차례 수정 보완한 것이며, 담긴 내용은 통계 분석 시 기초적이며 필수적으로 알아야 하는 기술통계 및 정규성 검토, 두 군 비교 시 사용되는 ttest, 세 군 비교 시 사용되는 ANOVA, 반복 측정에서 사용되는 반복측정
ANOVA, 범주형 자료를 위한 카이제곱 검정, 회귀분석, 공분산 분석 비모수 분석 등을 포함하고 있으며 실제로 어떻게 분석이 이루어지고 어떤 방법으로 결과가 산출되는지 자세히 다루었다. 특히 표본크기 산출 및 파워 계산에서는 무료 소프트웨어인 GPower를 이용하여 손쉽게 표본크기와 검정력을 계산하는 방법과 어떤 식으로 효과크기를 계산하는지 간략하지만 효과적으로 다루려고 하였다.
끝으로 본 도서의 집필 작업을 위해 많은 도움을 준 전남대 통계학과 학생인 안화연 학생과 이지은 학생에게 감사의 마음을 전하고 싶다.
2014. 1. 15.
저 자 임회정
Workbook 1.
Descriptive statistics and Normality test
Variable & Scale
1) 연속형 변수 : 산술적 연산이 적용될 수 있는 수치적 값을 취하는 변수
(예) 체중, 연령, 온도, 신장, 판매량, 사망률 등
2) 범주형 변수
(1) 명목척도(nominal scale) : 측정 대상을 특성만으로 범주로 구분
(예) 인종(백인, 흑인, 아시아인), 성별(남, 여), 결혼상태(기혼, 이혼, 별거, 사별, 미혼)
(2) 순위척도(ordinal scale) : 측정 대상을 특성뿐만 아니라 상대적인 순서로 구분
할당된 값은 순서의 의미만을 가지며 할당된 수치들 간의 차이는 나타내지 않음
(예) 교육정도(중졸, 고졸, 대졸), 통증정도(mild, moderate, severe)
1. 다음과 같은 데이터가 있다. 각각의 변수는 어떤 척도에 해당하는지 말해보시오.
(연속형 변수, 범주형 변수 중 명목척도, 범주형 변수 중 서열척도)
Sex: 범주형 명목척도 Height: 연속형
Age: 연속형 Weight: 연속형
Religion: 범주형 명목척도
Education: 범주형 서열척도
Descriptive Statistics & Normality test
1. 위치 및 중심척도
(1) 평균(mean) : 모든 관측결과를 합하고 이를 그 관측수로 나누는 것.
(예) 2,4,2,3,1 의 평균은?
(2) 중앙값(Median) : 관측결과를 크기순으로 배열했을 때 전체자료를 양분하는 점. (=중위수)
* 표본크기가 홀수인 경우 전체자료의 중간값
* 표본크기가 짝수인 경우 가운데 두 개 값의 평균
(예 1) 15, 12, 8, 13, 9 의 중앙값은?
Step 1. 자료를 오름차순으로 정리한다.
8, 9, 12, 13, 13
Step 2. 표본크기가 홀수인 경우 전체자료의 중간 값이므로
중앙값 = 12
(예 2) 10, 1, 7, 11, 15, 6의 중앙값은?
Step 1. 자료를 오름차순으로 정리한다.
1, 6, 7, 10, 11, 15
Step 2. 표본크기가 짝수인 경우 가운데 두 개 값의 평균이므로
중앙값 = = 8.5
(3) 최빈값(Mode) : 가장 많은 빈도를 나타내는 관측치
(예) 2, 4, 2, 3, 1, 3 의 최빈값은
답 : 2, 3
2. 변동척도
(1) 범위(Range) : 자료의 최대값과 최소값의 차이
(예) 15, 12, 8, 13, 9 의 범위
범위 : 15 8 = 7
(2) 사분위수 범위(IR=Interquartile Range)
관측수를 4등분한 경우 사분위수(quartile)라 하며 이 사분위수을 이용하여 고안한 퍼짐성의 측도가 사분위수 범위이다.
제 1 사분위수 Q1 = 25번째 백분위수
제 2 사분위수 Q2 = 50번째 백분위수 (중앙값)
제 3 사분위수 Q3 = 75번째 백분위수
사분위수 범위 = 제3사분위수 제1사분위수
극값의 영향을 받지 않는다는 장점과 관측수가 적으면 산출하기 어렵다는 단점이 있다.
(백분위수 = 얻어진 자료를 순서대로 작은 값부터 큰 값으로 정리하여 100등분 한 값)
(예 1) 1, 100, 120, 121, 123, 124, 130, 140, 10000, 200000의 사분위값들과사분위수 범위를 구하여라. (표본크기가 짝수인 경우)
[spss이용]
SPSS 윈도우에 (예 1)의 데이터를 입력한다.
(예 2) 1, 2, 3, 4, 5, 6, 7, 8, 9(표본 크기가 홀수인 경우)
[spss이용]
HW 1) Q1, Q2, Q3, IQR을 손으로 계산해 보고 SPSS를 이용하여 구하시오.
1. 짝수인 경우: 57, 58, 68, 73, 75, 76, 79, 80, 85, 88, 91, 95
2. 홀수인 경우: 9, 10, 16, 22, 22, 23, 29, 30, 32
(3) 분산과 표준편차
(4) 표준편차와 표준오차
① 표준편차: 각 데이터가 평균과 얼마나 차이를 가지는가
② 표준오차: 샘플링을 여러 번 했을 때 각 샘플들의 평균이 전체평균과 얼마나 차이를 보이는 가를 알 수 있는 통계량, 즉 평균이 얼마나 정확한가를 알 수 있는 통계량.
(예) 2,4,2,3,1 의 분산과 표준편차( ) 및 표준오차( )를 구하여라.
(5) 변동계수(Coefficient of Variation)
표준편차의 크기가 평균값에 비교하여 볼 때 어느 정도인가 하는 것을 나타내는 상대적 지표.
자료간에 관측값의 차이가 큰 경우나 (예: 어른의 몸무게와 신생아의 몸무게) 측정단위가 서로 다른 경우 (예: 키와 몸무게)에 있어서 산포도를 비교하려 할 때.
(예) 25세 어른들의 몸무게의 평균은 145파운드이고 표준편차는 10파운드였다.
그리고 11세의 어린이들의 몸무게의 평균은 80파운드이고 표준편차는 10파운드였다고 한다. 표준편차만 본다면 두 표본이 변동에 차이가 없다고 잘못 결론을 내릴 수 있다. 이때 25세 어른들의 변동계수와 11세 어린이들의 변동계수를 구하시오.
(6) 왜도(Skewness) : 자료의 비대칭도를 나타낸다.
SPSS, SAS에서는 skewness 공식으로 “adjusted FisherPearson Standardized moment coefficient”을 사용하고 있다.
(7) 첨도(kurtosis) : 분포의 뾰족한 정도를 나타낸다.
SPSS, SAS에서는 kurtosis 공식으로 Sheskin(2000)’s 공식을 사용하고 있다.
(예) 다음 관측 값을 가지고 왜도와 첨도를 계산하시오.
571.68, 241.64, 359.39, 314.01, 271.1, 434.92, 479.82, 523.94, 446.6, 392.7,
241.64, 314.01, 434.92, 429.36, 386.24
1) 왜도
2) 첨도
3. StemandLeaf Plot (줄기 잎 그림)
(예) 수동 칫솔을 이용했을 때의 치은염지수(Gingival Index)를 측정한 자료이다.
0.21 0.38 0.33 0.32
0.41 0.35 0.36 0.34
0.10 0.32 0.18 0.35
0.20 0.24 0.26 0.34
줄기 잎 그림
줄기 잎
0.1 0 8
0.2 0 1 4 6
0.3 2 2 3 4 4 5 5 6 8
0.4 1