책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 소프트웨어 공학
· ISBN : 9791137276802
· 쪽수 : 216쪽
· 출판일 : 2022-03-11
목차
제1부 빅데이터와 R 1
1. 빅데이터와 R 1
1.1 빅데이터 소개 1
1.2 R이란 2
1.3. 설치와 유용한 환경 3
1.4. 도움말 기능 4
1.5. 주석처리 5
1.5. 단축키 사용 6
?1.6. IDE 7
1.7. 할당 기호 “=”와 “<-” 8
1.8. 데이타 제거 10
1.9. plot창 제거 10
1.10. plot의 마진설정 11
1.11. 언어설정 12
1.12. Error in plot.new() 13
2. R Studio_환경 구축과 시작 14
2.1. 경로 지정·확인하기 14
2.2. 패키지 설치·확인 15
2.3. Google Colab에서 패키지 설치 17
2.4. csv file 불러오기 17
2.5. 내장된 data 불러오기 18
2.6. 여러 csv 파일 불러오기 19
2.7. 웹페이지 불러오기 21
?2.8. excel file 22
2.9. 찾아서 불러오기 22
2.10. 파일 리스트 출력 23
2.11. 불러오기 Errors 23
2.12. .csv 저장하기 24
2.13. iris 데이터 엑셀로 저장 24
2.14. 그래프 저장하기 25
2.15. save(), load() 26
3. 데이터 타입 27
?3.1. 변수 27
3.2. 스칼라 28
3.2.1. 숫자 28
3.2.2. NA 29
3.2.3. NULL 29
3.2.4. 일반 연산자 29
3.2.5. 문자열 30
3.2.6. 진리값 31
3.2.7. 요인(Factor) 32
3.2.8. ordered = T 33
3.3. 벡터(Vector) 34
3.3.1. “c( )” 함수 34
3.3.2. 인덱싱과 슬라이싱 35
3.3.3. 벡터 연산 36
3.3.4. 벡터와 행렬 함수 37
3.3.4. seq() 38
3.3.5. rep() 38
3.3.6. 원소 치환(Substitution) 38
3.3.7. 원소의 제거 39
3.4. 리스트(List) 40
3.4.1. 리스트의 정의 40
3.4.2. 리스트내 데이터 접근 41
3.4.3. names() & unlist() 41
3.5. 행렬(matrix) 43
3.5.1. 행렬의 정의 43
3.5.2. 행렬 원소지정(Indexing or Slicing) 45
3.5.3. 행렬의 연산 46
3.5.4. 정방행렬과 ncol(), nrow() 47
3.5.5. col(row)Means(), col(row)Sums() 48
3.5.6. rbind(), cbind() 49
3.5.7. 열과 행의 이름 51
3.5.8. Error in x %*% y 52
3.6. 배열 53
3.6.1. 배열 정의 53
3.6.2. 배열 데이터 접근 54
3.7. 데이터 프레임(Data Frame) 56
3.7.1. 데이터 프레임 정의 56
3.7.2. 데이터 프레임 접근 57
3.7.3. 특수 연산자 %in%, %any% 58
3.7.4. str() head() summary() 59
3.7.5. rownames(), colnames() 60
3.7.6. 연관 검색 61
3.7.7. attach()와 detach() 62
3.8. 타입 판별 64
3.8.1. 타입 변환 65
3.8.2. 자료 구조의 확인과 변환 66
제 2부 함수,제어와 데이터 전처리 69
4. IF, FOR, WHILE 문 69
4.1. IF문 구조 69
4.2. if-else 구문 70
4.3. if-else if-else 구문 70
4.4. ifelse() 함수 71
4.5. For( ) 71
4.6. Break 71
4.7. While( ) 72
4.8. Next 72
4.9. Repeat( ) 73
4.10. NA의 처리 73
4.10.1. 결측치 확인 74
4.10.2. 결측치 대체법 (Imputation) 75
4.10.3. dplyr()로 exam.csv처리 76
4.10.4. na.rm=T 결측치 제외 79
4.10.5. mpg 데이터 조작 81
5. 함수의 정의 83
5.1. 함수 용례 83
5.2. 중첩함수((Nested Function) 84
5.3. 함수의 코드 보기 85
5.4. 스코프(Scope) 85
5.5. 기타 함수sum(), mean() 86
6. 데이타 가공 88
6.1. upSample() 함수 88
6.2. downSample() 89
6.3. scale() 표준화(Standardization) 90
6.2. 범위 정규화 minmax() 92
6.3. 기술통계량 93
6.3.1. sapply() 함수로 평균 93
6.3.2. summary() 94
6.3.3. fivenum() 함수 94
6.3.4. Hmisc 패키지의 describe() 함수 94
6.3.5. pastecs 패키지의 stat.desc() 함수 95
제 3부. 데이터 조작 98
7. 수식 연산 98
7.1. 다항식 근 찾기 98
7.2. 미분 99
7.3. 적분하기 100
7.4. iris 데이터 100
7.4. mtcars 101
8. apply 함수들 103
8.1. apply() 104
8.2. lapply() 107
8.3. sapply() 109
8.4. tapply 110
8.5. mapply() 113
9. doBy 패키지 115
9.1. summary() 115
9.2. quantile() 116
9.3. summaryBy() 119
9.4. orderBy() order() 120
9.5. splitBy() split() 122
9.6. sampleBy() sample() 125
10. 기타 함수들 129
10.1. subset() 129
10.2. merge() 131
10.3. sort(), order() 135
10.4. with(), within() 136
10.5. attach(), detach() 138
10.6. which(), which.max(), which.min() 139
10.7. aggregate() 140
10.8. stack(), unstack() 141
제4부. 데이터 조작 II 144
11. sqldf, plyr, reshape2, data.table 144
11.1. sqldf 패키지 144
11.2. plyr 패키지 145
11.2.1. adply() 145
11.2.2. ddply() 146
11.3. transform(), summarise(), subset() 148
11.3.1. transform() 148
11.3.2. summarise() 149
11.3.3. subset() 149
11.4. m*ply() 150
11.5. reshape2 패키지 151
11.5.1. melt() 151
11.5.2. complete.cases()함수를 사용하여 결측치를 처리할 수 있다. 152
11.6. data.table 패키지 153
11.6.1. 데이터 접근 153
11.6.2. system.time() 155
11.6.3. 데이터 테이블 병합 155
12. 기타 함수 157
12.1. foreach() 157
12.2. doParallel(), doMC() 158
12.3 print() 158
12.4. sprintf() 159
12.5. cat() 159
12.6. system.time() 160
12.7. Rprof() 161
제 5부 시각화 163
13. ggplot 163
13.1. 산점도 164
13.2. 그래픽 옵션 165
13.2.1. 축 이름(xlab, ylab) 165
13.2.2. 그래프 제목(main) 165
13.2.3. 점의 종류(pch) 165
13.2.4. 점의 크기(cex) 166
13.2.5. 색상(col) 166
13.2.6. 좌표축 값의 범위(xlim, ylim) 167
13.2.7. multi plot 168
13.2.8. type 169
13.2.9. 그래프 배열 170
13.3. 지터(jitter) 171
13.4. 점(points) 172
13.5. 선(lines) 174
13.6. 직선(abline) 176
13.7. 곡선(curve) 177
13.8. 다각형(polygon) 178
13.9. 데이터의 식별 180
13.9.1. 문자열(text) 180
13.9.2. 데이터의 표시 181
13.10. 범례(legend) 182
13.11. matplot () 183
13.11. 상자 그림(boxplot) 183
13.12 히스토그램(hist) 187
13.13. 밀도 그림(density) 189
13.14. 막대 그림(barplot) 190
13.15. 파이 그래프(pie) 191
13.16 모자이크 플롯(mosaicplot) 192
13.17. 산점도 행렬(pairs) 194
13.18. 투시도(persp), 등고선 그래프(contour) 195
13.18.1. persp() 195
13.18.2. contour() 198