logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

일간
|
주간
|
월간

실시간 검색어

검색가능 서점

도서목록 제공

R로 하는 빅데이터분석

R로 하는 빅데이터분석

진하수 (지은이)
부크크(bookk)
18,700원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

R로 하는 빅데이터분석
eBook 미리보기

책 정보

· 제목 : R로 하는 빅데이터분석 
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 소프트웨어 공학
· ISBN : 9791137276802
· 쪽수 : 216쪽
· 출판일 : 2022-03-11

목차

제1부 빅데이터와 R 1
1. 빅데이터와 R 1
1.1 빅데이터 소개 1
1.2 R이란 2
1.3. 설치와 유용한 환경 3
1.4. 도움말 기능 4
1.5. 주석처리 5
1.5. 단축키 사용 6
?1.6. IDE 7
1.7. 할당 기호 “=”와 “<-” 8
1.8. 데이타 제거 10
1.9. plot창 제거 10
1.10. plot의 마진설정 11
1.11. 언어설정 12
1.12. Error in plot.new() 13

2. R Studio_환경 구축과 시작 14
2.1. 경로 지정·확인하기 14
2.2. 패키지 설치·확인 15
2.3. Google Colab에서 패키지 설치 17
2.4. csv file 불러오기 17
2.5. 내장된 data 불러오기 18
2.6. 여러 csv 파일 불러오기 19
2.7. 웹페이지 불러오기 21
?2.8. excel file 22
2.9. 찾아서 불러오기 22
2.10. 파일 리스트 출력 23
2.11. 불러오기 Errors 23
2.12. .csv 저장하기 24
2.13. iris 데이터 엑셀로 저장 24
2.14. 그래프 저장하기 25
2.15. save(), load() 26

3. 데이터 타입 27
?3.1. 변수 27
3.2. 스칼라 28
3.2.1. 숫자 28
3.2.2. NA 29
3.2.3. NULL 29
3.2.4. 일반 연산자 29
3.2.5. 문자열 30
3.2.6. 진리값 31
3.2.7. 요인(Factor) 32
3.2.8. ordered = T 33
3.3. 벡터(Vector) 34
3.3.1. “c( )” 함수 34
3.3.2. 인덱싱과 슬라이싱 35
3.3.3. 벡터 연산 36
3.3.4. 벡터와 행렬 함수 37
3.3.4. seq() 38
3.3.5. rep() 38
3.3.6. 원소 치환(Substitution) 38
3.3.7. 원소의 제거 39
3.4. 리스트(List) 40
3.4.1. 리스트의 정의 40
3.4.2. 리스트내 데이터 접근 41
3.4.3. names() & unlist() 41
3.5. 행렬(matrix) 43
3.5.1. 행렬의 정의 43
3.5.2. 행렬 원소지정(Indexing or Slicing) 45
3.5.3. 행렬의 연산 46
3.5.4. 정방행렬과 ncol(), nrow() 47
3.5.5. col(row)Means(), col(row)Sums() 48
3.5.6. rbind(), cbind() 49
3.5.7. 열과 행의 이름 51
3.5.8. Error in x %*% y 52
3.6. 배열 53
3.6.1. 배열 정의 53
3.6.2. 배열 데이터 접근 54
3.7. 데이터 프레임(Data Frame) 56
3.7.1. 데이터 프레임 정의 56
3.7.2. 데이터 프레임 접근 57
3.7.3. 특수 연산자 %in%, %any% 58
3.7.4. str() head() summary() 59
3.7.5. rownames(), colnames() 60
3.7.6. 연관 검색 61
3.7.7. attach()와 detach() 62
3.8. 타입 판별 64
3.8.1. 타입 변환 65
3.8.2. 자료 구조의 확인과 변환 66


제 2부 함수,제어와 데이터 전처리 69
4. IF, FOR, WHILE 문 69
4.1. IF문 구조 69
4.2. if-else 구문 70
4.3. if-else if-else 구문 70
4.4. ifelse() 함수 71
4.5. For( ) 71
4.6. Break 71
4.7. While( ) 72
4.8. Next 72
4.9. Repeat( ) 73
4.10. NA의 처리 73
4.10.1. 결측치 확인 74
4.10.2. 결측치 대체법 (Imputation) 75
4.10.3. dplyr()로 exam.csv처리 76
4.10.4. na.rm=T 결측치 제외 79
4.10.5. mpg 데이터 조작 81

5. 함수의 정의 83
5.1. 함수 용례 83
5.2. 중첩함수((Nested Function) 84
5.3. 함수의 코드 보기 85
5.4. 스코프(Scope) 85
5.5. 기타 함수sum(), mean() 86

6. 데이타 가공 88
6.1. upSample() 함수 88
6.2. downSample() 89
6.3. scale() 표준화(Standardization) 90
6.2. 범위 정규화 minmax() 92
6.3. 기술통계량 93
6.3.1. sapply() 함수로 평균 93
6.3.2. summary() 94
6.3.3. fivenum() 함수 94
6.3.4. Hmisc 패키지의 describe() 함수 94
6.3.5. pastecs 패키지의 stat.desc() 함수 95


제 3부. 데이터 조작 98
7. 수식 연산 98
7.1. 다항식 근 찾기 98
7.2. 미분 99
7.3. 적분하기 100
7.4. iris 데이터 100
7.4. mtcars 101

8. apply 함수들 103
8.1. apply() 104
8.2. lapply() 107
8.3. sapply() 109
8.4. tapply 110
8.5. mapply() 113

9. doBy 패키지 115
9.1. summary() 115
9.2. quantile() 116
9.3. summaryBy() 119
9.4. orderBy() order() 120
9.5. splitBy() split() 122
9.6. sampleBy() sample() 125

10. 기타 함수들 129
10.1. subset() 129
10.2. merge() 131
10.3. sort(), order() 135
10.4. with(), within() 136
10.5. attach(), detach() 138
10.6. which(), which.max(), which.min() 139
10.7. aggregate() 140
10.8. stack(), unstack() 141


제4부. 데이터 조작 II 144
11. sqldf, plyr, reshape2, data.table 144
11.1. sqldf 패키지 144
11.2. plyr 패키지 145
11.2.1. adply() 145
11.2.2. ddply() 146
11.3. transform(), summarise(), subset() 148
11.3.1. transform() 148
11.3.2. summarise() 149
11.3.3. subset() 149
11.4. m*ply() 150
11.5. reshape2 패키지 151
11.5.1. melt() 151
11.5.2. complete.cases()함수를 사용하여 결측치를 처리할 수 있다. 152
11.6. data.table 패키지 153
11.6.1. 데이터 접근 153
11.6.2. system.time() 155
11.6.3. 데이터 테이블 병합 155

12. 기타 함수 157
12.1. foreach() 157
12.2. doParallel(), doMC() 158
12.3 print() 158
12.4. sprintf() 159
12.5. cat() 159
12.6. system.time() 160
12.7. Rprof() 161


제 5부 시각화 163
13. ggplot 163
13.1. 산점도 164
13.2. 그래픽 옵션 165
13.2.1. 축 이름(xlab, ylab) 165
13.2.2. 그래프 제목(main) 165
13.2.3. 점의 종류(pch) 165
13.2.4. 점의 크기(cex) 166
13.2.5. 색상(col) 166
13.2.6. 좌표축 값의 범위(xlim, ylim) 167
13.2.7. multi plot 168
13.2.8. type 169
13.2.9. 그래프 배열 170
13.3. 지터(jitter) 171
13.4. 점(points) 172
13.5. 선(lines) 174
13.6. 직선(abline) 176
13.7. 곡선(curve) 177
13.8. 다각형(polygon) 178
13.9. 데이터의 식별 180
13.9.1. 문자열(text) 180
13.9.2. 데이터의 표시 181
13.10. 범례(legend) 182
13.11. matplot () 183
13.11. 상자 그림(boxplot) 183
13.12 히스토그램(hist) 187
13.13. 밀도 그림(density) 189
13.14. 막대 그림(barplot) 190
13.15. 파이 그래프(pie) 191
13.16 모자이크 플롯(mosaicplot) 192
13.17. 산점도 행렬(pairs) 194
13.18. 투시도(persp), 등고선 그래프(contour) 195
13.18.1. persp() 195
13.18.2. contour() 198

저자소개

진하수 (지은이)    정보 더보기
부산대학교 경제학박사. 블록체인 알고리즘, 신경망 전문가 지원 시스템, 빅데이타와 코딩언어(R, Python) 등의 융합학문 연구와 강의를 하고 있다. 교육경제 컨설턴트, 영어전문가, 음악 치유사. AI 교육 전문가로 교육과 경제와 미래학 관련 학술지에 논문 게재하고 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책