책 이미지
책 정보
· 분류 : 국내도서 > 대학교재/전문서적 > 공학계열 > 컴퓨터공학 > 데이터베이스 개론
· ISBN : 9791192187693
· 쪽수 : 333쪽
책 소개
목차
CHAPTER 1 R의 소개와 설치 001
1.1 R이란 무엇인가? 003
1.2 R과 RStudio 설치 003
1.2.1 R 설치하기 003
1.2.2 RStudio 설치하기 010
1.3 RStudio 실행하기 015
1.4 기본 프로젝트 만들기 016
1.5 RStudio 환경설정하기 023
CHAPTER 2 데이터 027
2.1 데이터 종류 029
2.2 변수와 자료형 029
2.2.1 변수 029
2.2.2 자료형 030
2.2.3 자료형 확인하기 031
2.3 입출력 032
2.3.1 입력 032
2.3.2 출력 034
2.4 데이터프레임 035
■ EXERCISE 037
CHAPTER 3 함수와 패키지 039
3.1 함수란 무엇인가? 041
3.2 기본함수 041
3.2.1 c() 함수 041
3.2.2 seq() 함수 042
3.3 수학 함수 046
3.4 문자 함수 050
3.5 비교 연산자 053
3.6 논리 연산자 054
3.7 조건문 055
3.7.1 if ~ else 함수 055
3.7.2 if ~ else if 함수 058
3.7.3 ifelse() 함수 059
3.7.4 switch() 함수 062
3.8 반복문 063
3.8.1 for() 함수 063
3.8.2 while() 함수 068
3.9 패키지 075
■ EXERCISE 077
CHAPTER 4 데이터 분석 081
4.1 데이터 파악하기 083
4.2 변수명 변경하기 092
4.3 파생변수 생성하기 094
■ EXERCISE 096
CHAPTER 5 데이터 가공 및 분석 099
5.1 데이터 추출하기 101
5.2 데이터 정렬하기 113
5.3 데이터 변형하기 118
5.4 데이터 요약하기 126
5.5 데이터 그룹화 하기 136
5.6 데이터 결합하기 141
■ EXERCISE 145
CHAPTER 6 데이터 정제 147
6.1 결측치 확인 149
6.1.1 is.na() 함수 150
6.1.2 table() 함수 151
6.1.3 summary() 함수 153
6.1.4 !is.na() 함수 155
6.1.5 complete.cases() 함수 156
6.1.6 na.omit() 함수 158
6.1.7 filter() 함수 159
6.2 결측치 처리 163
6.2.1 na.rm = T 함수 163
6.2.2 결측치를 평균값으로 변경 167
6.3 이상치 확인 및 처리 171
■ EXERCISE 177
CHAPTER 7 그래프 179
7.1 qplot() 함수 181
7.2 hist() 함수 183
7.3 plot() 함수 184
7.4 pie() 함수 186
7.5 boxplot() 함수 187
7.6 ggplot2() 패키지 193
7.6.1 geom_bar() 함수 193
7.6.2 geom_point() 함수 197
7.6.3 geom_line() 함수 202
7.6.4 geom_boxplot() 함수 207
■ EXERCISE 210
CHAPTER 8 텍스트 마이닝 213
8.1 단어의 빈도 분석하기 215
8.1.1 텍스트 전처리 215
8.1.2 토큰화하기 221
8.1.3 단어 빈도 분석하기 224
8.2 형태소 분석기를 이용한 단어 빈도 분석 233
8.2.1 형태소 분석 233
8.2.2 명사 빈도 분석하기 237
CHAPTER 9 Shapefile을 활용한 대한민국 지도 시각화 241
9.1 Shapefile을 활용한 대한민국 지도 시각화 243
9.1.1 shapefile 불러오기 246
9.1.2 shapefile을 데이터프레임으로 변환 252
9.1.3 ggplot2 패키지로 지도 시각화 257
9.1.4 행정구역의 위치정보와 메타데이터 속성의 결합 258
9.2 서울시 지도 시각화 263
9.3 서울시 초미세먼지 단계구분도 267
9.3.1 서울시 초미세먼지 데이터 수집 268
9.3.2 초미세먼지 데이터와 시군구 데이터를 병합한 통합 데이터 생성 272
9.3.3 서울시 초미세먼지 단계구분도 276
9.3.4 서울시 초미세먼지 인터렉티브 단계구분도 279
CHAPTER 10 대기오염 측정데이터 분석 283
CHAPTER 11 전국 일반음식점 표준데이터를 활용한 실전 분석 295
11.1 전국일반음식점표준데이터 준비 297
11.2 전국일반음식점표준데이터 파악 299
11.3 전국일반음식점표준데이터 전처리 302
11.4 전국일반음식점표준데이터 분석 310
11.4.1 전국일반음식점표준데이터 전국 통계 310
11.4.2 전국일반음식점표준데이터 서울특별시 통계 317
INDEX 327
책속에서
R프로그램은 데이터프레임을 직접 작성하거나 패키지를 설치하면 기본적으로 제공해주는 데이터나 공공 데이터를 이용해 함수를 사용한 분석, 데이터 분석, 데이터 가공 및 분석, 데이터 정제, 시각화 작업 등을 할 수 있다. R프로그램은 1993년 오클랜드 대학교에서 개발된 통계 및 그래프 작업을 위한 줄 단
위 번역 방식인 인터프리터 프로그래밍 언어이며, 초보자가 사용하기에 편리하고, 오픈소스를 제공해주기 때문에 무료로 사용할 수 있으며, 수많은 패키지를 통해 기능을 추가해서 분석을 가능하게 해주며 시각화 등의 작업을 할 수 있다.
(...중략)
RStudio는 R프로그래밍을 편리하게 사용하기 위해 제공된 오픈 소스 통합 개발환경 (IDE) 프로그램이며 편리한 사용 환경으로 제공되는 패키지 설치와 빠르고 효율적인 분석을 할 수 있다.