책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9791188831340
· 쪽수 : 276쪽
· 출판일 : 2019-12-19
책 소개
목차
CHAPTER 01 R이란 무엇인가
■1.1 R 소개 4
■1.2 R 특징 6
CHAPTER 02 R프로그래밍 준비하기
■2.1 R 프로그램 설치 10
2.1.1 R 설치 파일 다운로드 10
2.1.2 R 설치 12
2.1.3 RStudio 설치 파일 다운로드 16
2.1.4 RStudio 설치 18
2.1.5 Java 설치 21
2.1.6 Java 환경변수 설정 24
■2.2 RStudio 실행 및 구성 29
2.2.1 스크립트(Script) 30
2.2.2 콘솔(Console) 30
2.2.3 환경창(Environment) 31
2.2.4 Plots 31
■2.3 R 패키지 설치 및 라이브러리 실행 32
2.3.1 패키지(Package) 설치 32
2.3.2 라이브러리(library) 불러오기 33
■2.4 데이터 불러오기(csv, excel, Rda) 34
2.4.1 CSV 파일 불러오기 34
2.4.2 excel 파일 불러오기 35
2.4.3 Rda 파일 불러오기 36
■2.5 기본프로젝트 만들기 37
CHAPTER 03 변수
■3.1 변수란? 44
3.1.1 변수명 작성 규칙 44
■3.2 변수 할당 및 제거 45
■3.3 숫자데이터(c, seq, ...) - round 48
■3.4 문자데이터 51
CHAPTER 04 함수
■4.1 함수란? 60
■4.2 기본함수 60
■4.3 문자함수 65
CHAPTER 05 데이터 프레임
■5.1 데이터 프레임이란 74
5.1.1 데이터 프레임 생성 74
■5.2 엑셀파일을 불러와 데이터 프레임 만들기 76
5.1.1 프로젝트 폴더에 엑셀 파일 삽입하기 76
5.1.2 readxl 패키지 설치하고 로드하기 76
5.1.3 엑셀파일 불러오기 76
■5.3 CSV파일 불러와 데이터 프레임 만들기 77
5.3.1 프로젝트 폴더에 CSV파일 삽입하기 78
5.3.2 CSV파일 불러오기 78
■5.4 데이터 프레임 요소에 접근 78
■5.5 데이터 프레임에 유용한 함수 80
5.5.1 attach·detach 함수경 80
5.5.2 with 함수:데이터 프레임에 다양한 함수 적용 81
5.5.3 subset함수:데이터 프레임에서 일부 데이터만 추출 81
■5.6 데이터 프레임 합치기–rbind(), cbind(), merge()사용하기 82
■5.7 데이터 프레임에서 특정 컬럼들만 골라내서
새로운 형태 만들기 84
■5.8 데이터 프레임의 내용 확인 및 출력순서 지정하기 85
CHAPTER 06 패키지
■6.1 패키지 설치 및 사용 95
■6.2 dplyr 패키지 95
■6.3 ggplot2 패키지 98
■6.4 KoNLP 패키지 102
■6.5 wordcloud/ wordcloud2 패키지 103
■6.6 reshape2 패키지 103
6.6.1 melt()함수 103
6.6.2 cast() 함수 104
CHAPTER 07 데이터 파악
■7.1 데이터를 파악할 때 사용하는 함수 112
7.1.1 head() - 데이터 앞부분 확인하기 112
7.1.2 tail() - 데이터 뒷부분 확인하기 112
7.1.3 View() - 뷰터창에서 데이터 확인하기 113
7.1.4 dim() - 데이터가 몇 행, 몇 열로
구성되어 있는지 알아보기 115
7.1.5 str() - 속성 파악하기 115
7.1.6 summary() -요약 통계량 산출 116
■7.2 변수명 바꾸기 117
7.2.1 rename()를 이용한 변수명 바꾸기 117
■7.3 파생변수 만들기 119
7.3.1 변수를 조합해 파생변수 만들기 119
CHAPTER 08 데이터 변형
■8.1 파생변수(Derived Variable) 126
■8.2 연산자(산술, 관계, 논리) 129
8.2.1 산술연산자 129
8.2.2 관계연산자 132
8.2.3 논리연산자 134
■8.3 조건문(Conditional Statements) - ifelse 136
8.3.1 if~else~ 137
8.3.2 ifelse 140
8.3.3 중첩조건문 143
■8.4 반복문(Repetitive Statement) - for 146
■8.5 데이터 재구조 151
8.5.1 rbind(행 추가) 152
8.5.2 cbind(열 추가) 153
CHAPTER 09 데이터 가공 및 분석
■9.1 데이터 전처리 162
9.1.1 dplyr 패키지 162
9.1.2 파이프연산자(Pipe Operator) %>% 164
■9.2 케이스 조작(Manipulate Cases) 166
9.2.1 filter(조건에 맞는 행 추출) 166
9.2.2 slice(선택한 위치의 행 추출) 171
9.2.3 distinct(중복 제거한 행 추출) 172
9.2.4 sample_n / sample_frac (개수 / 비율 표본추출) 174
9.2.5 arrange(정렬) 176
■9.3 변수 조작(Manipulate Variables) 179
9.3.1 select(열 추출) 180
9.3.2 mutate(파생변수 열 추가) 184
9.3.3 transmute(파생변수 열만 생성) 186
9.3.4 rename(변수이름 변경) 189
■9.4 요약(Summarise Cases) 및 그룹화(Group Cases) 190
9.4.1 summarise() 191
9.4.2 group_by() 193
■9.5 데이터프레임 결합(Combine Tables) 195
9.5.1 left_join() 195
9.5.2 bind_rows() 197
CHAPTER 10 결측치(Missing Value) 확인 및 처리
■10.1 결측치(Missing Value) 확인 208
10.1.1 is.na() 208
10.1.2 table(is.na()) 209
10.1.3 complete.cases() 210
■10.2 결측치 처리 211
10.2.1 na.rm = T 211
10.2.2 na.omit() 212
10.2.3 filter를 이용한 결측치 제거 213
10.2.4 결측치를 다른 값으로 변경하기 216
10.2.5 이상치(outlier) 제거하기 217
CHAPTER 11 그래프
■11.1 기본 그래프 226
11.1.1 기본 막대그래프 226
11.1.2 기본 산점도 227
11.1.3 기본 상자그림 228
■11.2 ggplot2 229
11.2.1 ggplot2를 이용한 막대그래프 229
11.2.2 ggplot2 산점도 230
11.2.3 ggplot2 상자그림 232
11.2.4 ggplot2 꺽은선 그래프 233
CHAPTER 12 KoNLP패키지를 이용한 한글 분석
■12.1 형태소 분석하기 242
12.1.1 KoNLP패키지와 wordcloude 설치 242
12.1.2 사전 설정 및 한글 처리 과정 알아보기 242
12.1.3 형태소 분석실습 243
■12.2 애국가 단어로 워드 클라우드 만들기 250
12.2.1 wordcloude2() 함수의 사용 및 옵션 251
CHAPTER 13 지도시각화
■13.1 범죄 발생율 구분도 만들기 256
■13.2 대한민국 시도별 데이터 준비하기 259
■13.3 패키지 준비하기 259
■13.4 대한민국 시도별 데이터 분석하기 261
CHAPTER 14 인터랙티브 그래프
■14.1 인터랙티브 그래프(Interactive Graph) 268
14.1.1 plotly 패키지 268
■14.2 인터랙티브 그래프 그리기 268
14.2.1 plot_ly() 268
14.2.2 ggplot2() 273
책속에서
1.2 R 특징
R언어는 문법이 단순하여 초보자도 쉽게 접근 가능하고 다양한 분야에서 활용이 가능하며, 다음과 같은 특징들을 가지고 있다.
■첫째, 오픈소스 프로그램으로 다양한 패키지를 무료로 제공받는다. 개인, 기관, 기업에서 무료로 사용이 가능하지만 R프로그램을 이용하여 상용 제품을 만들어 낼 때는 라이센스 비용을 지불해야한다.
■둘째, 다양한 통계 기법과 수치 해석 기법을 지원한다. 기본적으로 R에 있는 패키지도 있지만 사용자가 제작한 외부 패키지 라이브러리를 추가하여 기능을 확장할 수도 있고, 오픈소스의 장점으로 국/내외 R관련 사이트에서 다른 사용자들에 의해 만들어진 사용자 정의 함수를 다운받아 사용 할 수도 있다. 함수를 만들어 배포, 공유하는 것이 다른 프로그램보다 빠르고 광범위하게 확장되어 있다.
■셋째, 그래픽 기능으로 수학 기호를 포함할 수 있는 출판물 수준의 그래픽 제공이 가능하다. 광범위한 통계(선형 및 비선형 모델링, 고전 통계 시험, 시계열 분석, 분류, 클러스터링 등) 및 그래픽 기법을 제공하며, 확장성이 높다. 단순한 코딩만으로 표, 차트, 지도 등 다양한 시각화 자료를 만들 수 있다. R로 만들어진 그래프는 완성도가 높아 바로 신문, 책, 인터넷 포스팅에 사용해도 손색이 없을 수준이다.
■넷째, R프로그램의 주요 기능으로 통계분석, 데이터 마이닝, 빅데이터 분석, 기계학습, 텍스트마이닝, GIS등 다양한 기능이 있다.
■다섯째, 설치가 쉽고 빠르다. 다른 프로그램에 비해 통계분석을 처음 시작하였을 때 클릭 몇 번으로 다운로드/설치하기까지 따로 설정할 부분이 거의 없고 설치시간 또한 매우 짧다.