logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

빅데이터 R로 보기

빅데이터 R로 보기

이광옥, 조영주, 임희경, 유소월 (지은이)
연두에디션
18,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

빅데이터 R로 보기
eBook 미리보기

책 정보

· 제목 : 빅데이터 R로 보기 
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9791188831340
· 쪽수 : 276쪽
· 출판일 : 2019-12-19

책 소개

빅데이터를 처음 접하거나 초보자들을 위해 본문에서는 기본적인 내용들을 다루고 실습과정과 연습문제를 통해 분석 능력을 갖출 수 있도록 하였다. R이란 무엇인가, R프로그래밍 준비하기, 변수, 함수, 데이터 프레임, 패키지, 데이터 파악 등으로 구성되었다.

목차

CHAPTER 01 R이란 무엇인가
■1.1 R 소개 4
■1.2 R 특징 6

CHAPTER 02 R프로그래밍 준비하기
■2.1 R 프로그램 설치 10
2.1.1 R 설치 파일 다운로드 10
2.1.2 R 설치 12
2.1.3 RStudio 설치 파일 다운로드 16
2.1.4 RStudio 설치 18
2.1.5 Java 설치 21
2.1.6 Java 환경변수 설정 24
■2.2 RStudio 실행 및 구성 29
2.2.1 스크립트(Script) 30
2.2.2 콘솔(Console) 30
2.2.3 환경창(Environment) 31
2.2.4 Plots 31
■2.3 R 패키지 설치 및 라이브러리 실행 32
2.3.1 패키지(Package) 설치 32
2.3.2 라이브러리(library) 불러오기 33
■2.4 데이터 불러오기(csv, excel, Rda) 34
2.4.1 CSV 파일 불러오기 34
2.4.2 excel 파일 불러오기 35
2.4.3 Rda 파일 불러오기 36
■2.5 기본프로젝트 만들기 37

CHAPTER 03 변수
■3.1 변수란? 44
3.1.1 변수명 작성 규칙 44
■3.2 변수 할당 및 제거 45
■3.3 숫자데이터(c, seq, ...) - round 48
■3.4 문자데이터 51

CHAPTER 04 함수
■4.1 함수란? 60
■4.2 기본함수 60
■4.3 문자함수 65

CHAPTER 05 데이터 프레임
■5.1 데이터 프레임이란 74
5.1.1 데이터 프레임 생성 74
■5.2 엑셀파일을 불러와 데이터 프레임 만들기 76
5.1.1 프로젝트 폴더에 엑셀 파일 삽입하기 76
5.1.2 readxl 패키지 설치하고 로드하기 76
5.1.3 엑셀파일 불러오기 76
■5.3 CSV파일 불러와 데이터 프레임 만들기 77
5.3.1 프로젝트 폴더에 CSV파일 삽입하기 78
5.3.2 CSV파일 불러오기 78
■5.4 데이터 프레임 요소에 접근 78
■5.5 데이터 프레임에 유용한 함수 80
5.5.1 attach·detach 함수경 80
5.5.2 with 함수:데이터 프레임에 다양한 함수 적용 81
5.5.3 subset함수:데이터 프레임에서 일부 데이터만 추출 81
■5.6 데이터 프레임 합치기–rbind(), cbind(), merge()사용하기 82
■5.7 데이터 프레임에서 특정 컬럼들만 골라내서
새로운 형태 만들기 84
■5.8 데이터 프레임의 내용 확인 및 출력순서 지정하기 85

CHAPTER 06 패키지
■6.1 패키지 설치 및 사용 95
■6.2 dplyr 패키지 95
■6.3 ggplot2 패키지 98
■6.4 KoNLP 패키지 102
■6.5 wordcloud/ wordcloud2 패키지 103
■6.6 reshape2 패키지 103
6.6.1 melt()함수 103
6.6.2 cast() 함수 104

CHAPTER 07 데이터 파악
■7.1 데이터를 파악할 때 사용하는 함수 112
7.1.1 head() - 데이터 앞부분 확인하기 112
7.1.2 tail() - 데이터 뒷부분 확인하기 112
7.1.3 View() - 뷰터창에서 데이터 확인하기 113
7.1.4 dim() - 데이터가 몇 행, 몇 열로
구성되어 있는지 알아보기 115
7.1.5 str() - 속성 파악하기 115
7.1.6 summary() -요약 통계량 산출 116
■7.2 변수명 바꾸기 117
7.2.1 rename()를 이용한 변수명 바꾸기 117
■7.3 파생변수 만들기 119
7.3.1 변수를 조합해 파생변수 만들기 119

CHAPTER 08 데이터 변형
■8.1 파생변수(Derived Variable) 126
■8.2 연산자(산술, 관계, 논리) 129
8.2.1 산술연산자 129
8.2.2 관계연산자 132
8.2.3 논리연산자 134
■8.3 조건문(Conditional Statements) - ifelse 136
8.3.1 if~else~ 137
8.3.2 ifelse 140
8.3.3 중첩조건문 143
■8.4 반복문(Repetitive Statement) - for 146
■8.5 데이터 재구조 151
8.5.1 rbind(행 추가) 152
8.5.2 cbind(열 추가) 153

CHAPTER 09 데이터 가공 및 분석
■9.1 데이터 전처리 162
9.1.1 dplyr 패키지 162
9.1.2 파이프연산자(Pipe Operator) %>% 164
■9.2 케이스 조작(Manipulate Cases) 166
9.2.1 filter(조건에 맞는 행 추출) 166
9.2.2 slice(선택한 위치의 행 추출) 171
9.2.3 distinct(중복 제거한 행 추출) 172
9.2.4 sample_n / sample_frac (개수 / 비율 표본추출) 174
9.2.5 arrange(정렬) 176
■9.3 변수 조작(Manipulate Variables) 179
9.3.1 select(열 추출) 180
9.3.2 mutate(파생변수 열 추가) 184
9.3.3 transmute(파생변수 열만 생성) 186
9.3.4 rename(변수이름 변경) 189
■9.4 요약(Summarise Cases) 및 그룹화(Group Cases) 190
9.4.1 summarise() 191
9.4.2 group_by() 193
■9.5 데이터프레임 결합(Combine Tables) 195
9.5.1 left_join() 195
9.5.2 bind_rows() 197

CHAPTER 10 결측치(Missing Value) 확인 및 처리
■10.1 결측치(Missing Value) 확인 208
10.1.1 is.na() 208
10.1.2 table(is.na()) 209
10.1.3 complete.cases() 210
■10.2 결측치 처리 211
10.2.1 na.rm = T 211
10.2.2 na.omit() 212
10.2.3 filter를 이용한 결측치 제거 213
10.2.4 결측치를 다른 값으로 변경하기 216
10.2.5 이상치(outlier) 제거하기 217

CHAPTER 11 그래프
■11.1 기본 그래프 226
11.1.1 기본 막대그래프 226
11.1.2 기본 산점도 227
11.1.3 기본 상자그림 228
■11.2 ggplot2 229
11.2.1 ggplot2를 이용한 막대그래프 229
11.2.2 ggplot2 산점도 230
11.2.3 ggplot2 상자그림 232
11.2.4 ggplot2 꺽은선 그래프 233

CHAPTER 12 KoNLP패키지를 이용한 한글 분석
■12.1 형태소 분석하기 242
12.1.1 KoNLP패키지와 wordcloude 설치 242
12.1.2 사전 설정 및 한글 처리 과정 알아보기 242
12.1.3 형태소 분석실습 243
■12.2 애국가 단어로 워드 클라우드 만들기 250
12.2.1 wordcloude2() 함수의 사용 및 옵션 251

CHAPTER 13 지도시각화
■13.1 범죄 발생율 구분도 만들기 256
■13.2 대한민국 시도별 데이터 준비하기 259
■13.3 패키지 준비하기 259
■13.4 대한민국 시도별 데이터 분석하기 261

CHAPTER 14 인터랙티브 그래프
■14.1 인터랙티브 그래프(Interactive Graph) 268
14.1.1 plotly 패키지 268
■14.2 인터랙티브 그래프 그리기 268
14.2.1 plot_ly() 268
14.2.2 ggplot2() 273

저자소개

이광옥 (지은이)    정보 더보기
조선대학교 전산통계학과 학사, 석사, 박사 조선대학교 일반대학원 교육학박사 수료 전: 조선간호대학교 겸임교수 현: 조선대학교 SW융합교육원 초빙교수
펼치기
유소월 (지은이)    정보 더보기
현 조선대학교 SW중심대학사업단 연구교수 조선대학교 전산통계학과 이학박사 '달콤한 C언어', '빅데이터 분석 R 유 레디' 등 저자 한국연구재단 등 데이터 추출과 활용 연구 다수 수행
펼치기
조영주 (지은이)    정보 더보기
2006년 조선대학교 컴퓨터공학과 이학박사 現) 조선대학교 SW융합교육원 SW교육 연구교수
펼치기
임희경 (지은이)    정보 더보기
조선대학교 전산통계학과 박사 前) 조선대학교 SW중심대학사업단 학술연구교수 現) 조선대학교 SW중심대학사업단 초빙교수
펼치기

책속에서

1.2 R 특징
R언어는 문법이 단순하여 초보자도 쉽게 접근 가능하고 다양한 분야에서 활용이 가능하며, 다음과 같은 특징들을 가지고 있다.
■첫째, 오픈소스 프로그램으로 다양한 패키지를 무료로 제공받는다. 개인, 기관, 기업에서 무료로 사용이 가능하지만 R프로그램을 이용하여 상용 제품을 만들어 낼 때는 라이센스 비용을 지불해야한다.
■둘째, 다양한 통계 기법과 수치 해석 기법을 지원한다. 기본적으로 R에 있는 패키지도 있지만 사용자가 제작한 외부 패키지 라이브러리를 추가하여 기능을 확장할 수도 있고, 오픈소스의 장점으로 국/내외 R관련 사이트에서 다른 사용자들에 의해 만들어진 사용자 정의 함수를 다운받아 사용 할 수도 있다. 함수를 만들어 배포, 공유하는 것이 다른 프로그램보다 빠르고 광범위하게 확장되어 있다.
■셋째, 그래픽 기능으로 수학 기호를 포함할 수 있는 출판물 수준의 그래픽 제공이 가능하다. 광범위한 통계(선형 및 비선형 모델링, 고전 통계 시험, 시계열 분석, 분류, 클러스터링 등) 및 그래픽 기법을 제공하며, 확장성이 높다. 단순한 코딩만으로 표, 차트, 지도 등 다양한 시각화 자료를 만들 수 있다. R로 만들어진 그래프는 완성도가 높아 바로 신문, 책, 인터넷 포스팅에 사용해도 손색이 없을 수준이다.
■넷째, R프로그램의 주요 기능으로 통계분석, 데이터 마이닝, 빅데이터 분석, 기계학습, 텍스트마이닝, GIS등 다양한 기능이 있다.
■다섯째, 설치가 쉽고 빠르다. 다른 프로그램에 비해 통계분석을 처음 시작하였을 때 클릭 몇 번으로 다운로드/설치하기까지 따로 설정할 부분이 거의 없고 설치시간 또한 매우 짧다.


추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책