logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

R로 하는 빅데이터 분석 : 데이터 전처리와 시각화

R로 하는 빅데이터 분석 : 데이터 전처리와 시각화

(개념적 기초에서 심층 활용까지)

김권현 (지은이)
숨은원리
25,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

R로 하는 빅데이터 분석 : 데이터 전처리와 시각화
eBook 미리보기

책 정보

· 제목 : R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 (개념적 기초에서 심층 활용까지)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791196014476
· 쪽수 : 328쪽
· 출판일 : 2019-03-01

책 소개

프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다.

목차

1 들어가기
1.1 R … … … … … … … … … … … … 8

2 R의 패키지(Packages)
2.1 패키지 설치 … … … … … … … … … … . 9
2.2 패키지 관련 정보 … … … … … … … … … . 10
2.3 패키지 불러오기/확인하기/제거하기 … … … … … … 11
2.4 패키지 관리하기 … … … … … … … … … . 12
2.5 중복되는 함수와 변수 … … … … … … … … . . 12

3 R의 변수, 자료형, 연산/함수
3.1 R의 변수 … … … … … … … … … … . . 13
3.2 R의 데이터 타입(자료형) … … … … … … … … 17
3.3 연산(Operations)과 함수(Functions) … … … … … . . 20
3.4 특별한 값 … … … … … … … … … … . . 26

4 데이터 구조
4.1 벡터(Vector) … … … … … … … … … … 31
4.2 데이터 구조에 따른 생성, 참조, 수정, 추가, 삭제 함수 … … … . 43
4.3 CRUD(Create, Read, Update, Delete) … … … … … 51
4.4 3+차원의 배열 … … … … … … … … … . . 53

5 dplyr 패키지를 활용한 데이터 가공
5.1 magrittr의 파이프 연산자 … … … … … … … . . 59
5.2 dplyr의 방식: 부분 선택(Subsetting) … … … … … . . 62
5.3 dplyr의 방식 : 수정 … … … … … … … … . . 68
5.4 dplyr의 기타 편의 기능 … … … … … … … … . 74

6 날짜와 시간(Date and Time)
6.1 날짜의 표기 … … … … … … … … … … . 80
6.2 날짜 표기 변환 … … … … … … … … … . . 81
6.3 날짜시간 표기 인식 … … … … … … … … … 82
6.4 날짜, 시간 연산 … … … … … … … … … . . 89
6.5 날짜(시간)의 특정한 정보 참조 … … … … … … … 90
6.6 날짜(시간) 갱신 … … … … … … … … … . 90
6.7 활용예 … … … … … … … … … … … 93

7 팩터형 데이터타입
7.1 팩터형의 중요성 … … … … … … … … … . 96
7.2 데이터 전처리에 있어서 팩터형 … … … … … … … 96
7.3 forcats 패키지 … … … … … … … … … . . 98

8 R로 데이터 읽어오기
8.1 R 내장 데이터 … … … … … … … … … . . 101
8.2 들어가기 : write.table/read.table, save/load … … … . . 102
8.3 텍스트로 저장된 데이터 화일 읽기 … … … … … … . 103
8.4 EXCEL 화일 읽기 … … … … … … … … … 110
8.5 그 밖의 통계 프로그램 데이터 화일 … … … … … … . 111

9 데이터 가공
9.1 집단별로 함수 적용하기 … … … … … … … … . 114
9.2 여러 데이터 프레임 합치기 … … … … … … … . . 119
9.3 세로형/가로형 변환 … … … … … … … … … 125

10 패키지 데이터테이블(data.table)
10.1 package:dplyr과 package:data.table의 비교 … … … … . 127
10.2 data.table의 키(key) 활용하기 … … … … … … . . 143
10.3 data.table을 활용한 병합 … … … … … … … . . 148
10.4 그 밖의 특수한 기호 : .SD, .GRP, .N, .I, .BY, .EACHI … … … . 157
10.5 데이터테이블 종합 … … … … … … … … … 165

11 문자열(character)
11.1 인코딩 … … … … … … … … … … … 167
11.2 대표적인 인코딩 방법 … … … … … … … … . . 168
11.3 그 밖의 인코딩 방법 … … … … … … … … … 168
11.4 R에서 인코딩 다루기 … … … … … … … … . . 169
11.5 R에서 문자열 입력 … … … … … … … … … 171
11.6 유니코드 정규화(Normalization) … … … … … … . 173
11.7 문자열의 정렬 … … … … … … … … … … 174
11.8 문자열을 다루는 함수들 … … … … … … … … . 176
11.9 패키지 stringr을 활용한 문자열 관리 … … … … … . . 182

12 정규표현식
12.1 R과 정규표현식 … … … … … … … … … . . 185
12.2 확장정규표현식(ERE; Extended Regular Expressions) … … . 186

13 정규표현식을 활용한 문자열 데이터 가공: 개념적 접근
13.1 패턴과 일치하는 부분과 관련된 정보 … … … … … … 200
13.2 패턴과 일치하는 부분을 활용하여 가공하기 … … … … … 200

14 흐름 제어와 함수
14.1 제어문: 조건과 반복 … … … … … … … … . . 201
14.2 함수 … … … … … … … … … … … . 209

15 1변수 기술 통계량
15.1 집중경향치 … … … … … … … … … … . 215
15.2 변산성 측정치 … … … … … … … … … … 216
15.3 범주형, 순위형 변수 … … … … … … … … … 217

16 데이터 프레임의 모든 변수(컬럼)에 대해 요약통계치 구하기
16.1 함수 목록은 다음과 같다… … … … … … … … . 219

17 간편 시각화
17.1 간편 시각화의 예 … … … … … … … … … . 222

18 ggplot2
18.1 들어가기 … … … … … … … … … … . . 227
18.2 시각적 맵핑(Aesthetic mapping) … … … … … … . 229
18.3 기하학적 대상(geom) … … … … … … … … . . 248
18.4 보조선(Auxillary lines) … … … … … … … … 257
18.5 좌표계(Coordinate system) … … … … … … … . 259
18.6 범례(Legends) … … … … … … … … … . . 265
18.7 제목과 테마(Title and Theme) … … … … … … . . 267
18.8 결과 정리 및 저장 … … … … … … … … … . 273
18.9 ggplot2(gg = Grammar of Graphics) 총정리 … … … … 275
19 연습문제 해답
데이터 불러들이기 … … … … … … … … … … 279
제어와 함수 I… … … … … … … … … … … 282

부록 1. R에서 하는 벡터/행렬 연산
벡터연산 … … … … … … … … … … … . . 283
한 행렬 연산 … … … … … … … … … … … 283
두 행렬의 연산 … … … … … … … … … … . . 284
선형(행렬) 대수 … … … … … … … … … … . 285
부록 2. R의 색
부록 3. RStudio 치트시트

저자소개

김권현 (지은이)    정보 더보기
서울대학교 인지과학 박사, 서울대학교 물리학 학사 출신으로 서울대학교 사회과학원 방법론 컨설턴트, 서울대학교 사회과학원 R 강의, 서강대학교, 국민대학교 등에서의 강의경험과 회사 경험을 토대로 책을 썼다. R 패키지 mirt의 공헌자이며 ‘기초 통계학의 숨은 원리’, ‘수학의 숨은 원리’ 등의 저자이기도 하다. ● 서울대학교 인지과학 박사 ● 서울대학교 물리학 학사 ● 서울대학교 사회과학원 방법론 컨설턴트 ● 서울대학교 사회과학원 R 강의 ● 서강대학교, 국민대학교 등 강의(심리통계, 분석프로그래밍) ● R 패키지 mirt의 공헌자 ● ‘기초 통계학의 숨은 원리’, ‘수학의 숨은 원리’ 등의 저자 ● 2019년 법학적성시험 분석(법학전문대학원협의회 의뢰)
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책