logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

R을 활용한 데이터 과학

R을 활용한 데이터 과학

(데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기)

해들리 위컴, 개럿 그롤문드 (지은이), 김설기, 최혜민 (옮긴이)
인사이트
34,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
30,600원 -10% 0원
1,700원
28,900원 >
30,600원 -10% 0원
카드할인 10%
3,060원
27,540원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
알라딘 판매자 배송 26개 14,000원 >
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 27,200원 -10% 1360원 23,120원 >

책 이미지

R을 활용한 데이터 과학
eBook 미리보기

책 정보

· 제목 : R을 활용한 데이터 과학 (데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788966262359
· 쪽수 : 495쪽
· 출판일 : 2019-01-10

책 소개

R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 책이다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로, 데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명한다.

목차

1부 탐색하기
1장 데이터 시각화
1.1 들어가기
1.2 첫 단계
1.3 심미성 매핑
1.4 자주 일어나는 문제들
1.5 facet
1.6 기하 객체
1.7 통계적 변환
1.8 위치 조정
1.9 좌표계
1.10 그래프 레이어 문법

2장 워크플로: 기초
2.1 코딩 기초
2.2 이름에 들어갈 것
2.3 함수 호출하기

3장 데이터 변형
3.1 들어가기
3.2 filter()로 행 필터링하기
3.3 arrange()로 행 정렬하기
3.4 select()로 열 선택하기
3.5 mutate()로 새로운 변수 추가하기
3.6 summarize()로 그룹화 요약하기
3.7 그룹화 뮤테이트(와 필터링)

4장 워크플로: 스크립트
4.1 코드 실행하기
4.2 RStudio 진단

5장 탐색적 데이터 분석
5.1 들어가기
5.2 질문하기
5.3 변동
5.4 결측값
5.5 공변동
5.6 패턴과 모델
5.7 ggplot2 표현
5.8 더 배우기

6장 워크플로: 프로젝트
6.1 무엇이 진짜인가?
6.2 분석 작업이 어디에 남아있는가?
6.3 경로와 디렉터리
6.4 RStudio 프로젝트
6.5 요약

2부 데이터 길들이기
7장 tibble로 하는 티블
7.1 들어가기
7.2 티블 생성하기
7.3 티블 vs 데이터프레임
7.4 이전 코드와 상호작용

8장 readr로 하는 데이터 불러오기
8.1 들어가기
8.2 시작하기
8.3 벡터 파싱하기
8.4 파일 파싱하기
8.5 파일에 쓰기
8.6 기타 데이터 유형

9장 tidyr로 하는 타이디 데이터
9.1 들어가기
9.2 타이디 데이터
9.3 Gather와 Spread
9.4 Separate와 Unite
9.5 결측값
9.6 사례연구
9.7 타이디하지 않은 데이터

10장 dplyr로 하는 관계형 데이터
10.1 들어가기
10.2 nycflights13
10.3 키
10.4 뮤테이팅 조인
10.5 필터링 조인
10.6 조인 문제
10.7 집합 연산

11장 stringr로 하는 문자열
11.1 들어가기
11.2 문자열 기초
11.3 정규표현식을 이용한 패턴 매칭
11.4 도구
11.5 기타 패턴 유형
11.6 정규표현식의 기타 용도
11.7 stringi

12장 forcats로 하는 팩터형
12.1 들어가기
12.2 팩터형 생성하기
12.3 종합사회조사
12.4 팩터 순서 수정하기
12.5 팩터 레벨 수정하기

13장 lubridate로 하는 날짜와 시간
13.1 들어가기
13.2 날짜/시간 생성
13.3 데이트-타임형 구성요소
13.4 시간 범위
13.5 시간대

3부 프로그램
14장 magrittr로 하는 파이프
14.1 들어가기
14.2 파이프 대안
14.3 파이프를 사용하지 않아야 할 경우
14.4 magrittr의 기타 도구

15장 함수
15.1 들어가기
15.2 함수를 언제 작성해야 하나?
15.3 함수는 사람과 컴퓨터를 위한 것
15.4 조건부 실행
15.5 함수 인수
15.6 반환값
15.7 환경

16장 벡터
16.1 들어가기
16.2 벡터의 기초
16.3 원자 벡터의 주요 유형
16.4 원자 벡터 이용하기
16.5 재귀 벡터(리스트)
16.6 속성
16.7 확장 벡터

17장 purrr로 하는 반복작업
17.1 들어가기
17.2 For 루프
17.3 For 루프 변형
17.4 For 루프 vs 함수형
17.5 맵 함수
17.6 실패 다루기
17.7 다중 인수로 매핑
17.8 워크
17.9 For 루프의 기타 패턴

4부 모델
18장 modelr을 이용한 모델의 기초
18.1 들어가기
18.2 간단한 모델
18.3 모델 시각화하기
18.4 수식과 모델 모음
18.5 결측값
18.6 다른 모델 모음

19장 모델 생성
19.1 들어가기
19.2 낮은 품질의 다이아몬드가 더 비싼 이유는 무엇인가?
19.3 일일 운항 횟수에 어떤 영향이 있는가?
19.4 모델에 대해 더 학습하기

20장 purrr와 broom을 이용한 많은 모델
20.1 들어가기
20.2 gapminder 데이터
20.3 리스트-열(List-column)
20.4 리스트-열 생성하기
20.5 리스트-열 단순화하기
20.6 broom으로 타이디 데이터 만들기

5부 의사소통
21장 R 마크다운
21.1 들어가기
21.2 R 마크다운 기초
21.3 마크다운으로 텍스트 서식 지정하기
21.4 코드 청크
21.5 문제 해결
21.6 YAML 헤더
21.7 더 배우기

22장 그래프를 통한 의사소통
22.1 들어가기
22.2 라벨
22.3 주석
22.4 스케일
22.5 확대?축소
22.6 테마
22.7 플롯 저장하기
22.8 더 배우기

23장 R 마크다운 유형들
23.1 들어가기
23.2 출력 옵션
23.3 문서
23.4 노트북
23.5 프리젠테이션
23.6 대시보드
23.7 대화형 동작
23.8 웹사이트
23.9 기타 유형
23.10 더 배우기

24장 R 마크다운 워크플로

저자소개

해들리 위컴 (지은이)    정보 더보기
Posit(구 RStudio)의 수석 과학자이며, 2019년 COPSS(Committee of Presidents of Statistical Societies) 회장상을 받은 R 재단의 회원이다. 데이터 과학을 보다 쉽고 빠르고 재미있게 만들기 위한 계산 및 인지 도구를 만들고 있으며, 데이터 과학을 위한 패키지(ggplot2, dplyr, tidyr을 포함한 tidyverse 등)와 원칙에 입각한 소프트웨어 개발을 위한 패키지(roxygen2, testthat, pkgdown)를 개발하였다. 또한 저자, 교육자, 강연자로 활동하며 데이터 과학을 위한 R의 사용을 권장하고 있다. 그의 웹사이트(http://hadley.nz)에서 더 많은 정보를 볼 수 있다.
펼치기
개럿 그롤문드 (지은이)    정보 더보기
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다. 데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다. 교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.
펼치기
김설기 (옮긴이)    정보 더보기
서울대학교 통계학과에서 학부와 석사를 마치고 미국 케이스웨스턴 대학에서 생물통계 전공으로 박사학위를 받았다. 현재는 네이버에서 데이터 과학 업무를 하고 있으며, 일할 때 R과 다른 도구를 활용하고 있다.
펼치기
최혜민 (옮긴이)    정보 더보기
통계학을 전공하며 자연스레 R을 활용한 시각화와 프로그래밍에 관심을 두게 되었다. 현재는 SK텔레콤에서 데이터 분석 업무를 담당하고 있으며, 데이터에서 가치 있는 정보를 발굴하고 이를 활용할 수 있는 방안에 대해 고민하고 연구하고 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9788966263547