logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

R을 활용한 데이터 과학

R을 활용한 데이터 과학

(데이터 불러오기, 정돈하기, 변형하기, 시각화하기, 제2판)

해들리 위컴, 개럿 그롤문드, 미네 체틴카야-룬델 (지은이), 김영우 (옮긴이)
인사이트
45,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
40,500원 -10% 0원
2,250원
38,250원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 36,000원 -10% 1800원 30,600원 >

책 이미지

R을 활용한 데이터 과학
eBook 미리보기

책 정보

· 제목 : R을 활용한 데이터 과학 (데이터 불러오기, 정돈하기, 변형하기, 시각화하기, 제2판)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788966265145
· 쪽수 : 655쪽
· 출판일 : 2026-02-04

책 소개

예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서다. tidyverse로 실제 분석 과정을 익히며, 프로그래밍 경험이 없어도 빠르게 데이터 과학을 시작할 수 있다.
전면 개정되어 돌아온, 데이터 과학 분야의 바이블

이 책은 예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서입니다. 데이터 과학을 빠르고 효율적이며 재미있게 만들어 주는 R 패키지 모음인 tidyverse를 통해 실제 분석 과정을 익힐 수 있습니다. 따라서 프로그래밍 경험이 전혀 없더라도, 이 책과 함께라면 빠르게 데이터 과학을 시작할 수 있습니다.
독자들은 이 책을 통해 데이터를 불러오고, 변형하고, 시각화하고, 결과를 바탕으로 의사소통하는 방법을 익힐 수 있습니다. 또한 데이터 과학 프로세스 전체를 큰 그림으로 이해하고 세부 요소를 다루는 데 필요한 기본 도구도 폭넓게 이해할 수 있습니다.
이번 개정판에서는 최신 tidyverse 기능과 우수 사례들이 업데이트되었으며, 스프레드시트, 데이터베이스, 웹사이트에서 데이터를 가져오는 방법을 익히는 새로운 장도 추가되었습니다. 연습문제를 풀면서 책에서 익힌 내용을 복습할 수도 있습니다.

이 책에서 다루는 내용
? 시각화하기: 데이터를 탐색하고 분석 결과를 전달하는 데 필요한 그래프를 만듭니다.
? 변형하기: 변수 타입과 이를 다루는 도구를 익힙니다.
? 불러오기: 데이터를 R로 가져오고 분석하기 편한 형태로 만듭니다.
? 프로그래밍하기: 더 명확하고 쉽게 데이터 문제를 해결하는 R 도구를 익힙니다.
? 의사소통하기: Quarto를 이용해 글, 코드, 분석 결과를 통합한 보고서를 만듭니다.

목차

옮긴이의 글
지은이의 글

1부 전체 흐름

1장 데이터 시각화하기
들어가며
첫 단계
ggplot2 호출하기
분포 시각화하기
변수의 관계 시각화하기
그래프 저장하기
자주 겪는 문제들
요약

2장 워크플로우: 기초
코딩 기초
주석
이름을 어떻게 지을까?
함수 호출하기
연습문제
요약

3장 데이터 변형하기
들어가며


파이프
그룹화
사례 연구: 집계와 샘플 크기
요약

4장 워크플로우: 코드 스타일
이름 짓기
공백 넣기
파이프
ggplot2
구획 나누기 주석
연습문제
요약

5장 데이터 정돈하기
들어가며
정돈된 데이터
데이터를 세로로 늘이기
데이터를 가로로 넓히기
요약 97

6장 워크플로우: 스크립트와 프로젝트
스크립트
프로젝트
연습문제
요약

7장 데이터 불러오기
들어가며
파일에서 데이터 불러오기
열 타입 다루기
여러 파일에서 데이터 불러오기
데이터를 파일로 저장하기
데이터 입력하기
요약

8장 워크플로우: 도움 구하기
구글은 우리의 친구
reprex 만들기
자신에게 투자하기
요약

2부 시각화하기

9장 레이어
들어가며
시각적 속성 매핑
기하학 객체
패싯
통계적 변환
위치 조정
좌표계
그래픽 문법의 레이어 구조
요약

10장 탐색적 자료 분석
들어가며
질문
변동
특이한 값
공변동
패턴과 모델
요약

11장 의사소통
들어가며
레이블
주석
스케일
테마
레이아웃
요약

3부 변형하기

12장 논리형 벡터
들어가며
비교하기
불 대수
요약하기
조건부 변형
요약

13장 수치형 벡터
들어가며
숫자 만들기
개수 세기
수치 변환
일반적인 변형 방법들
수치 요약
요약

14장 문자열
들어가며
문자열 만들기
데이터를 이용해 여러 문자열 만들기
문자열에서 데이터 추출하기
글자 다루기
비영어 텍스트
요약

15장 정규 표현식
들어가며
기본적인 패턴
핵심 함수
패턴 세부 사항
패턴 제어하기
연습해 보기
다른 곳에서 정규 표현식 사용하기
요약

16장 팩터
들어가며
팩터 기초
종합사회조사
팩터 순서 바꾸기
팩터 레벨 수정하기
순서형 팩터
요약

17장 날짜와 시간
들어가며
날짜-시간형 변수 만들기
개별 구성 요소로 만들기
날짜-시간 구성 요소
시간 범위
시간대
요약

18장 결측치
들어가며
명시적 결측치
암묵적 결측치
팩터와 빈 그룹
요약

19장 조인
들어가며

기본적인 조인
조인은 어떻게 작동할까?
비등가 조인
요약

4부 데이터 불러오기

20장 스프레드시트
들어가며
엑셀
구글 시트
요약

21장 데이터베이스
들어가며
데이터베이스 기초
데이터베이스 연결하기
dbplyr 기초
SQL
함수 번역
요약

22장 Arrow
들어가며
데이터 가져오기
데이터셋 열기
파케이 포맷
dplyr을 arrow와 함께 사용하기
요약

23장 계층형 데이터
들어가며
리스트
펼치기
사례 연구
JSON
요약

24장 웹 스크래핑
들어가며
스크래핑의 윤리성과 합법성
HTML 기초
데이터 추출하기
올바른 선택자 찾기
모두 함께 사용하기
동적 사이트
요약

5부 프로그래밍

25장 함수
들어가며
벡터 함수
데이터 프레임 함수
그래프 함수
스타일
요약

26장 반복
들어가며
여러 열 수정하기
여러 파일 불러오기
여러 출력물 저장하기
요약

27장 base R 현장 가이드
들어가며
[로 여러 요소 선택하기
$와 [[로 단일 요소 선택하기
Apply 계열 함수
for 반복문
그래프
요약

6부 의사소통하기

28장 Quarto
들어가며
Quarto 기초
비주얼 에디터
소스 에디터
코드 청크
그림

캐싱
문제 해결하기
YAML 헤더
작업 흐름
요약

29장 Quarto 문서 포맷
들어가며
출력 옵션
다양한 문서 포맷
프레젠테이션
상호작용 문서
웹사이트와 책 만들기
기타 포맷
요약

저자소개

해들리 위컴 (지은이)    정보 더보기
Posit, PBC의 수석 과학자이며, 2019년 COPSS 상 수상자이자 R 파운데이션 회원이다. 데이터 과학을 더 쉽고 빠르고 재미있게 만들기 위해 프로그래밍 도구와 개념적 도구를 만들고 있으며, 데이터 과학용 패키지(ggplot2, dplyr, tidyr을 포함하는 tidyverse)와 체계적인 소프트웨어 개발 도구(roxygen2, testthat, pkgdown 등)를 개발하였다. R을 이용한 데이터 과학 활동을 장려하기 위해 작가, 교육자, 연사로도 활동하고 있다. 자세한 소개는 그의 웹사이트(http://hadley.nz)에서 확인할 수 있다.
펼치기
개럿 그롤문드 (지은이)    정보 더보기
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다. 데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다. 교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.
펼치기
미네 체틴카야-룬델 (지은이)    정보 더보기
듀크대학교 통계과학과 실무 교수이자 Posit, PBC의 개발자 교육 담당자이다. 주요 연구 분야는 통계학과 데이터 과학 교육학이며, 특히 컴퓨팅, 재현 가능한 연구, 학생 중심 학습, 오픈 소스 교육에 역점을 두고 있다. OpenIntro 프로젝트의 일환으로 통계학 입문 교과서를 집필하였고, Data Science in a Box를 만들어 관리하고 있다. 또한 코세라의 인기 과정인 Statistics with R specialization을 개설해 운영하고 있다. 그녀는 2021년 Hogg 어워드의 입문 통계학 교육 부문 우수상, 2018년 하버드 피카드 상, 2016년 ASA 월러 교육상을 받았다. 자세한 소개는 그녀의 웹사이트(https://mine-cr.com)에서 확인할 수 있다.
펼치기
김영우 (지은이)    정보 더보기
데이터로 세상을 이해하는 일을 하는 데이터 분석가이다. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고, 혈액형 성격론, 타로 카드, 자기계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 현재 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있으며, SKT, KT, 삼성금융연수원, LG인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 관련 분야의 다양한 소식과 실무 노하우를 전하는 유튜브 채널 ‘데이터홀릭’을 운영하고 있다. 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.
펼치기

책속에서

"데이터 분석 작업의 중심에는 R이 있습니다. R을 활용하면 데이터 분석에 필요한 다양한 작업을 쉽고 간결한 명령어로 처리할 수 있습니다. 특히 tidyverse 생태계의 패키지들은 분석가가 프로그래밍 기술의 늪에 빠지지 않고 데이터 분석 본연의 과정에 집중할 수 있도록 도와주는 든든한 도구입니다. 《R을 활용한 데이터 과학》은 tidyverse의 창시자인 해들리 위컴이 직접 패키지의 사용법을 설명하고, 데이터를 정돈해 효율적으로 분석하는 방법을 안내하는 의미 있는 책입니다."
- '옮긴이의 글' 중에서


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9788966265220