책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788966265145
· 쪽수 : 655쪽
· 출판일 : 2026-02-04
책 소개
이 책은 예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서입니다. 데이터 과학을 빠르고 효율적이며 재미있게 만들어 주는 R 패키지 모음인 tidyverse를 통해 실제 분석 과정을 익힐 수 있습니다. 따라서 프로그래밍 경험이 전혀 없더라도, 이 책과 함께라면 빠르게 데이터 과학을 시작할 수 있습니다.
독자들은 이 책을 통해 데이터를 불러오고, 변형하고, 시각화하고, 결과를 바탕으로 의사소통하는 방법을 익힐 수 있습니다. 또한 데이터 과학 프로세스 전체를 큰 그림으로 이해하고 세부 요소를 다루는 데 필요한 기본 도구도 폭넓게 이해할 수 있습니다.
이번 개정판에서는 최신 tidyverse 기능과 우수 사례들이 업데이트되었으며, 스프레드시트, 데이터베이스, 웹사이트에서 데이터를 가져오는 방법을 익히는 새로운 장도 추가되었습니다. 연습문제를 풀면서 책에서 익힌 내용을 복습할 수도 있습니다.
이 책에서 다루는 내용
? 시각화하기: 데이터를 탐색하고 분석 결과를 전달하는 데 필요한 그래프를 만듭니다.
? 변형하기: 변수 타입과 이를 다루는 도구를 익힙니다.
? 불러오기: 데이터를 R로 가져오고 분석하기 편한 형태로 만듭니다.
? 프로그래밍하기: 더 명확하고 쉽게 데이터 문제를 해결하는 R 도구를 익힙니다.
? 의사소통하기: Quarto를 이용해 글, 코드, 분석 결과를 통합한 보고서를 만듭니다.
목차
옮긴이의 글
지은이의 글
1부 전체 흐름
1장 데이터 시각화하기
들어가며
첫 단계
ggplot2 호출하기
분포 시각화하기
변수의 관계 시각화하기
그래프 저장하기
자주 겪는 문제들
요약
2장 워크플로우: 기초
코딩 기초
주석
이름을 어떻게 지을까?
함수 호출하기
연습문제
요약
3장 데이터 변형하기
들어가며
행
열
파이프
그룹화
사례 연구: 집계와 샘플 크기
요약
4장 워크플로우: 코드 스타일
이름 짓기
공백 넣기
파이프
ggplot2
구획 나누기 주석
연습문제
요약
5장 데이터 정돈하기
들어가며
정돈된 데이터
데이터를 세로로 늘이기
데이터를 가로로 넓히기
요약 97
6장 워크플로우: 스크립트와 프로젝트
스크립트
프로젝트
연습문제
요약
7장 데이터 불러오기
들어가며
파일에서 데이터 불러오기
열 타입 다루기
여러 파일에서 데이터 불러오기
데이터를 파일로 저장하기
데이터 입력하기
요약
8장 워크플로우: 도움 구하기
구글은 우리의 친구
reprex 만들기
자신에게 투자하기
요약
2부 시각화하기
9장 레이어
들어가며
시각적 속성 매핑
기하학 객체
패싯
통계적 변환
위치 조정
좌표계
그래픽 문법의 레이어 구조
요약
10장 탐색적 자료 분석
들어가며
질문
변동
특이한 값
공변동
패턴과 모델
요약
11장 의사소통
들어가며
레이블
주석
스케일
테마
레이아웃
요약
3부 변형하기
12장 논리형 벡터
들어가며
비교하기
불 대수
요약하기
조건부 변형
요약
13장 수치형 벡터
들어가며
숫자 만들기
개수 세기
수치 변환
일반적인 변형 방법들
수치 요약
요약
14장 문자열
들어가며
문자열 만들기
데이터를 이용해 여러 문자열 만들기
문자열에서 데이터 추출하기
글자 다루기
비영어 텍스트
요약
15장 정규 표현식
들어가며
기본적인 패턴
핵심 함수
패턴 세부 사항
패턴 제어하기
연습해 보기
다른 곳에서 정규 표현식 사용하기
요약
16장 팩터
들어가며
팩터 기초
종합사회조사
팩터 순서 바꾸기
팩터 레벨 수정하기
순서형 팩터
요약
17장 날짜와 시간
들어가며
날짜-시간형 변수 만들기
개별 구성 요소로 만들기
날짜-시간 구성 요소
시간 범위
시간대
요약
18장 결측치
들어가며
명시적 결측치
암묵적 결측치
팩터와 빈 그룹
요약
19장 조인
들어가며
키
기본적인 조인
조인은 어떻게 작동할까?
비등가 조인
요약
4부 데이터 불러오기
20장 스프레드시트
들어가며
엑셀
구글 시트
요약
21장 데이터베이스
들어가며
데이터베이스 기초
데이터베이스 연결하기
dbplyr 기초
SQL
함수 번역
요약
22장 Arrow
들어가며
데이터 가져오기
데이터셋 열기
파케이 포맷
dplyr을 arrow와 함께 사용하기
요약
23장 계층형 데이터
들어가며
리스트
펼치기
사례 연구
JSON
요약
24장 웹 스크래핑
들어가며
스크래핑의 윤리성과 합법성
HTML 기초
데이터 추출하기
올바른 선택자 찾기
모두 함께 사용하기
동적 사이트
요약
5부 프로그래밍
25장 함수
들어가며
벡터 함수
데이터 프레임 함수
그래프 함수
스타일
요약
26장 반복
들어가며
여러 열 수정하기
여러 파일 불러오기
여러 출력물 저장하기
요약
27장 base R 현장 가이드
들어가며
[로 여러 요소 선택하기
$와 [[로 단일 요소 선택하기
Apply 계열 함수
for 반복문
그래프
요약
6부 의사소통하기
28장 Quarto
들어가며
Quarto 기초
비주얼 에디터
소스 에디터
코드 청크
그림
표
캐싱
문제 해결하기
YAML 헤더
작업 흐름
요약
29장 Quarto 문서 포맷
들어가며
출력 옵션
다양한 문서 포맷
프레젠테이션
상호작용 문서
웹사이트와 책 만들기
기타 포맷
요약
책속에서
"데이터 분석 작업의 중심에는 R이 있습니다. R을 활용하면 데이터 분석에 필요한 다양한 작업을 쉽고 간결한 명령어로 처리할 수 있습니다. 특히 tidyverse 생태계의 패키지들은 분석가가 프로그래밍 기술의 늪에 빠지지 않고 데이터 분석 본연의 과정에 집중할 수 있도록 도와주는 든든한 도구입니다. 《R을 활용한 데이터 과학》은 tidyverse의 창시자인 해들리 위컴이 직접 패키지의 사용법을 설명하고, 데이터를 정돈해 효율적으로 분석하는 방법을 안내하는 의미 있는 책입니다."
- '옮긴이의 글' 중에서




















