logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

데이터 과학 입문자를 위한 R

데이터 과학 입문자를 위한 R

(설치부터 패키지 개발까지 R로 시작하는 데이터 과학)

재리드 랜더 (지은이), 고석범 (옮긴이)
에이콘출판
40,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

데이터 과학 입문자를 위한 R
eBook 미리보기

책 정보

· 제목 : 데이터 과학 입문자를 위한 R (설치부터 패키지 개발까지 R로 시작하는 데이터 과학)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791161750989
· 쪽수 : 648쪽
· 출판일 : 2017-12-27

책 소개

R의 기초부터 프로그래밍까지 소개하고, 다양한 통계학적 방법과 일상에서 사용할 수 있는 도구들을 소개한다. 2판에서는 새로운 내용을 추가해 최신 R 커뮤니티에 소개된 내용들을 망라하고 있다.

목차

1장. R 설치

__1.1 R 다운로드하기
__1.2 R 버전
__1.3 32비트 대 64비트
__1.4 설치
____1.4.1 윈도우에서 설치하기
____1.4.2 맥 OS X에 설치하기
____1.4.3 리눅스에 설치하기
__1.5 마이크로소프트 R 오픈
__1.6 결론

2장. R 환경

__2.1 커맨드라인 인터페이스
__2.2 RStudio
____2.2.1 RStudio 프로젝트
____2.2.2 RStudio 툴
____2.2.3 깃 통합
__2.3 마이크로소프트 비주얼 스튜디오
__2.4 결론

3장. R 패키지

__3.1 패키지 인스톨
____3.1.1 패키지 제거
__3.2 패키지 로딩
____3.2.1 패키지 언로딩
__3.3 패키지 만들기
__3.4 결론

4장. R의 기초

__4.1 기초 수학
__4.2 변수
____4.2.1 변수 할당
____4.2.2 변수 제거
__4.3 데이터 유형
____4.3.1 숫자형 데이터
____4.3.2 문자열 데이터
____4.3.3 날짜
____4.3.4 논리형
__4.4 벡터
____4.4.1 벡터 연산
____4.4.2 팩터형 벡터
__4.5 함수 호출하기
__4.6 함수에 대한 도움말 문서
__4.7 결측값
____4.7.1 NA
____4.7.2 NULL
__4.8 파이프
__4.9 결론

5장. 고급 데이터 구조

__5.1 데이터 프레임
__5.2 리스트
__5.3 행렬
__5.4 배열
__5.5 결론

6장. R로 데이터 읽어 오기

__6.1 CSV 파일 읽기
____6.1.1 read_delim
____6.1.2 fread
__6.2 엑셀 데이터
__6.3 데이터베이스에서 데이터 읽기
__6.4 다른 통계 툴의 데이터
__6.5 R 바이너리 파일
__6.6 R에 포함돼 있는 데이터
__6.7 웹 사이트에서 데이터 추출하기
__6.8 JSON 데이터 읽기
__6.9 결론

7장. R 통계 그래프

__7.1 기본 그래픽스
____7.1.1 기본 히스토그램
____7.1.2 기본 산점도
____7.1.3 상자그림
__7.2 ggplot2
____7.2.1 ggplot2로 히스토그램과 밀도 곡선
____7.2.2 ggplot2 산점도
____7.2.3 ggplot2 상자그림과 바이올린 플롯
____7.2.4 ggplot2 꺾은선그래프
____7.2.5 테마
__7.3 결론

8장. R 함수 작성

__8.1 헬로 월드
__8.2 함수 인자
____8.2.1 디폴트 인자
____8.2.2 부가 인자들
__8.3 Return Values
__8.4 do.call
__8.5 결론

9장. R 제어문

__9.1 if와 else
__9.2 switch
__9.3 ifelse
__9.4 복합 테스트
__9.5 결론

10장. 루프, R에서는 그다지 환영받지 못하는 존재

__10.1 for 루프
__10.2 while 루프
__10.3 루프 조절
__10.4 결론

11장. 그룹별 데이터 조작

__11.1 Apply 패밀리
____11.1.1 apply 함수
____11.1.2 lapply와 sapply 함수
____11.1.3 mapply 함수
____11.1.4 기타 apply 함수들
__11.2 집계
__11.3 plyr 패키지
____11.3.2 llply
____11.3.3 plyr 헬퍼 함수
____11.3.4 속도 대 편이성
__11.4 data.table
____11.4.1 키
____11.4.2 데이터 테이블 집계
__11.5 결론

12장. dplyr 패키지로 빠르게 그룹 단위로 데이터 다루기

__12.1 파이프(Pipes)
__12.2 tbl
__12.3 select
__12.4 filter
__12.5 slice
__12.6 mutate
__12.7 summarize
__12.8 group_by
__12.9 arrange
__12.10 do
__12.11 데이터베이스와 dplyr 사용
__12.12 결론

13장. purrr 패키지를 사용한 순회

__13.1 map
__13.2 반환값의 유형을 정의한 map 함수
__13.3 데이터 프레임에서 순회하기
__13.4 여러 입력값에 대해 map 사용하기
__13.5 결론

14장. 데이터 재구조화

__14.1 cbind와 rbind
__14.2 조인
__14.3 결론

15장. 타이디버스로 데이터 재구조화

__15.1 행과 열을 붙이기
__15.2 dplyr를 사용한 조인
__15.3 데이터 포맷 변환
__15.4 결론

16장. 문자열 처리

__16.1 paste 함수
__16.2 sprintf 함수
__16.3 텍스트 추출
__16.4 정규 표현식
__16.5 결론

17장. 확률 분포

__17.1 정규 분포
__17.2 이항 분포(Binomial Distribution)
__17.3 포아송 분포
__17.4 기타 분포들
__17.5 결론

18장. 기초 통계학

__18.1 요약 통계
__18.2 상관과 공분산(Correlation, Covariance)
__18.3 t-검정
__18.3 단일-표본 t 검정
__18.4 ANOVA
__18.5 결론

19장. 선형 모형

__19.1 단순선형회귀
__19.3 결론

20장. 일반화 선형 모형

__20.1 로직스틱 회귀
__20.2 포아송 회귀
__20.3 기타 일반화 선형 모형들
__20.4 생존 분석
__20.5 결론

21장. 모형 진단

__21.1 잔차(Residuals)
__21.2 모형들을 비교하는 방법
__21.3 교차 타당성 검증(Cross-Validation)
__21.4 부트 스트랩
__21.5 단계적 변수 선택
__21.6 결론


22장. 정형화(Regularization)와 축소(Shrinkage)

__22.2 베이즈 축소(Bayesian Shrinkage)
__22.3 결론

23장. 비선형 모형

__23.1 비선형 최소 제곱
__23.2 스플라인(splines)
__23.3 일반화 가법 모형(Generalized Additive Models)
__23.4 의사결정 나무(decision trees)
__23.5 부스팅 의사결정 나무(boosted tress)
__23.6 랜덤 포리스트(Random Forests)
__23.7 결론

24장. 시계열과 자기상관

__24.1 자기회귀이동평균(Autoregressive Moving Average)
__24.2 벡터자기회귀모형(VAR)
__24.3 일반화 자동회귀 조건부 이분산 모형(GARCH)
__24.4 결론

25장. 군집화

__25.1 K-평균 군집화
__25.2 PAM
__25.3 계층적 군집화
__25.4 결론

26장. Caret을 사용한 모형 적합

__26.1 caret 패키지의 기초
__26.2 Caret 옵션들
__26.3 부스팅 의사결정 나무에 대한 조율
__26.4 결론


27장. 니터(knitr)를 활용한 재현성과 보고서

__271. 레이텍 프로그램 인스톨
__27.2 레이텍의 기초
__27.3 레이텍과 함께 니터 사용하기
__27.4 결론

28장. R 마크다운으로 다양한 포맷의 문서 만들기

__28.1 문서 컴파일
__28.2 문서 헤더
__28.3 마크다운의 기초
__28.4 마크다운 코드 청크
__28.5 htmlwidgets
__28.6 R 마크다운 슬라이드 쇼
__28.7 결론

29장. 샤이니로 인터랙티브 대시보드 만들기

__29.1 R 마크다운 문서 안에서 샤이니 사용하기
__29.2 샤이니에서의 반응성 표현식
__29.3 서버와 UI
__29.4 결론

30장. R 패키지 개발

__30.1 폴더 구조
__30.2 패키지 파일들
__30.3 패키지 문서화
__30.4 테스트
__30.5 체킹, 빌딩, 인스톨링
__30.6 CRAN에 패키지 제출하기
__30.7 C++ 코드
__30.8 결론

부록 A. 주변에서 찾을 수 있는 R 리소스

부록 B. 용어 정리

저자소개

재리드 랜더 (지은이)    정보 더보기
뉴욕에 있는 통계 컨설팅과 교육 서비스를 제공하는 랜더 애널리틱스 사의 수석 데이터 과학자며, 세계에서 가장 큰 R 모임인 뉴욕 오픈 스태티스티컬 프로그래밍 모임(New York Open Statistical Programming Meetup)과 뉴욕 R 콘퍼런스(New York R Conference) 관리자다. 컬럼비아 대학의 통계학 조교수이기도 하다. 스콧 피자 투어(Scott's Pizza Tours)의 투어 가이드로도 활동한다. 컬럼비아 대학 통계학과에서 학부, 뮬렌버그 대학에서 수학 석사를 마쳤다. 학계와 산업계에 걸친 다양한 경험이 있으며, 데이터 관련 커뮤니티 활동을 매우 열심히 해서 MIT 슬로건 스포츠 애널리틱스 콘퍼런스(MIT Sloan Sports Analytics Conference) 등 전 세계에서 열리는 여러 모임에서 자주 발표한다. 통계학에 대한 글들은 jaredlander.com에서 볼 수 있으며 게재된 글은 CBS, 월 스트리트 저널 같은 많은 매체에 소개됐다.
펼치기
고석범 (옮긴이)    정보 더보기
가톨릭대학교 의과대학을 졸업하고 서울아산병원 인턴, 서울성모병원 신경과 수련을 마친 신경과 전문의로, 현재 경기도 광주시에 있는 성심요양병원 대표원장을 맡고 있다. 성남시 노인보건센터장, 보바스기념병원장, 주식회사 지노바이오 대표를 역임했다. 재미로 시작했던 공부를 바탕으로 ICT 관련 여러 책들을 번역하거나 저술했다.
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책