logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

실전 예측 분석 모델링

실전 예측 분석 모델링

(예측 모델 과정을 여행하는 데이터 분석가를 위한 안내서)

막스 쿤, 키엘 존슨 (지은이), 권정민 (옮긴이)
에이콘출판
50,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
45,000원 -10% 0원
2,500원
42,500원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

실전 예측 분석 모델링
eBook 미리보기

책 정보

· 제목 : 실전 예측 분석 모델링 (예측 모델 과정을 여행하는 데이터 분석가를 위한 안내서)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791161750903
· 쪽수 : 676쪽
· 출판일 : 2017-12-20

책 소개

데이터 전처리, 데이터 분할 등의 분석에 있어서 필수적으로 필요한 단계부터 모델 튜닝의 기초에 이르기까지, 전반적인 예측 모델 과정을 다룬다. 다양한 일반적인 회귀 및 분류 기법 대해 직관적으로 설명하고, 이에 대한 실제 데이터 문제를 예제로 들어 이해를 돕는다.

목차

1장. 시작하며

__1.1 예측 대 해석
__1.2 예측 모델의 주 요소
__1.3 용어
__1.4 예제 데이터 세트와 일반적 데이터 시나리오
____음악 장르
____장학금 신청
____간 손상
____투과성
____화학 물질 제조 절차
____부정 재무 재표
____데이터 세트 비교
__1.5 개요
__1.6 표기법

2장. 예측 모델링 과정 훑어보기

__2.1 사례 연구: 연비 예측
__2.2 테마
____데이터 분할
____예측 데이터
____성능 추정
____여러 모델을 평가하기
____모델 선정
__2.3 요약

3장. 데이터 전처리

__3.1 사례 연구: 하이콘텐츠 스크리닝에서의 세포 분할
__3.2 개별 예측 변수에 대한 데이터 변형
____중심화와 척도화
____왜도 해결을 위한 변형
__3.3 여러 예측 변수 변형
____이상치 제거를 위한 데이터 변형
____데이터 축소와 특징 추출
__3.4 결측치 처리
__3.5 예측 변수 제거
____예측 변수 간의 상관관계3.6 예측 변수 추가
__3.7 예측 변수 구간화
__3.8 컴퓨팅
____변환
____필터링
____가변수 생성
____연습 문제

4장. 과적합과 모델 튜닝

__4.1 과적합 문제
__4.2 모델 튜닝
__4.3 데이터 분할
__4.4 리샘플링 기법
____K -겹 교차 검증
____일반화 교차 검증
____반복적 훈련/테스트 세트 분할
____부트스트랩
__4.5 사례 연구: 신용 평가
__4.6 최종 튜닝 변수 선정
__4.7 추천하는 데이터 분할 방식
__4.8 모델 선택
__4.9 컴퓨팅
____데이터 분할
____리샘플링
____R로 하는 기본적 모델 구축
____튜닝 변수 판단
____모델 간 비교
____연습 문제

5장. 회귀 모델 성능 측정

__5.1 성능의 정량적 측정
__5.2 분산-편향성 트레이드 오프
__5.3 컴퓨팅

6장. 선형 회귀와 이웃 모델들

__6.1 사례 연구 구조적 정량 활성 관계 모델링
__6.2 선형 회귀
____용해도 데이터에 대한 선형 회귀
__6.3 부분 최소 제곱
____용해도 데이터에 대한 PCR과 PLSR
____PLS의 알고리즘 분산
__6.4 벌점 모델
__6.5 컴퓨팅
____일반 선형 회귀
____부분 최소 제곱
____벌점 회귀 모델
____연습 문제

7장 비선형 회귀 모델

__7.1 신경망 모델
__7.2 다변량 가법 회귀 스플라인 모델
__7.3 서포트 벡터 머신
__7.4 K -최근접 이웃
__7.5 컴퓨팅
____신경망 모델
____다변량 가법 회귀 스플라인서포트 벡터 머신
____K-최근접 이웃
____연습 문제

8장. 회귀 트리와 규칙 기반 모델

__8.1 기본 회귀 트리
__8.2 회귀 모델 트리
__8.3 규칙 기반 모델
__8.4 배깅 트리
__8.5 랜덤 포레스트
__8.6 부스팅
__8.7 큐비스트
__8.8 컴퓨팅
____단일 트리
____모델 트리
____배깅 트리
____랜덤 포레스트
____부스티드 트리
____큐비스트
____연습 문제

9장. 용해도 모델 정리

10장. 사례 연구: 콘크리트 혼합물의 압축 강도


__10.1 모델 구축 전략
__10.2 모델 성능
__10.3 압축 강도 최적화
__10.4 컴퓨팅

11장. 분류 모델에서의 성능 측정

__11.1 클래스 분류
____잘 보정된 확률
____클래스 확률 나타내기
____중간 지대
__11.2 분류 예측 평가
____이종 문제
____비정확도 기반 기준
__11.3 클래스 확률 평가
____시스템 동작 특성(ROC) 곡선
____리프트 도표
__11.4 컴퓨팅
____민감도와 특이도
____혼동 행렬
____시스템 동작 특성 곡선
____리프트 도표
____확률 보정

12장. 판별 분석 및 기타 선형 분류 모델

__12.1 사례 연구: 성공적인 지원금 신청 예측
__12.2 로지스틱 회귀
__12.3 선형 판별 분석
__12.4 부분 최소 제곱 판별 분석
__12.5 벌점 모델
__12.6 최근접 축소 중심 모델
__12.7 컴퓨팅
____로지스틱 회귀
____선형 판별 분석
____부분 최소 제곱 판별 분석
____벌점 모델
____최근접 축소 중심법
____연습 문제

13장. 비선형 분류 모델

__13.1 비선형 판별 분석
____이차 판별 분석과 정규 판별 분석
____혼합 판별 분석
__13.2 신경망
__13.3 유연 판별 분석
__13.4 서포트 벡터 머신
__13.5 K -최근접 이웃 모델
__13.6 나이브 베이즈 모델
__13.7 컴퓨팅
____비선형 판별 분석
____신경망
____유연 판별 분석
____서포트 벡터 머신
____K-최근접 이웃 분석
____나이브 베이즈 분석
____연습 문제

14장. 분류 트리와 규칙 기반 모델

__14.1 기본 분류 트리
__14.2 규칙 기반 모델
____C4.5 규칙
____PART
__14.3 배깅 트리
__14.4 랜덤 포레스트
__14.5 부스팅
____에이다부스트
____확률 경사 부스팅
__14.6 C5.0
____분류 트리
____분류 규칙
____부스팅
____모델의 다른 측면
____보조금 데이터
__14.7 범주형 변수의 두 가지 변조 방식 비교
__14.8 컴퓨팅
____분류 트리
____규칙배깅 트리
____랜덤 포레스트
____부스티드 트리
____연습 문제

15장. 보조금 지원 모델 살펴보기

16장. 심각한 클래스 불균형 처리하기


__16.1 사례 연구: 이동식 주택 보험 가입 예측
__16.2 클래스 불균형의 영향
__16.3 모델 튜닝
__16.4 대체 한도
__16.5 사전 확률 보정
__16.6 다른 경우별 가중치
__16.7 샘플링 기법
__16.8 비용 민감 훈련
__16.9 컴퓨팅
____대체 한도
____샘플링 기법
____비용 민감 훈련
____연습 문제

17장. 사례 연구: 작업 스케줄링

__17.1 데이터 분할과 모델 전략
__17.2 결과
__17.3 컴퓨팅

18장. 예측 변수 중요도 측정하기

__18.1 수치형 결과
__18.2 범주형 결과
__18.3 다른 방법
__18.4 컴퓨팅
____수치형 결과
____변수형 결과
____모델 기반 중요도
____연습 문제

19장. 특징 선택 입문

__19.1 비정보성 예측 변수 사용의 결과
__19.2 변수 수를 줄이는 방식
__19.3 래퍼 방법
____전진, 후진, 단계적 선택법
____담금질 기법
____유전 알고리즘
__19.4 필터 방법
__19.5 선택 편향
__19.6 사례 연구: 인지 장애 예측
__19.7 컴퓨팅
____전진, 후진, 단계적 선택법
____반복 특징 제거
____필터 방법
____연습 문제

20장. 모델 성능에 영향을 미치는 요인

__20.1 삼종 오류
__20.2 결과의 측정 오차
__20.3 예측 변수에서의 측정 오차
____사례 연구: 원치 않는 부작용 예측
__20.4 연속형 결과를 이산화하기
__20.5 언제 모델의 예측값을 믿어야 할까?
__20.6 샘플이 클 때의 영향
__20.7 컴퓨팅
____연습 문제

부록 A. 여러 모델에 대한 요약

부록 B. R에 대한 소개


__1B.1 시작 및 도움말
__1B.2 패키지
__1B.3 객체 생성
__1B.4 데이터 유형과 기본 구조
__1B.5 2차원 데이터 세트로 작업하기
__1B.6 객체와 클래스
__1B.7 R 함수
__1B.8 =의 3개 얼굴
__1B.9 AppliedPredictiveModeling 패키지
__B.10 caret 패키지
__B.11 이 책에서 사용된 소프트웨어

부록 C. 유용한 웹 사이트

____소프트웨어
____대회
____데이터 세트

저자소개

막스 쿤 (지은이)    정보 더보기
코네티컷 주 그로턴에서 화이자 글로벌(Pfizer Global) R&D의 비임상 통계 디렉터로 일하고 있다. 15년간 약학 분야와 진단 분야에서 예측 모델을 적용해왔으며 수많은 R 패키지를 만들었다.
펼치기
키엘 존슨 (지은이)    정보 더보기
약학 연구 개발 분야의 통계 컨설팅 및 예측 모델링에서 10년 이상의 경험을 쌓았다. dPcmr 모델링에 특화된 회사인 아버 애널리틱스(Arbor Analytics)의 공동 창업자이며, 전 화이자 글로벌 R&D의 통계 디렉터였다. 또한 통계 방법론과 러닝 알고리즘을 개발하고 응용하는 연구를 했다.
펼치기
권정민 (감수)    정보 더보기
세상은 데이터로 이뤄져 있다고 생각하며, 데이터를 잘 활용하고자 하는 목표를 가지고 다양한 데이터 분석 및 활용 방안을 만들고 연구하는 것을 업으로 하고 있다. 카이스트 및 포항공과대학교에서 산업공학과 전산학을 전공했으며, 다양한 산업군에서 데이터 분석을 수행하고 있다. 《빅데이터 분석 도구 R 프로그래밍》, 《The R Book(Second Edition) 한국어판》, 《딥러닝과 바둑》을 번역하고, 《딥러닝 레볼루션》과 《인터넷, 알고는 사용하니?》를 감수했다.
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책