책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9788960779976
· 쪽수 : 632쪽
· 출판일 : 2017-04-28
책 소개
목차
1장. 데이터 예측 분석을 위한 머신 러닝
__1.1 데이터 예측 분석이란?
__1.2 왜 머신 러닝인가?
__1.3 머신 러닝의 동작 방식
__1.4 머신 러닝이 잘못되는 경우
__1.5 데이터 예측 분석 프로젝트의 생애: CRISP-DM
__1.6 데이터 예측 분석 도구
__1.7 앞으로의 여정
__1.8 연습문제
2장. 데이터에서 통찰을 거쳐 결정으로
__2.1 비즈니스 문제를 분석적 해법으로 전환
____2.1.1 사례 분석: 자동차 보험 사기
__2.2 적용 가능성 평가
____2.2.1 사례 연구: 자동차 보험 사기
__2.3 기본 분석 테이블 설계
____2.3.1 사례 연구: 자동차 보험 사기
__2.4 속성 설계와 구현
____2.4.1 여러 가지 데이터 유형
____2.4.2 여러 가지 속성 유형
____2.4.3 시간 처리
____2.4.4 법적 문제
____2.4.5 속성 구현
____2.4.6 사례 연구: 자동차 보험 사기
__2.5 정리
__2.6 더 읽을거리
__2.7 연습문제
3장. 데이터 탐색
__3.1 데이터 품질 보고서
____3.1.1 사례 연구: 자동차 보험 사기
__3.2 데이터 알아가기
____3.2.1 정규 분포
____3.2.2 사례 연구: 자동차 보험 사기
__3.3 데이터 품질 문제 확인
____3.3.1 값 누락
____3.3.2 원소 개수 이상
____3.3.3 이상치
____3.3.4 사례 연구: 자동차 보험 사기
__3.4 데이터 품질 문제 처리
____3.4.1 값 누락 처리
____3.4.2 이상치 처리
____3.4.3 사례 연구: 자동차 보험 사기
__3.5 고급 데이터 탐색
____3.5.1 속성 관계 시각화
____3.5.2 공분산과 상관계수 측정
__3.6 데이터 준비
____3.6.1 정규화
____3.6.2 이산화
____3.6.3 표본 추출
__3.7 정리
__3.8 더 읽을거리
__3.9 연습문제
4장. 정보 기반 학습
__4.1 기본 발상
__4.2 원리
____4.2.1 결정 트리
____4.2.2 셰넌의 엔트로피 모델
____4.2.3 정보 이득
__4.3 표준 방식: ID3 알고리즘
____4.3.1 작동 예제: 작물 분포 예측
__4.4 확장과 변형
____4.4.1 속성 선택과 불균질성 지표의 대안
____4.4.2 연속 서술 속성 다루기
____4.4.3 연속 대상 속성 예측
____4.4.4 트리 가지치기
____4.4.5 모델 앙상블
__4.5 정리
__4.6 참고 문헌
__4.7 연습문제
5장. 유사도 기반 학습
__5.1 기본 발상
__5.2 원리
____5.2.1 속성 공간
____5.2.2 거리 함수를 이용한 유사도 측정
__5.3 표준 접근 방식: 최근접 이웃 알고리즘
____5.3.1 작동 예제
__5.4 확장과 변형
____5.4.1 데이터 잡음 처리
____5.4.2 효율적인 메모리 탐색
____5.4.3 데이터 정규화
____5.4.4 연속 목표에 대한 예측
____5.4.5 기타 유사도 지표
____5.4.6 속성 선택
__5.5 정리
__5.6 더 읽을거리
__5.7 에필로그
__5.8 연습문제
6장. 확률 기반 학습
__6.1 기본 발상
__6.2 원리
____6.2.1 베이즈 정리
____6.2.2 베이지언 예측
____6.2.3 조건부 독립과 인수분해
__6.3 표준 방식: 나이브 베이즈 모델
____6.3.1 적용 예제
__6.4 확장과 변형
____6.4.1 스무딩
____6.4.2 연속 속성: 확률 밀도 함수
____6.4.3 연속 속성: 이산화
____6.4.4 베이지안 네트워크
__6.5 정리
__6.6 참고 문헌
__6.7 연습문제
7장. 오류 기반 학습
__7.1 기본 발상
__7.2 원리
____7.2.1 단순 선형 회귀
____7.2.2 오차 측정
____7.2.3 오차 표면
__7.3 표준 방식: 경사 하강법을 이용한 다변수 선형 회귀
____7.3.1 다변수 선형 회귀
____7.3.2 경사 하강법
____7.3.3 학습률과 가중치 초깃값 선택
____7.3.4 적용 예제
__7.4 확장과 변형
____7.4.1 다변수 선형 회귀 모델 해석
____7.4.2 가중치 감쇄를 이용한 학습률 설정
____7.4.3 분류 서술 속성 처리
____7.4.4 분류 대상 속성 처리: 로지스틱 회귀
____7.4.5 비선형 관계 모델링
____7.4.6 다항 로지스틱 회귀
____7.4.7 서포트 벡터 머신
__7.5 정리
__7.6 더 읽을거리
__7.7 연습문제
8장. 평가
__8.1 기본 발상
__8.2 원리
__8.3 표준 방식: 유보 테스트 집합에 대한 오분석율
__8.4 확장과 변형
____8.4.1 평가 실험 설계
____8.4.2 성능 지표: 분류 대상
____8.4.3 성능 지표: 예측 점수
____8.4.4 성능 지표: 다항 대상
____8.4.5 성능 지표: 연속 대상
____8.4.6 모델 적용 이후의 평가
__8.5 정리
__8.6 더 읽을거리
__8.7 연습문제
9장. 사례 연구: 고객 이탈
__9.1 비즈니스 이해
__9.2 데이터 이해
__9.3 데이터 준비
__9.4 모델링
__9.5 평가
__9.6 적용
10장. 사례 연구: 은하 분류
__10.1 비즈니스 이해
____10.1.1 상황적 능숙함
__10.2 데이터 이해
__10.3 데이터 준비
__10.4 모델링
____10.4.1 기준 모델
____10.4.2 속성 선택
____10.4.3 5단계 모델
__10.5 평가
__10.6 적용
11장. 데이터 예측 분석을 위한 머신 러닝의 예술
__11.1 예측 모델에 대한 다른 관점
__11.2 머신 러닝 방식 선택
____11.2.1 프로젝트에 맞는 머신 러닝 방식
____11.2.2 데이터에 맞는 머신 러닝 방식
__11.3 그다음 단계
A장. 머신 러닝을 위한 기술 통계학 및 데이터 시각화
__연속 속성을 위한 기술 A.1 술 통계학
____A.1.1 중심 경향성
____A.1.2 분산
__A.2 분류 속성을 위한 기술 통계학
__A.3 모집단과 표본
__A.4 데이터 시각화
____A.4.1 막대그래프
____A.4.2 히스토그램
____A.4.3 박스 그래프
B장. 머신 러닝을 위한 확률론 소개
__B.1 확률론 기초
__B.2 확률 분포와 확률 합계
__B.3 유용한 확률 규칙 몇 가지
__B.4 정리
C장. 머신 러닝을 위한 미분 기법
__C.1 연속 함수의 도함수
__C.2 연쇄 법칙
__C.3 편도함수