책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 데이터베이스 프로그래밍 > 데이터베이스 구축
· ISBN : 9791161750538
· 쪽수 : 576쪽
· 출판일 : 2017-09-15
책 소개
목차
1장. 머신 러닝 소개
__머신 러닝의 기원
__머신 러닝의 사용과 남용
____머신 러닝 성공 사례
____머신 러닝의 한계
____머신 러닝의 윤리
__기계의 학습 방법
____데이터 저장소
____추상화
____일반화
____평가
__실전 머신 러닝
____입력 데이터 타입
____머신 러닝 알고리즘 타입
____입력 데이터와 알고리즘 매칭
__R을 이용한 머신 러닝
____R 패키지 설치
____패키지 로딩과 언로딩
__요약
2장. 데이터의 관리와 이해
__R 데이터 구조
____벡터
____팩터
____리스트
____데이터 프레임
____행렬과 배열
__R을 이용한 데이터 관리
____데이터 구조 저장, 로드, 제거
____CSV 파일에서 데이터 가져오기와 저장하기
__데이터 탐색과 이해
____데이터 구조 탐색
____수치 변수 탐색
______중심 경향 측정: 평균과 중앙값
______분산 측정: 사분위수와 다섯 숫자 요약
______수치 변수의 시각화: 상자그림
______수치 변수 시각화: 히스토그램
______수치 데이터의 이해:균등 분포와 정규 분포
______분산 측정:분산과 표준 편차
__범주 변수 탐색
____중앙화 경향 측정: 모드
__변수 간의 관계 탐색
____관계 시각화: 산포도
____관계 관찰: 이원교차표
__요약
3장. 게으른 학습: 최근접 이웃 분류
__최근접 이웃 분류의 이해
____k-NN 알고리즘
______거리로 유사도 측정
______적절한 k 선택
______k-NN 사용을 위한 데이터 준비
____k-NN 알고리즘이 게으른 이유
__예제: k-NN 알고리즘으로 유방암 진단
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
______변환: 수치 데이터 정규화
______데이터 준비: 훈련 및 테스트 데이터셋 생성
____2단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______변환: z-점수 표준화
______k대체 값 테스트
__요약
4장. 확률적 학습: 나이브 베이즈 분류
__나이브 베이즈 이해
____베이즈 방법의 기본 개념
______확률의 이해
______결합 확률의 이해
______베이즈 정리를 이용한 조건부 확률 계산
____나이브 베이즈 알고리즘
______나이브 베이즈를 이용한 분류
______라플라스 추정량
______나이브 베이즈에서 수치 특성 이용
__예제: 나이브 베이즈 알고리즘을 이용한 휴대폰 스팸 필터링
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______데이터 준비: 텍스트 데이터 정리 및 표준화
______데이터 준비: 텍스트 문서를 단어로 나누기
______데이터 준비: 훈련 및 테스트 데이터셋 생성
______텍스트 데이터 가시화: 단어 구름
______데이터 준비: 자주 사용하는 단어의 지시자 특성 생성
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약
5장. 분할 정복: 의사결정 트리와 규칙 기반의 분류
__의사결정 트리의 이해
____분할 정복
____C5.0 의사결정 트리 알고리즘
______최고의 분할 선택
______의사결정 트리 가지치기
__예제: C5.0 의사결정 트리를 이용한 위험 은행 대출 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
______데이터 준비: 랜덤한 훈련 및 테스트 데이터셋 생성
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______의사결정 트리의 정확도 향상
______다른 것보다 더 비싼 실수
__분류 규칙 이해
____분리 정복
____1R 알고리즘
____리퍼 알고리즘
____의사결정 트리에서 규칙 구성
____무엇이 트리와 규칙을 탐욕스럽게 만드는가?
__예제: 규칙 학습자를 이용한 독버섯 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약
6장. 수치 데이터 예측: 회귀 방법
__회귀의 이해
____단순 선형 회귀
____보통 최소 제곱 추정
____상관관계
____다중 선형 회귀
__예제: 선형 회귀를 통한 의료비 예측
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______특징 간 관계 탐색: 상관 행렬
______특징 간 관계 시각화: 산포도 행렬
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______모델 명시:비선형 관계 추가
______변환:수치 변수를 이진 지시 변수로 전환
______모델 명시: 상호작용 영향 추가
______모두 합치기: 개선된 회귀 모델
__회귀 트리와 모델 트리의 이해
____트리에 회귀 추가
__예제: 회귀 트리와 모델 트리로 와인 품질 평가
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터에 대한 모델 훈련
______의사결정 트리 시각화
____4단계: 모델 성능 평가
______평균 절대 오차로 성능 측정
____5단계: 모델 성능 개선
__요약
7장. 블랙박스 방법: 신경망과 서포트 벡터 머신
__신경망의 이해
____생물학적 뉴런에서 인공 뉴런으로
____활성 함수
____네트워크 토폴로지
______계층 개수
______정보 이동 방향
______계층별 노드 개수
____역전파로 신경망 훈련
__예제: ANN으로 콘크리트 강도 모델링
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__서포트 벡터 머신의 이해
____초평면을 이용한 분류
______선형적으로 분리 가능한 데이터의 경우
______비선형적으로 분리 가능한 데이터의 경우
____비선형 공간을 위한 커널의 사용
__예제: SVM으로 OCR 수행
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 향상
__요약
8장. 패턴 찾기: 연관 규칙을 이용한 장바구니 분석
__연관 규칙의 이해
____연관 규칙 학습을 위한 아프리오리 알고리즘
____규칙 흥미 측정:지지도와 신뢰도
____아프리오리 원칙을 이용한 규칙 집합의 구축
__예제: 연관 규칙으로 자주 구매되는 식료품 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______데이터 준비:거래 데이터를 위한 희소 행렬 생성
______아이템 지지도 시각화:아이템 빈도 그래프
______거래 데이터 시각화:희소 행렬 도표화
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______연관 규칙 집합 정렬
______연관 규칙의 부분집합 구하기
______연관 규칙을 파일이나 데이터 프레임에 저장
__요약