책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788960774476
· 쪽수 : 820쪽
책 소개
목차
I부 데이터 마이닝의 소개
1장 데이터 마이닝의 개요
___1.1 데이터 마이닝과 기계 학습
______구조적 패턴 서술
______기계 학습
______데이터 마이닝
___1.2 간단한 예제: 기상 예제와 기타 예제
______기상 문제
______콘택트렌즈: 이상적인 문제
______붓꽃: 고전적인 수치 데이터 집합
______CPU 성능: 수치적 예측 방법에 대한 소개
______노조 협상: 더욱 현실적인 예제
______콩 분류: 성공적인 기계 학습의 전형을 보여주는 예제
___1.3 실무 적용
______웹 마이닝
______판단을 수반하는 결정
______이미지 스크리닝
______전력 부하 예측
______진단
______마케팅과 판매 영업
______기타 적용 사례
___1.4 기계 학습과 통계학
___1.5 검색 일반화
___1.6 데이터 마이닝과 윤리
______재식별 작업
______개인 정보의 이용
______더 광범위한 문제점
___1.7 참고 문헌
2장 입력 데이터: 개념, 인스턴스 속성
___2.1 개념이란?
___2.2 예제란?
______다른 종류의 예제 타입
___2.3 속성이란?
___2.4 입력 데이터 준비
______데이터 수집
______ARFF 포맷
______희소 데이터
______속성 타입
______누락된 속성 값
______부정확한 속성 값
______자신의 데이터를 알라
___2.5 참고 문헌
3장 출력 데이터: 지식 표현
___3.1 테이블
___3.2 선형 모델
___3.3 트리
___3.4 규칙
______분류 규칙
______연관 규칙
______예외를 갖는 규칙
______더욱 자세하게 표현되는 규칙
___3.5 인스턴스 기반의 표현
___3.6 클러스터
___3.7 참고 문헌
4장 알고리즘: 기본 마이닝 알고리즘
___4.1 기본 규칙 추론
______누락된 속성 값과 수치 속성
______논의 사항
___4.2 통계 모델링
______누락된 속성 값과 수치 속성
______단순 베이지안 이론을 통한 문서 분류
______논의 사항
___4.3 분할 정복 기법: 의사 결정 트리 구축
______정보 계산
______다양하게 전개되는 속성
______논의 사항
___4.4 알고리즘: 규칙 구성
______규칙과 트리
______단순 포괄 알고리즘
______규칙과 의사 결정 리스트
___4.5 연관 규칙 마이닝
______아이템 집합
______연관 규칙
______효율적인 규칙 생성
______논의 사항
___4.6 선형 모델
______수치 예측: 선형 회귀
______선형 분류: 로지스틱 회귀
______퍼셉트론을 사용한 선형 분류
______필터링을 통한 선형 분류
___4.7 인스턴스 기반 학습
______거리 함수
______효율적인 최근접 이웃 검색
______논의 사항
___4.8 군집화
______반복적인 거리 기반 군집화 알고리즘
______더욱 빠른 거리 계산
______논의 사항
___4.9 다중 인스턴스 학습
______입력 값 축적
______출력 데이터 축적
______논의 사항
___4.10 참고 문헌
___4.11 웨카를 이용한 구현
5장 신뢰성: 학습 내용 평가
___5.1 훈련과 검증
___5.2 예측 성능
___5.3 교차 검증
___5.4 다른 추정자
______단일 잔류 교차 검증
______부트스트랩
___5.5 데이터 마이닝 스킴 비교
___5.6 확률 예측
______이차 손실 함수
______정보 손실 함수
______논의 사항
___5.7 비용 고려
______비용에 민감한 분류 알고리즘
______비용에 민감한 학습 알고리즘
______향상도 차트
______ROC 곡선
______재현-정확도 곡선
______논의 사항
______비용 곡선
___5.8 수치 예측 결과 평가
___5.9 최소 묘사 길이 원칙
___5.10 군집화 작업에 MDL 원칙 적용
___5.11 참고 문헌
II부 고급 데이터 마이닝 알고리즘
6장 구현: 실질적인 기계 학습 스킴
___6.1 의사 결정 트리
______수치 속성
______누락된 속성 값
______가지치기
______오차율 추정
______의사 결정 트리 유도의 복잡성
______트리부터 규칙까지
______C4.5: 선택과 옵션
______비용-복잡도 가지치기
______논의 사항
___6.2 분류 규칙
______검증 선택 기준
______누락된 속성 값과 수치 타입의 속성 값
______좋은 규칙 생성
______전반적인 최적화 기법 사용
______부분 의사 결정 트리로부터 규칙을 얻는 방법
______예외를 갖는 규칙
______논의 사항
___6.3 연관 규칙
______FP-트리 구축
______큰 아이템 집합 검색
______논의 사항
___6.4 확장된 선형 모델
______최대 마진 초월 평면
______비선형 클래스 경계
______Support Vector 회귀
______커널 능형 회귀
______커널 퍼셉트론
______다중 퍼셉트론
______역전파 알고리즘
______방사 기저 함수 네트워크
______확률적 기울기 하강
______논의 사항
___6.5 인스턴스 기반 학습
______모범 예제의 수 줄이기
______잡음 있는 모범 예제 가지치기
______속성에 가중치 부여
______모범 예제의 일반화
______일반화된 모범 예제들의 거리 함수
______일반 거리 함수
______논의 사항
___6.6 지역적 선형 모델을 통한 수치 예측
______모델 트리
______트리 구축
______트리 가지치기
______명목 속성
______누락된 속성 값
______모델 트리를 유도하는 의사코드
______모델 트리로부터 유도된 규칙
______국부 가중 선형 회귀 기법
______논의 사항
___6.7 베이지언 네트워크
______예측 유도
______베이지안 네트워크 학습
______특화된 알고리즘
______빠른 학습을 위한 데이터 구조
______논의 사항
___6.8 군집화
______군집 수 선택
______계층적 군집화
______계층적 군집의 예제
______점진적 군집화
______확률 기반 군집화
______EM 알고리즘
______확장된 혼합 모델
______베이지안 군집화
______논의 사항
___6.9 반 감독 학습
______분류를 위한 군집화
______합동 훈련
______EM과 합동 훈련 알고리즘
______논의 사항
___6.10 다중 인스턴스 학습
______단일 인스턴스 학습 변환
______학습 알고리즘 개선
______정교한 다중 인스턴스 기법
______논의 사항
___6.11 웨카 구현
7장 데이터 변환
___7.1 속성 선택
______스킴과 독립적인 선택
______속성 공간 검색
______스킴에 특화된 선택
___7.2 수치 속성 이산화
______감독되지 않은 이산화 기법
______엔트로피 기반 이산화 기법
______기타 이산화 기법
______엔트로피 기반 이산화 기법과 오류 기반 이산화 기법의 비교
______이산화 속성을 수치 속성으로 변환
___7.3 투영화
______주성분 분석(PCA) 알고리즘
______랜덤 투영 알고리즘
______편 최소 제곱 회귀 알고리즘
______텍스트를 속성 벡터로 변환
______시계열
___7.4 표본 추출
______저장식 표본 추출
___7.5 정화 알고리즘
______의사 결정 트리 구조 개선
______견고한 회귀법
______비정상 검출
______단일 클래스 학습
___7.6 다중 클래스를 이진 클래스로 변환
______간단한 알고리즘
______오류 정정 출력 코드
______중첩 이분법 앙상블 알고리즘
___7.7 클래스 확률 교정
___7.8 참고 문헌
___7.9 웨카 구현
8장 앙상블 학습 알로리즘
___8.1 다중 모델 조합
___8.2 배깅
______바이어스-분산 분해
______비용과 연관된 배깅
___8.3 무작위 추출
______무작위 추출과 배깅
______로테이션 포레스트 앙상블 학습 기법
___8.4 부스팅 알고리즘
______아다부스트
______부스팅의 검증력
___8.5 가산 회귀 분석
______수치 예측
______가산 로지스틱 회귀 분석
___8.6 해석 가능한 앙상블
______옵션 트리
______로지스틱 모델 트리
___8.7 스태킹
___8.8 참고 문헌
___8.9 웨카 구현
9장 계속되는 발전: 현재와 미래 적용 범위
___9.1 데이터 마이닝의 적용
___9.2 대용량 데이터 집합을 기반으로 한 학습 알고리즘
___9.3 데이터 스트림 학습
___9.4 전문 분야 지식의 통합
___9.5 텍스트 마이닝
___9.6 웹 마이닝
___9.7 적대적인 상황
___9.8 유비쿼터스 데이터 마이닝
___9.9 참고 문헌
III부 웨카 데이터 마이닝 워크벤치
10장 웨카 입문
___10.1 웨카에 내장된 기능
___10.2 웨카의 사용법
___10.3 웨카의 기타 용도
___10.4 웨카의 다운로드
11장 익스플로러 인터페이스
___11.1 웨카의 시작
______데이터 준비
______익스플로러로 데이터 로딩
______의사 결정 트리 구성
______출력 결과 검토
______다시 해보기
______모델을 통한 작업
______오류가 난 경우
___11.2 익스플로러 탐험
______파일 로딩과 필터링
______학습 스킴 훈련과 검증
______직접 만들어보기: 사용자 분류기
______메타 학습기 사용
______군집화와 연관 규칙
______속성 선택
______시각화
___11.3 필터링 알고리즘
______비감독 속성 필터
______비감독 인스턴스 필터
______감독 필터
___11.4 학습 알고리즘
______베이지언 분류기
______트리
______규칙
______함수
______신경망 네트워크
______Lazy 분류기
______다중 인스턴스 분류기
______기타 분류기
___11.5 메타 학습 알고리즘
______배깅과 랜덤화
______부스팅
______분류기 조합
______비용 민감 학습
______최적화 성능
______다양한 작업을 처리하기 위한 분류기 목표 재설정
___11.6 군집 알고리즘
___11.7 연관 규칙 학습기
___11.8 속성 선택
______속성 종속 집합 평가기
______단일 속성 평가기
______검색 기법
12장 지식 플로우 인터페이스
___12.1 시작하기
___12.2 컴포넌트
___12.3 컴포넌트 설정과 연동
___12.4 점증적 학습
13장 Experimenter
___13.1 시작하기
______실험 수행
______결과 분석
___13.2 간단 모드 설정
___13.3 고급 모드 설정
___13.4 Analyze 패널
___13.5 다중 머신을 대상으로 하는 분산 처리 기능
14장 커맨드라인 인터페이스
___14.1 시작하기
___14.2 웨카의 구조
______클래스, 인스턴스, 패키지
______weka.core 패키지
______waka.classifiers 패키지
______기타 패키지
______Javadoc 인덱스
___14.3 커맨드라인 옵션
______일반 옵션
______특수 옵션
15장 내장된 기계 학습 기능
___15.1 단순 데이터 마이닝 응용 사례
______MessaeClassifer()
______updateData()
______classifyMessage()
16장 새로운 학습 스킴 개발
___16.1 예제 분류기
______buildClassfier()
______makeTree()
______computeInfoGain()
______classifyInstance()
______toSource()
______main()
___16.2 분류기를 구현할 때 지켜야 할 규약
______메모리 허용 용량
17장 웨카 익스플로러를 위한 튜토리얼 예제
___17.1 익스플로러 인터페이스 시작
______데이터 로딩
______데이터 집합 편집기
______필터 적용
______Visualize 패널
______Classify 패널
______출력 결과 분석
______검증 기법 설정
______분류 오차 시각화
___17.2 최근접 이웃 학습과 의사 결정 트리
______유리 데이터 집합
______속성 선택
______클래스 잡음과 최근접 이웃 학습
______훈련 데이터의 양 조절
______반복적 결정 트리 구성
___17.3 분류 경계
______1R 시각화
______최근접 이웃 학습 시각화
______단순 베이지언 분류 시각화
______결정 트리와 규칙 집합 시각화
______데이터 섞기
___17.4 전처리와 매개변수 튜닝
______이산화
______이산화에 대한 추가 사항
______자동 속성 선택
______자동 속성 선택에 관한 추가 사항
______자동 매개변수 튜닝
___17.5 문서 분류
______문자열 속성을 갖는 데이터
______실제 문서의 분류
______StringToWordVector 필터 연구
___17.6 연관 규칙의 마이닝
______연관 규칙 마이닝
______실제 데이터 마이닝
______장바구니 분석
참고 문헌