데이터 마이닝 Data Mining 책 가격비교

책 이미지

책 정보

· 제목 : 데이터 마이닝 Data Mining (데이터 속 숨은 의미를 찾는 기계 학습의 이론과 응용)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788960774476
· 쪽수 : 820쪽

책 소개

기계 학습에 관한 완벽한 설명과 기계 학습 도구를 실질적인 데이터 마이닝 사례에 적용할 수 있는 노하우를 배울 수 있는 책이다. 기계 학습에 관한 매우 광범위한 내용들을 난이도와 개념별로 명확하게 구분하여 설명하고 있다.

I부 데이터 마이닝의 소개

1장 데이터 마이닝의 개요
___1.1 데이터 마이닝과 기계 학습
______구조적 패턴 서술
______기계 학습
______데이터 마이닝
___1.2 간단한 예제: 기상 예제와 기타 예제
______기상 문제
______콘택트렌즈: 이상적인 문제
______붓꽃: 고전적인 수치 데이터 집합
______CPU 성능: 수치적 예측 방법에 대한 소개
______노조 협상: 더욱 현실적인 예제
______콩 분류: 성공적인 기계 학습의 전형을 보여주는 예제
___1.3 실무 적용
______웹 마이닝
______판단을 수반하는 결정
______이미지 스크리닝
______전력 부하 예측
______진단
______마케팅과 판매 영업
______기타 적용 사례
___1.4 기계 학습과 통계학
___1.5 검색 일반화
___1.6 데이터 마이닝과 윤리
______재식별 작업
______개인 정보의 이용
______더 광범위한 문제점
___1.7 참고 문헌

2장 입력 데이터: 개념, 인스턴스 속성
___2.1 개념이란?
___2.2 예제란?
______다른 종류의 예제 타입
___2.3 속성이란?
___2.4 입력 데이터 준비
______데이터 수집
______ARFF 포맷
______희소 데이터
______속성 타입
______누락된 속성 값
______부정확한 속성 값
______자신의 데이터를 알라
___2.5 참고 문헌

3장 출력 데이터: 지식 표현
___3.1 테이블
___3.2 선형 모델
___3.3 트리
___3.4 규칙
______분류 규칙
______연관 규칙
______예외를 갖는 규칙
______더욱 자세하게 표현되는 규칙
___3.5 인스턴스 기반의 표현
___3.6 클러스터
___3.7 참고 문헌

4장 알고리즘: 기본 마이닝 알고리즘
___4.1 기본 규칙 추론
______누락된 속성 값과 수치 속성
______논의 사항
___4.2 통계 모델링
______누락된 속성 값과 수치 속성
______단순 베이지안 이론을 통한 문서 분류
______논의 사항
___4.3 분할 정복 기법: 의사 결정 트리 구축
______정보 계산
______다양하게 전개되는 속성
______논의 사항
___4.4 알고리즘: 규칙 구성
______규칙과 트리
______단순 포괄 알고리즘
______규칙과 의사 결정 리스트
___4.5 연관 규칙 마이닝
______아이템 집합
______연관 규칙
______효율적인 규칙 생성
______논의 사항
___4.6 선형 모델
______수치 예측: 선형 회귀
______선형 분류: 로지스틱 회귀
______퍼셉트론을 사용한 선형 분류
______필터링을 통한 선형 분류
___4.7 인스턴스 기반 학습
______거리 함수
______효율적인 최근접 이웃 검색
______논의 사항
___4.8 군집화
______반복적인 거리 기반 군집화 알고리즘
______더욱 빠른 거리 계산
______논의 사항
___4.9 다중 인스턴스 학습
______입력 값 축적
______출력 데이터 축적
______논의 사항
___4.10 참고 문헌
___4.11 웨카를 이용한 구현

5장 신뢰성: 학습 내용 평가
___5.1 훈련과 검증
___5.2 예측 성능
___5.3 교차 검증
___5.4 다른 추정자
______단일 잔류 교차 검증
______부트스트랩
___5.5 데이터 마이닝 스킴 비교
___5.6 확률 예측
______이차 손실 함수
______정보 손실 함수
______논의 사항
___5.7 비용 고려
______비용에 민감한 분류 알고리즘
______비용에 민감한 학습 알고리즘
______향상도 차트
______ROC 곡선
______재현-정확도 곡선
______논의 사항
______비용 곡선
___5.8 수치 예측 결과 평가
___5.9 최소 묘사 길이 원칙
___5.10 군집화 작업에 MDL 원칙 적용
___5.11 참고 문헌

II부 고급 데이터 마이닝 알고리즘

6장 구현: 실질적인 기계 학습 스킴
___6.1 의사 결정 트리
______수치 속성
______누락된 속성 값
______가지치기
______오차율 추정
______의사 결정 트리 유도의 복잡성
______트리부터 규칙까지
______C4.5: 선택과 옵션
______비용-복잡도 가지치기
______논의 사항
___6.2 분류 규칙
______검증 선택 기준
______누락된 속성 값과 수치 타입의 속성 값
______좋은 규칙 생성
______전반적인 최적화 기법 사용
______부분 의사 결정 트리로부터 규칙을 얻는 방법
______예외를 갖는 규칙
______논의 사항
___6.3 연관 규칙
______FP-트리 구축
______큰 아이템 집합 검색
______논의 사항
___6.4 확장된 선형 모델
______최대 마진 초월 평면
______비선형 클래스 경계
______Support Vector 회귀
______커널 능형 회귀
______커널 퍼셉트론
______다중 퍼셉트론
______역전파 알고리즘
______방사 기저 함수 네트워크
______확률적 기울기 하강
______논의 사항
___6.5 인스턴스 기반 학습
______모범 예제의 수 줄이기
______잡음 있는 모범 예제 가지치기
______속성에 가중치 부여
______모범 예제의 일반화
______일반화된 모범 예제들의 거리 함수
______일반 거리 함수
______논의 사항
___6.6 지역적 선형 모델을 통한 수치 예측
______모델 트리
______트리 구축
______트리 가지치기
______명목 속성
______누락된 속성 값
______모델 트리를 유도하는 의사코드
______모델 트리로부터 유도된 규칙
______국부 가중 선형 회귀 기법
______논의 사항
___6.7 베이지언 네트워크
______예측 유도
______베이지안 네트워크 학습
______특화된 알고리즘
______빠른 학습을 위한 데이터 구조
______논의 사항
___6.8 군집화
______군집 수 선택
______계층적 군집화
______계층적 군집의 예제
______점진적 군집화
______확률 기반 군집화
______EM 알고리즘
______확장된 혼합 모델
______베이지안 군집화
______논의 사항
___6.9 반 감독 학습
______분류를 위한 군집화
______합동 훈련
______EM과 합동 훈련 알고리즘
______논의 사항
___6.10 다중 인스턴스 학습
______단일 인스턴스 학습 변환
______학습 알고리즘 개선
______정교한 다중 인스턴스 기법
______논의 사항
___6.11 웨카 구현

7장 데이터 변환
___7.1 속성 선택
______스킴과 독립적인 선택
______속성 공간 검색
______스킴에 특화된 선택
___7.2 수치 속성 이산화
______감독되지 않은 이산화 기법
______엔트로피 기반 이산화 기법
______기타 이산화 기법
______엔트로피 기반 이산화 기법과 오류 기반 이산화 기법의 비교
______이산화 속성을 수치 속성으로 변환
___7.3 투영화
______주성분 분석(PCA) 알고리즘
______랜덤 투영 알고리즘
______편 최소 제곱 회귀 알고리즘
______텍스트를 속성 벡터로 변환
______시계열
___7.4 표본 추출
______저장식 표본 추출
___7.5 정화 알고리즘
______의사 결정 트리 구조 개선
______견고한 회귀법
______비정상 검출
______단일 클래스 학습
___7.6 다중 클래스를 이진 클래스로 변환
______간단한 알고리즘
______오류 정정 출력 코드
______중첩 이분법 앙상블 알고리즘
___7.7 클래스 확률 교정
___7.8 참고 문헌
___7.9 웨카 구현

8장 앙상블 학습 알로리즘
___8.1 다중 모델 조합
___8.2 배깅
______바이어스-분산 분해
______비용과 연관된 배깅
___8.3 무작위 추출
______무작위 추출과 배깅
______로테이션 포레스트 앙상블 학습 기법
___8.4 부스팅 알고리즘
______아다부스트
______부스팅의 검증력
___8.5 가산 회귀 분석
______수치 예측
______가산 로지스틱 회귀 분석
___8.6 해석 가능한 앙상블
______옵션 트리
______로지스틱 모델 트리
___8.7 스태킹
___8.8 참고 문헌
___8.9 웨카 구현

9장 계속되는 발전: 현재와 미래 적용 범위
___9.1 데이터 마이닝의 적용
___9.2 대용량 데이터 집합을 기반으로 한 학습 알고리즘
___9.3 데이터 스트림 학습
___9.4 전문 분야 지식의 통합
___9.5 텍스트 마이닝
___9.6 웹 마이닝
___9.7 적대적인 상황
___9.8 유비쿼터스 데이터 마이닝
___9.9 참고 문헌

III부 웨카 데이터 마이닝 워크벤치

10장 웨카 입문
___10.1 웨카에 내장된 기능
___10.2 웨카의 사용법
___10.3 웨카의 기타 용도
___10.4 웨카의 다운로드

11장 익스플로러 인터페이스
___11.1 웨카의 시작
______데이터 준비
______익스플로러로 데이터 로딩
______의사 결정 트리 구성
______출력 결과 검토
______다시 해보기
______모델을 통한 작업
______오류가 난 경우
___11.2 익스플로러 탐험
______파일 로딩과 필터링
______학습 스킴 훈련과 검증
______직접 만들어보기: 사용자 분류기
______메타 학습기 사용
______군집화와 연관 규칙
______속성 선택
______시각화
___11.3 필터링 알고리즘
______비감독 속성 필터
______비감독 인스턴스 필터
______감독 필터
___11.4 학습 알고리즘
______베이지언 분류기
______트리
______규칙
______함수
______신경망 네트워크
______Lazy 분류기
______다중 인스턴스 분류기
______기타 분류기
___11.5 메타 학습 알고리즘
______배깅과 랜덤화
______부스팅
______분류기 조합
______비용 민감 학습
______최적화 성능
______다양한 작업을 처리하기 위한 분류기 목표 재설정
___11.6 군집 알고리즘
___11.7 연관 규칙 학습기
___11.8 속성 선택
______속성 종속 집합 평가기
______단일 속성 평가기
______검색 기법

12장 지식 플로우 인터페이스
___12.1 시작하기
___12.2 컴포넌트
___12.3 컴포넌트 설정과 연동
___12.4 점증적 학습

13장 Experimenter
___13.1 시작하기
______실험 수행
______결과 분석
___13.2 간단 모드 설정
___13.3 고급 모드 설정
___13.4 Analyze 패널
___13.5 다중 머신을 대상으로 하는 분산 처리 기능

14장 커맨드라인 인터페이스
___14.1 시작하기
___14.2 웨카의 구조
______클래스, 인스턴스, 패키지
______weka.core 패키지
______waka.classifiers 패키지
______기타 패키지
______Javadoc 인덱스
___14.3 커맨드라인 옵션
______일반 옵션
______특수 옵션

15장 내장된 기계 학습 기능
___15.1 단순 데이터 마이닝 응용 사례
______MessaeClassifer()
______updateData()
______classifyMessage()

16장 새로운 학습 스킴 개발
___16.1 예제 분류기
______buildClassfier()
______makeTree()
______computeInfoGain()
______classifyInstance()
______toSource()
______main()
___16.2 분류기를 구현할 때 지켜야 할 규약
______메모리 허용 용량

17장 웨카 익스플로러를 위한 튜토리얼 예제
___17.1 익스플로러 인터페이스 시작
______데이터 로딩
______데이터 집합 편집기
______필터 적용
______Visualize 패널
______Classify 패널
______출력 결과 분석
______검증 기법 설정
______분류 오차 시각화
___17.2 최근접 이웃 학습과 의사 결정 트리
______유리 데이터 집합
______속성 선택
______클래스 잡음과 최근접 이웃 학습
______훈련 데이터의 양 조절
______반복적 결정 트리 구성
___17.3 분류 경계
______1R 시각화
______최근접 이웃 학습 시각화
______단순 베이지언 분류 시각화
______결정 트리와 규칙 집합 시각화
______데이터 섞기
___17.4 전처리와 매개변수 튜닝
______이산화
______이산화에 대한 추가 사항
______자동 속성 선택
______자동 속성 선택에 관한 추가 사항
______자동 매개변수 튜닝
___17.5 문서 분류
______문자열 속성을 갖는 데이터
______실제 문서의 분류
______StringToWordVector 필터 연구
___17.6 연관 규칙의 마이닝
______연관 규칙 마이닝
______실제 데이터 마이닝
______장바구니 분석

참고 문헌

저자소개

이안 위튼 (지은이) 정보 더보기

뉴질랜드 와이카토 대학교(University of Waikato)의 컴퓨터과학과 교수이며 뉴질랜드의 디지털 도서관 연구 프로젝트를 지휘했다. 관심사는 정보 검색, 머신러닝, 텍스트 압축, 데모 주도 프로그래밍이다. 영국 캠브리지 대학교(Cambridge University)에서 수학으로 석사학위를 받았으며 캐나다 캘거리 대학교(University of Calgary)에서 컴퓨터 과학 석사, 잉글랜드의 에섹스 대학교(Essex University)에서 전기공학 박사학위를 받았다. 지금은 ACM과 뉴질랜드 왕립학회의 회원으로 활동 중이다. 디지털 도서관, 머신러닝, 텍스트 압축, 음성 합성 및 신호 처리, 컴퓨터 타이포그래피 등 다방면에 논문을 발행했다. 가장 최근의 책은 『Managing Gigabytes(기가바이트 단위의 관리)』(1999) 및 『Data Mining(데이터 마이닝)』(2000)이다.

펼치기

이안 위튼의 다른 책 >

마크 홀 (지은이) 정보 더보기

와이카토 대학교에서 컴퓨팅 및 수리과학으로 학위를 받았고 컴퓨터 과학으로 박사 학위를 취득했다. 와이카토 대학교에서 학생 및 강사를 거쳐 현재는 오픈소스 비즈니스 인텔리전스 소프트웨어 회사인 펜타호(Pentaho)의 소프트웨어 개발자 및 데이터 마이닝 컨설턴트로 일하고 있다. 이 책에서 설명된 WEKA 소프트웨어의 핵심 기여자다. 머신러닝 및 데이터 마이닝에 관한 많은 기사를 발표했으며 이 분야의 컨퍼런스, 저널의 심사위원이기도 하다.

펼치기

마크 홀의 다른 책 >

아이베 프랭크 (지은이) 정보 더보기

뉴질랜드에서 사모아인 배우자와 두 명의 사랑스런 소년들과 같이 살고 있지만 원래 독일 출신으로 칼스루에 대학교(University of Karlsruhe)에서 컴퓨터과학으로 첫 학위를 받았다. 그 후 이안 위튼의 지도하에 박사 학위를 취득하려고 뉴질랜드로 이주했으며 와이카토 대학교의 컴퓨터과학 강사로 일하면서 학업을 마쳤다. 현재는 와이카토 대학교의 부교수로 재직 중이다. 자바 프로그래밍의 얼리어답터로서 이 책에 설명된 WEKA 소프트웨어의 토대를 마련했다. 머신러닝 및 데이터 마이닝의 논문 및 출판에 많은 기여를 했으며 이 분야에 많은 컨퍼런스와 저널로부터 추천됐다.

펼치기

아이베 프랭크의 다른 책 >

이승현 (옮긴이) 정보 더보기

한국 항공대학교 기계공학부를 졸업하고, 삼성 소프트웨어 멤버십과 산업통상자원부 소프트웨어 마에스트로를 수료했다. MDS 테크놀로지에서 자동차의 ISO26262 국제 안전 표준과 AUTOSAR 관련 기술 지원을 담당했으며, 현재 시어스랩에서 모바일 환경에서의 DCNN 구동을 위한 압축 알고리즘 연구에 매진하고 있다. 한양대학교 컴퓨터공학과에서 석사 과정을 밟고 있으며, 딥러닝 기반 실시간 영상처리 기술을 다양한 도메인의 소프트웨어에 적용하는 연구를 하고 있다. 양질의 원서를 하루라도 빨리 우리글로 옮겨 국내 개발자들에게 도움을 주고자 번역계에 발을 들였다. 에이콘출판사에서 펴낸 『윈도우폰 7 게임 프로그래밍』(2012), 『안드로이드 앱 인벤터』(2013), 『데이터 마이닝 Data Mining』(2013), 『C++와 CUDA C로 구현하는 딥러닝 알고리즘 Vol.1』(에이콘, 2016), 『C++와 CUDA C로 구현하는 딥러닝 알고리즘 Vol.3』(에이콘, 2016)를 번역했다.

펼치기

이승현의 다른 책 >