책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9788960775367
· 쪽수 : 324쪽
· 출판일 : 2014-03-31
책 소개
목차
1장. 기계 학습 파이썬으로 시작하기
___기계 학습과 파이썬: 꿈의 조합
___이 책이 알려주는 내용(과 알려주지 않는 내용)
___정체됐을 때 해야 할 작업
___시작
______NumPy, SciPy, Matplotlib 소개
______파이썬 설치
______NumPy와 효과적으로, SciPy와 지능적으로 적용하기 쉬운 데이터 만들기
______NumPy 배우기
_________인덱싱
_________존재하지 않는 값 처리
_________실행 시간 비교
_________SciPy 배우기
___첫 번째 기계 학습 애플리케이션
______데이터 읽기
______데이터 정리와 전처리
______적절한 모델과 학습 알고리즘 선택
_________모델을 만들기에 앞서
_________단순한 직선으로 시작하기
_________좀 더 복잡한 모델
_________일보후퇴, 이보전진: 데이터 다시 보기
_________훈련과 테스트
_________최초 질문에 대답하기
___정리
2장. 실제 예제를 이용한 분류법 학습
___아이리스 데이터셋
______첫 번째 단계, 시각화
______첫 번째 분류 모델 만들기
_________평가: 홀드아웃 데이터와 교차 검증
___좀 더 복잡한 분류기 만들기
___좀 더 복잡한 데이터셋과 분류기
______씨앗 데이터셋의 학습
______속성과 속성 엔지니어링
______최근접 이웃 분류
______이진 분류와 다중 범주 분류
___정리
3장. 군집화: 관련된 게시물 찾기
___게시물의 관련도 측정
______어떻게 하지 말아야 하는가
______어떻게 해야 하는가
___전처리: 공통 단어의 유사한 개수로서 측정된 유사도
______원시 텍스트를 단어 주머니로 변환
______단어 세기
______단어 카운트 벡터 정규화
______덜 중요한 단어의 삭제
______어근 추출
_________NLTK 설치와 사용
_________NLTK와 벡터라이저 확장
______강화된 불용어
______우리의 성취와 목표
___군집화
______K평균
______우리의 발상을 평가하기 위한 테스트 데이터 얻기
______게시물 군집화
___초기 도전과제 해결
______노이즈의 또 다른 시각
___매개변수 변경
___정리
4장. 주제 모델링
___잠재 디리클레 할당(LDA)
______주제 모델 만들기
___주제 공간에서의 유사성 비교
______위키피디아 전체의 모델링
___주제의 개수 고르기
___정리
5장. 분류 I: 형편없는 답변 감지
___큰 그림 그리기
___세련된 답변 구별법 학습
______인스턴스 개선
______분류기 개선
___데이터 가져오기
______데이터를 의미 있는 뭉치로 잘라내기
______속성의 사전 선택과 처리
______무엇이 좋은 답변인지 정의하기
___첫 번째 분류기 만들기
______k-최근접 이웃(kNN, k-nearest neighbor) 알고리즘으로 시작하기
______속성 개선
______분류기 훈련
______분류기의 성능 측정
______더 많은 속성 디자인하기
___개선법 결정
______편향과 변화량의 균형
______고편향 고치기
______고변화량 고치기
______고편향 또는 저편향
___로지스틱 회귀
______간단한 예제와 약간의 수학
______로지스틱 회귀를 게시물 분류에 적용하기
___정확도 좀 더 보기: 정밀도와 재현율
___분류기 살 빼기
___배포
___정리
6장. 분류 II: 감성 분석
___큰 그림 그리기
___트위터 데이터 가져오기
___나이브 베이즈 분류기 소개
______베이즈 정리
______순박한 것
______나이브 베이즈를 사용한 분류
______못 보던 단어에 대한 해명과 기타 특이점
______산술 언더플로(underflow) 설명하기
___첫 번째 분류기 만들고 조절하기
______쉬운 문제 먼저 해결하기
___모든 범주 사용
______분류기의 매개변수 조절
___트윗 정리
___단어의 종류 고려
______단어의 종류 판단
______SentiWordNet을 이용한 성공적인 편법
______첫 번째 에스터메이터
______모두 합하기
___정리
7장. 회귀: 추천
___회귀를 이용한 주택 가격 예상
______다차원 회귀
______회귀를 위한 교차 검증
___벌점화 회귀
______L1과 L2 벌칙
______Scikit-learn에서 라소 또는 일래스틱 넷 사용
___P가 N보다 큰 시나리오
______텍스트 기반의 예제
______영리한 방법으로 하이퍼 매개변수 설정하기
______예측과 추천의 평점
___정리
8장. 회귀: 향상된 추천
___추천 향상
______추천 이진 매트릭스 사용
______영화의 이웃 보기
______여러 기법의 결합
___장바구니 분석
______유용한 예측 얻기
______슈퍼마켓 쇼핑 장바구니 분석
______연관 룰 마이닝
______좀 더 발전된 장바구니 분석
___정리
9장. 분류III: 음악 장르 분류
___큰 그림 그리기
___음악 데이터 가져오기
______WAV 형태로 변환
___음악 살펴보기
______음악을 사인 곡선 요소로 분해하기
___FFT를 사용해 첫 번째 분류기 만들기
______실험 기민성 증가
______분류기 훈련
______다중 범주 문제의 정확도 측정을 위한 혼돈 매트릭스
______수용자 반응 특성을 이용한 분류기 성능 측정 대안
___멜 주파수 켑스트럴 계수와 분류 성능 향상
___정리
10장. 컴퓨터 비전: 패턴 인식
___이미지 처리 소개
___이미지 로딩과 출력
______기본 이미지 처리
_________경계 짓기
_________가우시안 블러링(Gaussian blurring)
_________다른 효과를 위한 필터링
______소금과 후추 노이즈 추가
_________중앙에 초점 맞추기
______패턴 인식
______이미지로부터 속성 계산
______속성 작성
___좀 더 어려운 데이터셋의 분류
___지역 속성 표현
___정리
11장. 차원 수 줄이기
___큰 그림 그리기
___속성 선택
______필터를 사용해 중복된 속성 탐지하기
_________상관 관계
_________상호 정보
______래퍼를 사용해 속성에 대한 모델 묻기
___그 밖의 속성 선택 기법
___속성 추출
______주요 구성요소 분석
_________PCA 훑어보기
_________PCA 적용하기
______PCA의 한계와 LDA의 도움
___다차원 축적(MDS)
___정리
12장. (조금 더 큰) 빅데이터
___빅데이터 배우기
___파이프라인을 작업으로 나누기 위한 jug 사용
______작업에 대해
______부분 결과 재사용
______작업장 내부 보기
______데이터 분석을 위한 jug 사용
___아마존 웹 서비스(AWS) 사용
______첫 번째 기계 만들기
_________아마존 리눅스에 파이썬 패키지 설치
_________클라우드 머신에서 jug 실행
______startcluster로 클러스터 생성 자동화
___정리
13장. 기계 학습을 더 배울 수 있는 자료
___온라인 코스
___책
______Q&A 사이트
______블로그
______데이터 소스
______경쟁하기
___남겨진 것
___정리