책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161750910
· 쪽수 : 448쪽
· 출판일 : 2017-12-08
책 소개
목차
1장. 첫 단계
__데이터 과학과 파이썬 소개
__파이썬 설치
____파이썬 2 아니면 파이썬 3?
____차례로 설치하기
____패키지 설치
____패키지 업그레이드
____과학 배포판
________아나콘다
________콘다를 활용해 패키지 설치하기
________엔서트캐노피
________파이썬XY
________윈파이썬
____가상 환경이란?
________콘다로 환경 관리하기
____핵심 패키지 맛보기
________넘파이
________싸이파이
________판다스
________싸이킷런
________주피터
________매트플롯립
________Statsmodels
________Beautiful Soup
________NetworkX
________NLTK
________젠심
________PyPy
________XGBoost
________티아노
________케라스
__주피터 소개
____빠른 설치 및 첫 테스트
____주피터 마법 명령
____주피터는 어떻게 데이터 과학자를 돕는가?
____주피터의 대안
__책에서 쓰는 데이터 세트 및 코드
____싸이킷런 토이데이터 세트
________MLdata.org 공공 저장소
________LIBSVM 데이터 표본
________CVS나 텍스트 파일에서 직접 데이터 불러오기
________싸이킷런 샘플 생성기
__요약
2장. 데이터 개조
__데이터 과학의 과정
__데이터 불러오기와 판다스로 전처리하기
____빠르고 쉬운 데이터 불러오기
____문제가 있는 데이터 다루기
____큰 데이터 다루기
____다른 데이터 형식 접근하기
____데이터 전처리
____데이터 선택
__범주형 및 텍스트 데이터 작업
____특별한 데이터 타입 - 텍스트
____뷰티풀수프로 웹 스크래핑하기
__넘파이 데이터 처리
____넘파이의 n차원 배열
____넘파이 ndarray 객체 기초
__넘파이 배열 만들기
____리스트에서 1차원 배열로
____메모리 크기 제어
____이종적인 리스트
____리스트에서 다차원 배열로
____배열 크기 재설정
____넘파이 함수로부터 만들어진 배열
____파일에서 직접 배열 얻기
____판다스로부터 데이터 추출
__넘파이의 빠른 동작과 연산
____행렬 연산
____넘파이 배열 자르기와 색인하기
____넘파이 배열 채우기
__요약
3장. 데이터 파이프라인
__EDA 소개
__새로운 특성 만들기
__차원 축소
____공분산 행렬
____주성분 분석
____빅데이터를 위한 PCA - 확률적 PCA
____잠재요인분석(LFA)
____선형판별분석(LDA)
____잠재의미분석(LSA)
____독립요소분석(ICA)
____커널PCA
____T-SNE
____제한된 볼츠만 머신(RBM)
__특이값 감지 및 처치
__일변량 특이값 탐색
____EllipticEnvelope
____단일 클래스 SVM
__검증 지표
____멀티 라벨 분류
____이진분류
____회귀
__테스트와 검증
__교차 검증
____교차 검증 반복기 사용
____표본 추출과 부트 스트래핑
__초매개변수 최적화
____사용자정의 채점 함수 구축
____격자 검색 실행시간 단축
__특성 선택
____특성 분산 기반 선택
____일변량 선택
____재귀적 제거
____안정성과 L1 기반 선택
__모든 것을 파이프라인으로 감싸기
____특성을 함께 결합하고 변환을 연결하기
____사용자정의 변환 함수 만들기
__정리
4장. 머신 러닝
__도구와 데이터 세트 준비
__선형 및 로지스틱 회귀
__단순베이즈
__K유사 이웃
__비선형 알고리즘
____분류를 위한 SVM
____회귀를 위한 SVM
____SVM 튜닝
__앙상블 전략
____무작위 표본으로 붙이기
____느슨한 분류기로 담기
____무작위 하위 공간과 무작위 덧대기
____랜덤 포레스트와 엑스트라 트리
____앙상블로부터 확률 추정
____연속적인 모형 - AdaBoost
____기울기 나무 강화
____XGBoost
__빅데이터 다루기
____빅터이터 세트 예제 만들기
____용량 확장성
____속도 올리기
____다양성 다루기
____확률적 기울기 하강에 대한 개요
__딥러닝 만나기
__자연어 처리 엿보기(NLP)
단어 토큰화
스테밍
단어 태깅
개체명 인식
불용어
완전한 데이터 과학 예제 - 텍스트 분류
__비지도학습 개요
__요약
5장. 소셜 네트워크 분석
__그래프 이론 소개
__그래프 알고리즘
__그래프 읽기, 덤프하기, 추출하기
__요약
6장. 시각화, 통찰, 결과
__매트플롯립 기초 소개
____곡선 그리기
____패널 사용
____데이터의 관계를 위한 산포도
____히스토그램
____막대그래프
____이미지 시각화
____판다스로 하는 그래픽적 선택 예제
________박스플롯과 히스토그램
____산포도
____평행 좌표
__매트플롯립 명령 래핑하기
____시본 소개
____EDA 능력 강화
__보케로 양방향적 시각화하기
__더 나은 데이터학습 표현
____학습 곡선
____검증 곡선
____랜덤 포레스트를 위한 특성의 중요성
____GBT 부분 의존성 도표
____ML-ASS를 위한 예측 서버 만들기
__요약
부록. 파이썬 기초 강화하기
__학습 리스트
____리스트
____딕셔너리
____함수 정의
____클래스, 객체, OOP
____예외
____이터레이터와 제너레이터
____조건문
____리스트와 딕셔너리 내포
__보고, 읽고, 해보며 배우기
____무크
____파이콘과 파이데이터
____양방향적 주피터
____부끄러워 마라, 진정으로 도전하라