책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161754321
· 쪽수 : 788쪽
책 소개
목차
1부. 프레임워크: 데이터에서 전략 설계까지
1장. 트레이딩을 위한 머신러닝
__이 책을 읽는 법
____기대하는 것
____이 책을 읽어야 하는 독자
____이 책의 구성
____성공하기 위해 필요한 것
__투자업계에서 머신러닝의 부상
____전자거래에서 고빈도 매매까지
____팩터 투자와 스마트 베타 펀드
____알고리즘 개척자는 규모에 있어 인간보다 우위에 있다
____머신러닝과 대체 데이터
__거래 전략의 설계와 실행
____데이터의 소싱 및 관리
____알파 팩터 리서치 및 평가
____포트폴리오 최적화와 리스크관리
____전략 백테스팅
__머신러닝과 알고리즘 트레이딩 전략
____거래를 위한 머신러닝의 사용 사례
__요약
2장. 시장 데이터와 기본적 요인 데이터
__시장 데이터 사용 방법
____시장 미시구조
____주문 호가창 데이터의 사용
____틱 데이터의 규제
____시장 데이터에 대한 API접근
____pandas를 이용한 원거리 데이터 접근
____기타 시장 데이터 공급자
__기본적 데이터 작업 방법
____재무제표 데이터
____기타 기본적 데이터 소스
__판다스를 이용한 효율적 데이터 저장
__요약
3장. 금융을 위한 대체 데이터
__대체 데이터 혁명
____대체 데이터의 원천
__대체 데이터셋 평가
____평가 기준
____데이터의 질
__대체 데이터 시장
____데이터 제공업체와 사용 사례
__대체 데이터로 작업하기
____오픈테이블 데이터 스크레이핑
____어닝 콜 녹취록
__요약
4장. 알파 팩터 리서치
__알파 팩터 엔지니어링
____중요한 팩터 분류
____팩터로의 데이터 변환
__시그널 찾기 - zipline 사용법
____구조-이벤트 주도형 트레이딩 시뮬레이션
____시장 데이터로부터 산출한 단일 알파 팩터
____다양한 데이터 소스의 팩터 결합
____시그널과 잡음의 분리-alphalens의 사용법
____미래 수익률과 팩터 분위수의 생성
____팩터 분위수에 의한 예측 성과
____정보 계수
____팩터 회전율
____알파 팩터 리소스
____기타 알고리즘 트레이딩 라이브러리
__요약
5장. 전략 평가
__zipline으로 포트폴리오 구축과 테스트
____예정된 거래와 포트폴리오 리밸런싱
__pyfolio로 성과를 측정하는 방법
____샤프 비율
____적극적 운용의 기본 법칙
____파이폴리오를 통한 표본 내 및 표본 외 성과
__백테스팅의 함정을 피하는 방법
____데이터 도전
____구현 이슈
____데이터 스누핑과 백테스트 과적합
__포트폴리오 위험과 수익률 관리 방법
____평균 분산 최적화
____평균 분산 최적화의 대안
____리스크 패리티
____리스크 팩터 투자
____계층적 리스크 패리티
__요약
2부. 머신러닝 기초
6장. 머신러닝 프로세스
__데이터로부터 학습
____지도학습
____비지도학습
____강화학습
__기계학습 작업 흐름
____기본 작업 개요-k-최근접 이웃
____문제의 구성-목적과 성과 측정
____데이터의 수집과 준비
____특성 탐험, 추출과 공학
____ML 알고리즘 선택
____모델 설계와 조정
____모델 선택을 위한 교차 검증의 활용
____사이킷런을 이용한 파라미터 조정
____금융에서 교차 검증의 문제점
__요약
7장. 선형 모형
__추론과 예측을 위한 선형 회귀
__다중 선형 회귀 모형
____모형을 만드는 방법
____모형을 훈련하는 방법
____가우스 마르코프 정리
____통계적 추론을 수행하는 방법
____문제를 진단하고 해결하는 방법
____실제로 선형 회귀를 실행하는 방법
__선형 요인 모델을 구축하는 방법
____자본자산 가격결정 모형부터 파마-프렌치 5요인 모델까지
____위험 요인 입수하기
____파마-맥베스 회귀 분석
__수축 방법-선형 회귀에 대한 규제화
____과적합을 방지하는 방법
____리지 회귀 분석의 작동 방식
____라쏘 회귀 분석의 작동 방식
__선형 회귀를 사용해 수익률을 예측하는 방법
____데이터 준비
____statsmodels를 사용한 선형 OLS 회귀
____sklearn을 이용한 선형 OLS 회귀
____sklearn을 이용한 리지 회귀 분석
____sklearn을 이용한 라쏘 회귀 분석
__선형 분류
____로지스틱 회귀 모델
____statsmodels로 추론을 수행하는 방법
____예측에 로지스틱 회귀를 사용하는 방법
__요약
8장. 시계열 모델
__진단과 특성 추출을 위한 분석 도구
____시계열 패턴 분해
____롤링 윈도우 통계량 계산
____자기상관계수 계산
____정상성 진단 및 회복
____시계열 변환의 적용
__일변수 시계열 모델
____자기 회귀 모델의 구축
____이동 평균 모델의 구축
____ARIMA 모델 구축 및 확장
____매크로 펀더멘털 예측
____시계열 모델을 활용한 변동성 예측
__다변수 시계열 모델
____방정식 체계
____벡터 자기회귀 모델
____VAR 모델을 활용한 매크로 펀더멘털 예측
____공적분-공통 추세를 가진 시계열
____페어트레이딩 전략의 공적분 활용
__요약
9장. 베이지안 머신러닝
__베이지안 머신러닝 작동 방식
____경험적 증거로부터 가정을 업데이트하는 방법
____정확한 추론: 최대 사후확률 추정
____근사적 추론: 확률론적 접근법과 결정론적 접근법
__PyMC3를 사용한 확률적 프로그래밍
____테아노를 이용한 베이지안 머신러닝
____PyMC3 워크플로
____실무적 응용
__요약
10장. 결정 트리와 랜덤 포레스트
__결정 트리
____트리의 결정 규칙규칙 학습과 적용
____결정 트리 실용적 사용법
____과대적합과 규제화
____하이퍼파라미터의 조정
__랜덤 포레스트
____앙상블 모델들
____어떻게 배깅이 모델 분산을 낮추는가
____배깅 결정 트리
____어떻게 랜덤 포레스트를 구현하는가
____랜덤 포레스트의 학습과 조정
____랜덤 포레스트의 장점과 단점
__요약
11장. 그래디언트 부스팅 머신
__적응형 부스팅
____에이다부스트 알고리즘
____사이킷런으로 에이다부스트 구현
__그래디언트 부스팅 머신
____GBM 모형을 훈련하고 조정하는 방법
____사이킷런으로 그래디언트 부스팅을 사용하는 방법
__빠르고 확장 가능한 GBM 구현
____알고리즘 혁신이 성능을 향상시키는 방법
____XGBoost, LightGBM, CatBoost 사용법
__GBM 결과를 해석하는 방법
____특성의 중요성
____부분 의존도
____SHapley 첨가 설명
__요약
12장. 비지도학습
__차원 축소
____선형과 비선형 알고리즘
____차원의 저주
____매니폴드 학습
__군집화
____k-평균 군집화
__요약
3부. 자연어 처리
13장. 텍스트 데이터로 작업하기
__텍스트 데이터에서 특성을 추출하는 방법
____자연어 처리의 도전
____자연어 처리 워크플로
____사용 사례
__텍스트에서 토큰으로-NLP 파이프라인
____spaCy와 textacy를 이용한 NLP 파이프라인
____TextBlob을 사용한 자연어 처리
__토큰에서 숫자로-문서 단어 행렬
____단어 주머니 모형
____sklearn을 사용해 문서 단어 행렬 처리
__텍스트 분류와 감성 분석
____나이브 베이즈 분류기
____뉴스 기사 분류
____감성 분석
__요약
14장. 토픽 모델링
__잠재 토픽의 학습: 목적과 방법
____선형대수에서 계층적 확률 모델로
__잠재 의미 인덱싱
____sklearn을 이용한 LSI의 구현법
____장점과 단점
__확률적 잠재 의미 분석
____sklearn을 이용한 pLSA의 구현법
__잠재 디리클레 할당
____LDA의 원리
____LDA 토픽 평가
____sklearn을 이용한 LDA의 구현법
____pyLDAvis를 이용한 LDA 결과의 시각화
____gensim을 이용한 LDA의 구현법
____실적발표를 위한 토픽 모델링
____옐프 사업보고서를 위한 토픽 모델링
__요약
15장. 단어 임베딩
__단어 임베딩은 어떻게 의미를 인코딩하는가
____신경 언어 모델이 문맥에서 사용법을 배우는 방법
____Word2vec 모델-규모에 따른 임베딩 학습
____임베딩을 평가하는 방법-벡터 산술과 유추
____사전 훈련된 단어 벡터를 사용하는 방법
____자신의 단어 벡터 임베딩을 훈련시키는 방법
____케라스의 Skip-Gram 아키텍처
__젠심을 사용해 증권거래위원회 재무신고 단어 벡터
____전처리
____모델 훈련
__Doc2vec을 사용해 감성 분석
____옐프 감성 데이터에 대한 Doc2vec 훈련
__보너스-번역을 위한 Word2vec
__요약
4부. 딥러닝과 강화학습
16장. 딥러닝
__딥러닝과 AI
____고차원 데이터의 문제점
__신경망의 설계
____신경망 작동법
____주요 설계 선택
____심층 신경망의 규제화
____DL을 위한 최적화 기법
__파이썬을 이용한 신경망 구축법
____입력층
____은닉층
____출력층
__신경망 학습법
____파이썬을 이용한 역전파 구현법
____종합
____신경망 학습
__DL 라이브러리 사용법
____케라스 사용법
____텐서보드 사용법
____파이토치 1.0 사용법
____텐서플로 2.0 사용법
__신경망 구조 최적화
____자산 가격 움직임을 예측하기 위한 주식 수익률 시계열 생성
____플레이스홀더를 사용한 신경망 구조의 정의
____조기 종료를 위한 손실 척도의 맞춤형 정의
____신경망 구조의 조정을 위한 GirdSearchCV의 실행
____결과를 더욱 개선하는 법
__요약
17장. 합성곱 신경망
__컨브넷 작동 방식
____합성곱 층 작동 방식
____신경과학에서의 영감
____참고할 만한 컨브넷 아키텍처
____분류 이상의 컴퓨터 비전-탐지와 분할
__파이썬을 이용해 CNN을 설계하고 훈련시키는 방법
____케라스를 이용해 LeNet5와 MNIST 구현
____케라스를 사용한 알렉스넷과 CIFAR10
____시계열 데이터와 함께 CNN을 사용하는 방법
__전이학습-적은 데이터로 더 빠른 훈련
____사전 학습된 CNN을 구축하는 방법
__물체를 탐지하는 방법
____구글 스트리트 뷰 주택 번호(SVHN) 데이터셋
____다중 출력으로 CNN을 정의하는 방법
__최근 발전
____위성 이미지에서 물체를 빠르게 감지
____캡슐 네트워크 캡처 방법
__요약
18장. 순환 신경망
__RNN의 원리
____순환주기로 펼친 계산 그래프
____시간을 통한 역전파
____대안적 순환 신경망 구조
____심층 순환 신경망 설계
____장기 의존성 학습 시 문제점
____GRU
__파이썬을 이용한 RNN의 구축과 학습
____일변수 시계열 회귀
____시계열 분류를 위한 적층 LSTM
____다변수 시계열 회귀
____감성 분류를 위한 LSTM과 단어 임베딩
____사전학습된 단어벡터를 이용한 감성 분석
____텍스트 데이터의 전처리
____사전학습된 GloVe 임베딩
__요약
19장. 오토인코더와 적대적 생성망
__오토인코더의 작동 방식
____비선형 차원 축소
____합성곱 오토인코더
____규제화된 오토인코더를 사용한 희소성 제약
____노이즈 제거 오토인코더로 손상된 데이터 수정
____시퀀스-투-시퀀스 오토인코더
____변분 오토인코더
__파이썬을 사용한 오토인코더 설계와 훈련
____데이터 준비
____단층 피드포워드 오토인코더
____희소성 제약 조건이 있는 피드포워드 오토인코더
____심층 피드포워드 오토인코더
____합성곱 오토인코더
____오토인코더 노이즈 제거
__GAN 작동 방식
____생성 모델과 판별 모델이 어떻게 다른가
____적대적 훈련의 작동 방식
____GAN 아키텍처의 진화
____성공적이고 새로운 GAN 애플리케이션
____파이썬을 사용해 GAN을 빌드하는 방법
__요약
20장. 강화학습
__강화학습의 주요 구성 요소
____상호작용 강화학습 시스템의 구성 요소
__강화학습 문제의 해법
____강화학습 문제 풀이의 주요 문제점
____강화학습 문제를 푸는 근본적 방법
__동적 계획-가치와 정책 반복
____유한 MDP
____정책 반복
____가치 반복
____일반화 정책 반복
____파이썬을 이용한 동적계획
__큐러닝
____큐러닝 알고리즘
____파이썬을 이용한 큐러닝 에이전트 훈련
__딥 강화학습
____신경망을 이용한 가치 함수의 근사
____딥큐러닝 알고리즘과 확장
____오픈에이아이 짐-달착륙선 게임 환경
____텐서플로를 이용한 이중 딥큐러닝
__트레이딩을 위한 강화학습
____오픈에이아이 트레이딩 환경 설계
____기본 트레이딩 에이전트
____주식 시장을 위한 딥큐러닝 에이전트 구축
__요약
21장. 다음 단계
__학습에서 얻은 주요 요점과 교훈
____데이터가 가장 중요한 단일 재료
____도메인 전문 지식이 데이터 가치 창출에 도움을 준다
____특성 공학과 알파 팩터 리서치
____머신러닝은 데이터로 문제를 풀기 위한 도구
____모델 진단은 최적화를 가속화한다
____백테스트의 과대적합을 주의한다
____블랙박스 모델로부터 인사이트를 얻는 법
__머신러닝 실전 트레이딩
____데이터 관리 테크놀로지
____머신러닝 도구들
____온라인 트레이딩 플랫폼
__결론