책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161755694
· 쪽수 : 1164쪽
· 출판일 : 2021-09-30
책 소개
목차
1부. 데이터, 알파 팩터, 포트폴리오
1장. 트레이딩용 머신러닝: 아이디어에서 주문 집행까지
__투자업계에서 머신러닝의 부상
____전자 거래에서 고빈도 매매(HFT)까지
____팩터 투자와 스마트 베타 펀드
____알고리듬 개척자는 인간보다 우위에 있다
____머신러닝과 대체 데이터
____크라우드 소싱 거래 알고리듬
__머신러닝 기반 전략의 설계와 실행
____데이터의 소싱과 관리
____알파 팩터 리서치에서 포트폴리오 관리까지
____전략 백테스팅
__트레이딩을 위한 머신러닝: 전략과 사용 사례
____알고리듬 트레이딩의 진화
____거래를 위한 머신러닝 사용 사례
__요약
2장. 시장 데이터와 기본 데이터: 소스와 기법
__시장 데이터는 시장 환경을 반영한다
____시장 미시 구조: 기본 지식
____트레이딩 방법: 여러 종류의 주문
____트레이딩 장소: 거래소에서 다크풀까지
__고빈도 데이터로 작업
____나스닥 주문 호가창으로 작업
____FIX 프로토콜을 활용한 거래의 통신
____나스닥 토탈뷰-잇치 데이터 피드
____틱에서 바로: 시장 데이터 정규화 방법
____AlgoSeek 분 바: 주식 호가와 거래 데이터
__시장 데이터에 대한 API 접근
____판다스를 이용한 원거리 데이터 접근
____yfinance: 데이터를 야후! 파이낸스로부터 스크레이핑
____퀀토피안
____집라인
____퀀들
____기타 시장 데이터 공급자
__기본 데이터 작업 방법
____재무제표 데이터
____기타 기본 데이터 소스
__판다스를 이용한 효율적 데이터 저장
__요약
3장. 금융을 위한 대체 데이터: 범주와 사용 사례
__대체 데이터 혁명
__대체 데이터의 원천
____개인
____비즈니스 프로세스
____센서
__대체 데이터 평가를 위한 기준
____신호 내용의 질
____데이터의 질
____기술적 측면
__대체 데이터 시장
____데이터 제공업체와 사용 사례
__대체 데이터로 작업
____오픈테이블 데이터 스크래핑
____어닝 콜 트랜스크립트 스크래핑과 파싱
__요약
4장. 알파 팩터 리서치
__알파 팩터 실무: 데이터부터 시그널까지
__알파 팩터 공학
____수십 년간의 팩터 연구를 바탕으로 구축
____모멘텀과 심리: 추세는 당신의 친구다
____가치 팩터
____변동성과 규모 이례 현상
__우량주 팩터
____수익률을 예측하는 알파 팩터 공학
____판다스와 넘파이를 사용한 팩터 공학
____칼만 필터를 사용한 알파 팩터의 잡음 제거
____웨이블릿을 이용한 잡음 데이터의 전처리 방법
__시그널에서 트레이딩으로: 백테스트를 위한 집라인
____단일 팩터 전략을 백테스트하는 방법
____다양한 데이터 소스의 팩터 결합
__알파렌즈를 사용한 시그널과 잡음의 분리
____미래 수익률과 팩터 분위수의 생성
____팩터 5분위수에 의한 예측 성과
____정보 계수
____팩터 회전율
__알파 팩터 리소스
____기타 알고리듬 트레이딩 라이브러리
__요약
5장. 포트폴리오 최적화와 성과 평가
__포트폴리오 성과를 측정하는 방법
____단일 숫자로 위험 수익 트레이드오프 포착
____적극적 운용의 근본 법칙
__포트폴리오 위험과 수익률 관리하는 방법
____현대 포트폴리오 관리의 진화
____평균 분산 최적화
____평균 분산 최적화의 대안
____리스크 패리티
____리스크 팩터 투자
____계층적 리스크 패리티
__집라인으로 트레이딩과 포트폴리오 관리
____신호 생성과 거래 실행 계획 수립
____평균 분산 포트폴리오 최적화 구현
__파이폴리오를 이용한 백테스팅 성과 측정
____수익률과 벤치마크 입력 생성
____표본 외 수익률로 전진 분석
__요약
2부. 트레이딩을 위한 ML: 기본
6장. 머신러닝 프로세스
__데이터로부터 머신러닝이 작동하는 방법
____도전 과제: 알고리듬을 작업에 매칭
____지도학습: 예제에 의한 학습
____비지도학습: 유용한 패턴의 발견
____강화학습
__머신러닝 워크플로
____기본 설명: k-최근접 이웃
____문제의 구성: 목적과 성과 측정
____데이터의 수집과 준비
____특성 탐험, 추출, 특성 공학
____ML 알고리듬 선택
____모델 설계와 조정
____모델 선택을 위한 교차 검증의 활용
____파이썬으로 교차 검증을 구현하는 방법
____금융에서 교차 검증의 문제
____사이킷런을 이용한 파라미터 조정과 옐로우브릭
__요약
7장. 선형 모델: 리스크 팩터에서 수익률 예측까지
__추론에서 예측까지
__베이스라인 모델: 다중 선형 회귀 모델
____모델을 만드는 방법
____모델을 훈련하는 방법
____가우스-마르코프 정리
____통계적 추론을 수행하는 방법
____문제를 진단하고 해결하는 방법
__실제로 선형 회귀를 실행하는 방법
____statsmodels를 활용한 최소 자승법
____sklearn을 활용한 확률적 경사 하강법(SGD)
__선형 요인 모델을 구축하는 방법
____CAPM에서 파마-프렌치 5 요인 모델까지
____위험 요인 입수
____파마-맥베스 회귀 분석
__수축 방법을 사용한 선형 회귀 규제화
____과적합을 방지하는 방법
____리지 회귀 분석의 작동 방식
____라쏘 회귀 분석의 작동 방식
__선형 회귀로 수익률을 예측하는 방법
____모델 특성과 선도 수익률 준비
____statsmodels를 사용한 선형 OLS 회귀 분석
____사이킷런을 이용한 선형 OLS 회귀
____사이킷런을 이용한 리지 회귀 분석
____sklearn을 이용한 라쏘 회귀 분석
____예측 신호의 품질 비교
__선형 분류
____로지스틱 회귀 모델
____statsmodels로 추론을 수행하는 방법
____가격 움직임을 로지스틱 회귀 분석으로 예측
__요약
8장. ML4T 작업 흐름: 모델에서 전략 백테스트까지
__ML 기반 전략의 백테스트 방법
__백테스트의 단점과 이를 회피하는 방법
____데이터를 올바르게 얻기
____시뮬레이션을 올바르게 수행
____통계량을 올바르게 얻기
__백테스트 엔진 작동법
____벡터화 대 이벤트 기반 백테스트
____주요 구현 측면
__백트레이더: 로컬 백테스트용 유연한 도구
____백트레이더의 세레브로 구조의 주요 개념
____실제에서 백트레이더를 사용하는 방법
____백트레이더 요약과 다음 단계
__집라인: 퀀토피안이 만든 확장 가능한 백테스트
____강건한 시뮬레이션을 위한 캘린더와 파이프라인
____분 데이터를 사용해 자체 번들 인제스트
____파이프라인 API: ML 시그널 백테스트
____백테스트 중 모델을 훈련하는 방법
____노트북 사용법
__요약
9장. 시계열 모델
__진단과 특성 추출을 위한 분석 도구
____시계열 패턴의 분해
____롤링 윈도우 통계량과 이동 평균
____자기 상관계수의 측정
__정상성 진단과 회복
____정상성을 얻기 위한 시계열 변환
____단위근의 처리 방법
____시계열 변환의 실제 적용
__일변량 시계열 모델
____자기 회귀 모델의 구축
____이동 평균 모델의 구축
____ARIMA 모델 구축과 확장
____매크로 펀더멘털 예측
____시계열 모델을 활용한 변동성 예측
__다변량 시계열 모델
____방정식 체계
____벡터 자기 회귀(VAR) 모델
____VAR 모델을 활용한 매크로 펀더멘털 예측
__공적분: 공통 추세를 가진 시계열
____엥글-그레인저 2단계 방법
____요한센 우도 비율 테스트
__공적분을 활용한 통계적 차익 거래
____같이 움직이는 자산 쌍을 선택하는 방법
____페어 트레이딩 실제 구현
____전략 백테스트 준비
____백트레이더를 이용한 전략 백테스트
____확장: 개선 방법
__요약
10장. 베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩
__베이지안 머신러닝 학습법
____경험적 증거에서 가정을 업데이트하는 방법
____정확한 추론: 최대 사후 확률 추정
____결정론적 및 확률론적 근사 추론
__PyMC3를 사용한 확률 프로그래밍
____테아노를 이용한 베이지안 머신러닝
____PyMC3 워크플로: 경기 침체 예측
__트레이딩을 위한 베이지안 머신러닝
____성과 비교를 위한 베이지안 샤프 비율
____페어 트레이딩을 위한 베이지안 롤링 회귀 분석
____확률 변동성 모델
__요약
11장. 랜덤 포레스트: 일본 주식 롱/숏 전략
__결정 트리: 데이터로부터의 규칙 학습
____트리의 결정 규칙 학습과 적용
____결정 트리의 실용적 사용법
____과대적합과 규제화
____하이퍼파라미터의 조정
__랜덤 포레스트: 트리의 신뢰성을 높인다
____앙상블 모델의 성과가 더 좋은 이유
____배깅
____랜덤 포레스트를 구축하는 방법
____랜덤 포레스트의 학습과 조정
____랜덤 포레스트를 위한 특성 중요도
____아웃오브백 테스트
____랜덤 포레스트의 장점과 단점
__일본 주식에 대한 롱/숏 시그널
____데이터: 일본 주식
____LightGBM을 사용한 ML4T
____전략: 집라인을 이용한 백테스트
__요약
12장. 거래 전략 강화
__시작하기: 적응형 부스팅
____에이다부스트 알고리듬
____에이다부스트를 사용해 월별 가격 변동 예측
__그래디언트 부스팅: 대부분의 작업을 위한 앙상블
____GBM 모델을 훈련하고 조정하는 방법
____사이킷런으로 그래디언트 부스팅을 사용하는 방법
__XGBoost, LightGBM, CatBoost 사용
____알고리듬 혁신이 성능을 향상시키는 방법
__부스팅을 사용한 롱/숏 거래 전략
____LightGBM과 CatBoost로 시그널 생성
____블랙박스의 내부: GBM 결과를 해석하는 방법
____부스팅 앙상블에 기반을 둔 전략 백테스팅
____학습한 교훈과 다음 단계
__일중 전략을 위한 부스팅
____고빈도 데이터를 위한 특성 공학
____LightGBM으로 분 단위 빈도 시그널
____거래 시그널 품질 평가
__요약
13장. 비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분
__차원 축소
____차원의 저주
____선형 차원 축소
____매니폴드 학습: 선형 차원 축소
__트레이딩을 위한 PCA
____데이터 주도형 리스크 팩터
____고유 포트폴리오
__군집화
____k-평균 군집화
____계층적 군집화
____밀도 기반 군집화
____가우시안 혼합 모델
__최적 포트폴리오를 위한 계층적 군집화
____계층적 리스크 패리티의 작동 원리
____ML 트레이딩 전략을 사용한 HRP 백테스트
__요약
3부. 자연어 처리
14장. 트레이딩을 위한 텍스트 데이터: 감성 분석
__텍스트를 이용한 머신러닝: 언어에서부터 특성까지
____텍스트 데이터 작업의 주요 과제
____자연어 처리 워크플로
____응용 사례
__텍스트에서 토큰으로: NLP 파이프라인
____spaCy와 textacy를 이용한 NLP 파이프라인
____TextBlob을 사용한 자연어 처리
__토큰 계산: 문서 단어 행렬
____단어 주머니 모델
____sklearn을 사용한 문서 단어 행렬(DTM)
____핵심적인 교훈
__트레이딩을 위한 자연어 처리
____나이브 베이즈 분류기
____뉴스 기사 분류
____트위터와 옐프 데이터를 사용한 감성 분석
__요약
15장. 토픽 모델링
__잠재 토픽 학습: 목적과 접근법
____잠재 의미 인덱싱
____sklearn을 이용한 LSI의 구현 방법
____장점과 제약점
__pLSA
____sklearn을 이용한 pLSA의 구현 방법
____장점과 제한점
__LDA
____LDA의 원리
____LDA 토픽 평가
____sklearn을 이용한 LDA의 구현 방법
____pyLDAvis를 이용한 LDA 결과의 시각화
____Gensim을 사용한 LDA의 구현 방법
__실적 발표 콜을 위한 토픽 모델링
____데이터 전처리
____모델 훈련과 평가
____실험 실행
__금융 뉴스를 위한 토픽 모델링
__요약
16장. 어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩
__단어 임베딩이 의미를 인코딩하는 방법
____신경 언어 모델이 문맥에서 사용법을 배우는 방법
____word2vec: 확장 가능한 단어와 구분 임베딩
____의미론적 산술을 활용한 임베딩 평가
__사전 훈련된 단어 벡터를 사용하는 방법
____GloVe: 단어 표현을 위한 글로벌 벡터
__금융 뉴스를 위한 사용자정의 임베딩
____전처리: 문장 인식과 앤그램
____텐서플로 2를 이용한 스킵그램 아키텍처
____텐서보드를 사용해 임베딩 시각화
____Gensim으로 임베딩을 더 빠르게 훈련하는 방법
__SEC 공시 문서를 이용한 트레이딩을 위한 word2vec
____전처리: 문장 인식과 앤그램
____모델 훈련
__doc2vec 임베딩을 사용한 감성 분석
____옐프 감성 데이터에서 doc2vec 입력 생성
____doc2vec 모델 훈련
____문서 벡터로 분류기 훈련
____학습한 교훈과 다음 단계
__새로운 개척자: 사전 훈련된 트랜스포머 모델
____어텐션은 당신이 필요한 모든 것
____BERT: 좀 더 보편적인 언어 모델을 지향
____텍스트 데이터에 대한 트레이딩: 교훈과 다음 단계
__요약
4부. 딥러닝과 강화학습
17장. 딥러닝
__딥러닝: 무엇이 새롭고 왜 중요한가
____계층적 구조가 고차원 데이터의 문제을 완화한다
____표현 학습으로서의 DL
____DL의 ML과 AL와의 연관성
__신경망의 설계
____단순 순전파 신경망 구조
____주요 설계 선택
____심층 신경망의 규제화
____더 빠른 훈련: DL을 위한 최적화
____요약: 주요 하이퍼파라미터를 조정하는 방법
__파이썬을 이용해 처음부터 신경망을 구축하는 방법
____입력층
____은닉층
____출력층
____순전파
____교차 엔트로피 비용 함수
____파이썬을 사용해 역전파를 구현하는 방법
__인기 있는 딥러닝 라이브러리
____GPU 가속화의 활용
____텐서플로 2를 사용하는 방법
____텐서보드 사용법
____파이토치 1.4 사용법
____다른 옵션
__롱/숏 전략을 위한 NN의 최적화
____일 수익률을 예측하기 위한 특성 공학
____NN 구조 프레임워크 정의
____NN을 조정하한 설계 옵션 교차 검증
____예측 성능 평가
____앙상블 시그널을 기반으로 하는 전략의 백테스트
____결과를 더욱 개선하는 방법
__요약
18장. 금융 시계열과 인공위성 이미지를 위한 CNN
__CNN이 그리드 같은 데이터를 모델링하는 방법
____수작업 코딩부터 데이터의 학습 필터까지
____합성곱층의 요소 연산 방법
____CNN 아키텍처의 진화: 주요 혁신
__인공위성 이미지와 물체 인식을 위한 CNN
____LeNet5: 산업용 애플리케이션을 갖춘 최초의 CNN
____알렉스넷: 딥러닝 연구의 재점화
____전이학습: 적은 데이터로 더 빠른 훈련
____객체 탐지와 분할
____실제 객체 탐지
__시계열 데이터용 CNN: 수익률 예측
____1차원 합성곱이 있는 자기 회귀 CNN
____CNN-TA-2D 형식의 시계열 군집화
__요약
19장. 순환 신경망
__RNN의 작동 원리
____순환 주기로 계산 그래프 펼치기
____시간을 통한 역전파
____대안적 순환 신경망 구조
____심층 RNN의 설계
____장기 의존성 학습 시 문제점
____GRU
__텐서플로 2를 이용한 시계열을 위한 RNN
____일변량 회귀: S&P 500 예측
____시계열 데이터를 RNN용 형태로 변환
____적층 LSTM: 주가 움직임과 수익률 예측
____매크로 데이터에 대한 다변량 시계열 회귀
__텍스트 데이터를 위한 RNN
____감성 분류를 위한 LSTM과 단어 임베딩
____사전 학습된 단어 벡터를 이용한 감성 분석
____SEC 보고서 임베딩으로부터 수익률 예측
__요약
20장. 조건부 위험 요인과 자산 가격 결정을 위한 오토인코더
__비선형 특성 추출을 위한 오토인코더
____선형 차원 축소 일반화
____이미지 압축을 위한 합성곱 오토인코더
____규제화된 오토인코더로 과적합 관리
____노이즈 제거 오토인코더로 손상된 데이터 수정
____시계열 특성을 위한 Seq2seq 오토인코더
____변분 오토인코더로 생성 모델링
__텐서플로 2로 오토인코더 구현
____데이터를 준비하는 방법
____단층 순전파 오토인코더
____희소성 제약 조건이 있는 순전파 오토인코더
____심층 순전파 오토인코더
____합성곱 오토인코더
____오토인코더 노이즈 제거
__거래를 위한 조건부 오토인코더
____주식 가격과 메타데이터 정보 습득
____예측 자산 특징 계산
____조건부 오토인코더 아키텍처 만들기
____교훈과 다음 단계
__요약
21장. 합성 시계열 데이터를 위한 적대적 생성 네트워크
__GAN으로 합성 데이터 생성
____생성 모델과 판별 모델 비교
____적대적 훈련: 사기의 제로섬 계임
____GAN 아키텍처 ZOO의 급속한 진화
____이미지를 위한 GAN 애플리케이션과 시계열 데이터
__텐서플로 2를 사용해 GAN을 빌드하는 방법
____생성자 네트워크 빌드
____판별자 네트워크 생성
____적대적 훈련 프로세스 설정
____평가 결과
__합성 금융 데이터를 위한 TimeGAN
____특성과 시간에 걸쳐 데이터를 생성하는 방법 학습
____텐서플로 2를 사용한 TimeGAN 구현
____합성 시계열 데이터의 품질 평가
____교훈과 다음 단계
__요약
22장. 심층 강화학습: 트레이딩 에이전트의 구축
__RL 시스템의 구성 요소
____정책: 상태에서 행동으로 전이
____보상: 행동으로부터 학습
____가치 함수: 장기적으로 최적 선택
____모델 기반 대 모델 프리: 도약 전에 보기?
__RL 문제의 해법
____RL 문제 풀이의 주요 문제점
____RL 문제를 푸는 근본적인 방법
__동적 계획 문제 풀기
____유한 MDP
____정책 반복
____가치 반복
____일반화된 정책 반복
____파이썬을 이용한 동적 계획
__Q-러닝: 바둑에서 최적 정책 찾기
____탐험 대 활용 트레이드오프: ε-탐욕 정책
____Q-러닝 알고리듬
____파이썬을 이용한 Q-러닝 에이전트 훈련법
__OpenAI Gym을 사용한 심층 강화학습
____신경망을 이용한 가치 함수의 근사
____딥 Q-러닝 알고리듬과 확장
____OpenAI GYM 소개
____텐서플로2를 이용한 DDQN의 구현
____간단한 트레이딩 에이전트 작성
____사용자 정의 OpenAI 트레이딩 환경을 설계하는 방법
____Deep Q-learning on the stock market
____얻은 교훈
__요약
23장. 결론과 다음 단계
__학습에서 얻은 주요 요점과 교훈
____데이터는 가장 중요한 단일 재료
____도메인 전문 지식: 잡음으로부터 시그널의 구별
____ML은 데이터로 문제를 풀기 위한 도구 모음이다
____백테스트의 과적합을 주의하라
____블랙박스 모델에서 통찰력을 얻는 방법
__실전 트레이딩을 위한 ML
____데이터 관리 테크놀로지
____ML 도구
____온라인 트레이딩 플랫폼
__결론
부록. 알파 팩터 라이브러리
__TA-Lib에서 구현된 공통 요인 알파
____핵심 구성 요소: 이동 평균
____중첩 연구: 가격과 변동성 추세
____모멘텀 지표
____거래량과 유동성 지표
____변동성 지표
____기본 위험 요인
__정형화된 알파에 대한 월드퀀트의 탐구
____횡단면 및 시계열 함수
____정형화된 알파 표현식
__이변량 및 다변량 요인 평가
____정보 계수와 상호 정보량
____특성 중요도와 SHAP 값
____비교: 각 지표에 대한 Top 25 특성
____금융 성과: 알파렌즈