핸즈온 머신러닝.딥러닝 알고리즘 트레이딩

책 이미지

eBook 미리보기

책 정보

· 제목 : 핸즈온 머신러닝.딥러닝 알고리즘 트레이딩 (파이썬, Pandas, NumPy, Scikit-learn, 케라스를 활용한 효과적인 거래 전략)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161754321
· 쪽수 : 788쪽
· 출판일 : 2020-07-31

책 소개

디지털 데이터의 폭발적인 증가로 머신러닝을 사용하는 거래 전략의 전문지식에 대한 요구가 높아졌다. 이 책은 지도학습과 비지도학습 알고리즘으로 다양한 데이터 원천에서 신호를 추출해 효과적인 투자 전략을 만들 수 있도록 안내한다.

1부. 프레임워크: 데이터에서 전략 설계까지

1장. 트레이딩을 위한 머신러닝
__이 책을 읽는 법
____기대하는 것
____이 책을 읽어야 하는 독자
____이 책의 구성
____성공하기 위해 필요한 것
__투자업계에서 머신러닝의 부상
____전자거래에서 고빈도 매매까지
____팩터 투자와 스마트 베타 펀드
____알고리즘 개척자는 규모에 있어 인간보다 우위에 있다
____머신러닝과 대체 데이터
__거래 전략의 설계와 실행
____데이터의 소싱 및 관리
____알파 팩터 리서치 및 평가
____포트폴리오 최적화와 리스크관리
____전략 백테스팅
__머신러닝과 알고리즘 트레이딩 전략
____거래를 위한 머신러닝의 사용 사례
__요약

2장. 시장 데이터와 기본적 요인 데이터
__시장 데이터 사용 방법
____시장 미시구조
____주문 호가창 데이터의 사용
____틱 데이터의 규제
____시장 데이터에 대한 API접근
____pandas를 이용한 원거리 데이터 접근
____기타 시장 데이터 공급자
__기본적 데이터 작업 방법
____재무제표 데이터
____기타 기본적 데이터 소스
__판다스를 이용한 효율적 데이터 저장
__요약

3장. 금융을 위한 대체 데이터
__대체 데이터 혁명
____대체 데이터의 원천
__대체 데이터셋 평가
____평가 기준
____데이터의 질
__대체 데이터 시장
____데이터 제공업체와 사용 사례
__대체 데이터로 작업하기
____오픈테이블 데이터 스크레이핑
____어닝 콜 녹취록
__요약

4장. 알파 팩터 리서치
__알파 팩터 엔지니어링
____중요한 팩터 분류
____팩터로의 데이터 변환
__시그널 찾기 - zipline 사용법
____구조-이벤트 주도형 트레이딩 시뮬레이션
____시장 데이터로부터 산출한 단일 알파 팩터
____다양한 데이터 소스의 팩터 결합
____시그널과 잡음의 분리-alphalens의 사용법
____미래 수익률과 팩터 분위수의 생성
____팩터 분위수에 의한 예측 성과
____정보 계수
____팩터 회전율
____알파 팩터 리소스
____기타 알고리즘 트레이딩 라이브러리
__요약

5장. 전략 평가
__zipline으로 포트폴리오 구축과 테스트
____예정된 거래와 포트폴리오 리밸런싱
__pyfolio로 성과를 측정하는 방법
____샤프 비율
____적극적 운용의 기본 법칙
____파이폴리오를 통한 표본 내 및 표본 외 성과
__백테스팅의 함정을 피하는 방법
____데이터 도전
____구현 이슈
____데이터 스누핑과 백테스트 과적합
__포트폴리오 위험과 수익률 관리 방법
____평균 분산 최적화
____평균 분산 최적화의 대안
____리스크 패리티
____리스크 팩터 투자
____계층적 리스크 패리티
__요약

2부. 머신러닝 기초

6장. 머신러닝 프로세스
__데이터로부터 학습
____지도학습
____비지도학습
____강화학습
__기계학습 작업 흐름
____기본 작업 개요-k-최근접 이웃
____문제의 구성-목적과 성과 측정
____데이터의 수집과 준비
____특성 탐험, 추출과 공학
____ML 알고리즘 선택
____모델 설계와 조정
____모델 선택을 위한 교차 검증의 활용
____사이킷런을 이용한 파라미터 조정
____금융에서 교차 검증의 문제점
__요약

7장. 선형 모형
__추론과 예측을 위한 선형 회귀
__다중 선형 회귀 모형
____모형을 만드는 방법
____모형을 훈련하는 방법
____가우스 마르코프 정리
____통계적 추론을 수행하는 방법
____문제를 진단하고 해결하는 방법
____실제로 선형 회귀를 실행하는 방법
__선형 요인 모델을 구축하는 방법
____자본자산 가격결정 모형부터 파마-프렌치 5요인 모델까지
____위험 요인 입수하기
____파마-맥베스 회귀 분석
__수축 방법-선형 회귀에 대한 규제화
____과적합을 방지하는 방법
____리지 회귀 분석의 작동 방식
____라쏘 회귀 분석의 작동 방식
__선형 회귀를 사용해 수익률을 예측하는 방법
____데이터 준비
____statsmodels를 사용한 선형 OLS 회귀
____sklearn을 이용한 선형 OLS 회귀
____sklearn을 이용한 리지 회귀 분석
____sklearn을 이용한 라쏘 회귀 분석
__선형 분류
____로지스틱 회귀 모델
____statsmodels로 추론을 수행하는 방법
____예측에 로지스틱 회귀를 사용하는 방법
__요약

8장. 시계열 모델
__진단과 특성 추출을 위한 분석 도구
____시계열 패턴 분해
____롤링 윈도우 통계량 계산
____자기상관계수 계산
____정상성 진단 및 회복
____시계열 변환의 적용
__일변수 시계열 모델
____자기 회귀 모델의 구축
____이동 평균 모델의 구축
____ARIMA 모델 구축 및 확장
____매크로 펀더멘털 예측
____시계열 모델을 활용한 변동성 예측
__다변수 시계열 모델
____방정식 체계
____벡터 자기회귀 모델
____VAR 모델을 활용한 매크로 펀더멘털 예측
____공적분-공통 추세를 가진 시계열
____페어트레이딩 전략의 공적분 활용
__요약

9장. 베이지안 머신러닝
__베이지안 머신러닝 작동 방식
____경험적 증거로부터 가정을 업데이트하는 방법
____정확한 추론: 최대 사후확률 추정
____근사적 추론: 확률론적 접근법과 결정론적 접근법
__PyMC3를 사용한 확률적 프로그래밍
____테아노를 이용한 베이지안 머신러닝
____PyMC3 워크플로
____실무적 응용
__요약

10장. 결정 트리와 랜덤 포레스트
__결정 트리
____트리의 결정 규칙규칙 학습과 적용
____결정 트리 실용적 사용법
____과대적합과 규제화
____하이퍼파라미터의 조정
__랜덤 포레스트
____앙상블 모델들
____어떻게 배깅이 모델 분산을 낮추는가
____배깅 결정 트리
____어떻게 랜덤 포레스트를 구현하는가
____랜덤 포레스트의 학습과 조정
____랜덤 포레스트의 장점과 단점
__요약

11장. 그래디언트 부스팅 머신
__적응형 부스팅
____에이다부스트 알고리즘
____사이킷런으로 에이다부스트 구현
__그래디언트 부스팅 머신
____GBM 모형을 훈련하고 조정하는 방법
____사이킷런으로 그래디언트 부스팅을 사용하는 방법
__빠르고 확장 가능한 GBM 구현
____알고리즘 혁신이 성능을 향상시키는 방법
____XGBoost, LightGBM, CatBoost 사용법
__GBM 결과를 해석하는 방법
____특성의 중요성
____부분 의존도
____SHapley 첨가 설명
__요약

12장. 비지도학습
__차원 축소
____선형과 비선형 알고리즘
____차원의 저주
____매니폴드 학습
__군집화
____k-평균 군집화
__요약

3부. 자연어 처리

13장. 텍스트 데이터로 작업하기
__텍스트 데이터에서 특성을 추출하는 방법
____자연어 처리의 도전
____자연어 처리 워크플로
____사용 사례
__텍스트에서 토큰으로-NLP 파이프라인
____spaCy와 textacy를 이용한 NLP 파이프라인
____TextBlob을 사용한 자연어 처리
__토큰에서 숫자로-문서 단어 행렬
____단어 주머니 모형
____sklearn을 사용해 문서 단어 행렬 처리
__텍스트 분류와 감성 분석
____나이브 베이즈 분류기
____뉴스 기사 분류
____감성 분석
__요약

14장. 토픽 모델링
__잠재 토픽의 학습: 목적과 방법
____선형대수에서 계층적 확률 모델로
__잠재 의미 인덱싱
____sklearn을 이용한 LSI의 구현법
____장점과 단점
__확률적 잠재 의미 분석
____sklearn을 이용한 pLSA의 구현법
__잠재 디리클레 할당
____LDA의 원리
____LDA 토픽 평가
____sklearn을 이용한 LDA의 구현법
____pyLDAvis를 이용한 LDA 결과의 시각화
____gensim을 이용한 LDA의 구현법
____실적발표를 위한 토픽 모델링
____옐프 사업보고서를 위한 토픽 모델링
__요약

15장. 단어 임베딩
__단어 임베딩은 어떻게 의미를 인코딩하는가
____신경 언어 모델이 문맥에서 사용법을 배우는 방법
____Word2vec 모델-규모에 따른 임베딩 학습
____임베딩을 평가하는 방법-벡터 산술과 유추
____사전 훈련된 단어 벡터를 사용하는 방법
____자신의 단어 벡터 임베딩을 훈련시키는 방법
____케라스의 Skip-Gram 아키텍처
__젠심을 사용해 증권거래위원회 재무신고 단어 벡터
____전처리
____모델 훈련
__Doc2vec을 사용해 감성 분석
____옐프 감성 데이터에 대한 Doc2vec 훈련
__보너스-번역을 위한 Word2vec
__요약

4부. 딥러닝과 강화학습

16장. 딥러닝
__딥러닝과 AI
____고차원 데이터의 문제점
__신경망의 설계
____신경망 작동법
____주요 설계 선택
____심층 신경망의 규제화
____DL을 위한 최적화 기법
__파이썬을 이용한 신경망 구축법
____입력층
____은닉층
____출력층
__신경망 학습법
____파이썬을 이용한 역전파 구현법
____종합
____신경망 학습
__DL 라이브러리 사용법
____케라스 사용법
____텐서보드 사용법
____파이토치 1.0 사용법
____텐서플로 2.0 사용법
__신경망 구조 최적화
____자산 가격 움직임을 예측하기 위한 주식 수익률 시계열 생성
____플레이스홀더를 사용한 신경망 구조의 정의
____조기 종료를 위한 손실 척도의 맞춤형 정의
____신경망 구조의 조정을 위한 GirdSearchCV의 실행
____결과를 더욱 개선하는 법
__요약

17장. 합성곱 신경망
__컨브넷 작동 방식
____합성곱 층 작동 방식
____신경과학에서의 영감
____참고할 만한 컨브넷 아키텍처
____분류 이상의 컴퓨터 비전-탐지와 분할
__파이썬을 이용해 CNN을 설계하고 훈련시키는 방법
____케라스를 이용해 LeNet5와 MNIST 구현
____케라스를 사용한 알렉스넷과 CIFAR10
____시계열 데이터와 함께 CNN을 사용하는 방법
__전이학습-적은 데이터로 더 빠른 훈련
____사전 학습된 CNN을 구축하는 방법
__물체를 탐지하는 방법
____구글 스트리트 뷰 주택 번호(SVHN) 데이터셋
____다중 출력으로 CNN을 정의하는 방법
__최근 발전
____위성 이미지에서 물체를 빠르게 감지
____캡슐 네트워크 캡처 방법
__요약

18장. 순환 신경망
__RNN의 원리
____순환주기로 펼친 계산 그래프
____시간을 통한 역전파
____대안적 순환 신경망 구조
____심층 순환 신경망 설계
____장기 의존성 학습 시 문제점
____GRU
__파이썬을 이용한 RNN의 구축과 학습
____일변수 시계열 회귀
____시계열 분류를 위한 적층 LSTM
____다변수 시계열 회귀
____감성 분류를 위한 LSTM과 단어 임베딩
____사전학습된 단어벡터를 이용한 감성 분석
____텍스트 데이터의 전처리
____사전학습된 GloVe 임베딩
__요약

19장. 오토인코더와 적대적 생성망
__오토인코더의 작동 방식
____비선형 차원 축소
____합성곱 오토인코더
____규제화된 오토인코더를 사용한 희소성 제약
____노이즈 제거 오토인코더로 손상된 데이터 수정
____시퀀스-투-시퀀스 오토인코더
____변분 오토인코더
__파이썬을 사용한 오토인코더 설계와 훈련
____데이터 준비
____단층 피드포워드 오토인코더
____희소성 제약 조건이 있는 피드포워드 오토인코더
____심층 피드포워드 오토인코더
____합성곱 오토인코더
____오토인코더 노이즈 제거
__GAN 작동 방식
____생성 모델과 판별 모델이 어떻게 다른가
____적대적 훈련의 작동 방식
____GAN 아키텍처의 진화
____성공적이고 새로운 GAN 애플리케이션
____파이썬을 사용해 GAN을 빌드하는 방법
__요약

20장. 강화학습
__강화학습의 주요 구성 요소
____상호작용 강화학습 시스템의 구성 요소
__강화학습 문제의 해법
____강화학습 문제 풀이의 주요 문제점
____강화학습 문제를 푸는 근본적 방법
__동적 계획-가치와 정책 반복
____유한 MDP
____정책 반복
____가치 반복
____일반화 정책 반복
____파이썬을 이용한 동적계획
__큐러닝
____큐러닝 알고리즘
____파이썬을 이용한 큐러닝 에이전트 훈련
__딥 강화학습
____신경망을 이용한 가치 함수의 근사
____딥큐러닝 알고리즘과 확장
____오픈에이아이 짐-달착륙선 게임 환경
____텐서플로를 이용한 이중 딥큐러닝
__트레이딩을 위한 강화학습
____오픈에이아이 트레이딩 환경 설계
____기본 트레이딩 에이전트
____주식 시장을 위한 딥큐러닝 에이전트 구축
__요약

21장. 다음 단계
__학습에서 얻은 주요 요점과 교훈
____데이터가 가장 중요한 단일 재료
____도메인 전문 지식이 데이터 가치 창출에 도움을 준다
____특성 공학과 알파 팩터 리서치
____머신러닝은 데이터로 문제를 풀기 위한 도구
____모델 진단은 최적화를 가속화한다
____백테스트의 과대적합을 주의한다
____블랙박스 모델로부터 인사이트를 얻는 법
__머신러닝 실전 트레이딩
____데이터 관리 테크놀로지
____머신러닝 도구들
____온라인 트레이딩 플랫폼
__결론

저자소개

스테판 젠슨 (지은이) 정보 더보기

어플라이드 에이아이(Applied AI)의 창립자이자 CEO다. 포춘지 선정 500대 기업, 투자 기업 및 업계 전반에서 데이터와 AI 전략에 대해 조언하고, 데이터 과학 팀을 구성하고, 광범위한 비즈니스 문제에 대한 엔드투엔드 머신 학습 솔루션을 개발하고 있다. 이전에는 국제 투자회사의 파트너이자 상무이사를 역임하며 예측 분석 및 투자 연구 업무를 구축했다. 15개 시장에서 영업을 하는 글로벌 핀테크 기업의 고위 임원으로 신흥국 중앙은행에 자문, 세계은행과 상담하기도 했다. 조지아 공대에서 컴퓨터 공학 석사 학위를, 하버드 및 자유 대학교 베를린에서 경제학 석사 학위를 취득했고 CFA 자격증을 보유하고 있다. 유럽, 아시아, 미주 지역에서 6개 언어로 근무했으며 제너럴 어셈블리(General Assembly)와 데이터캠프(Datacamp)에서 데이터 과학을 가르쳤다.

펼치기

스테판 젠슨의 다른 책 >

홍창수 (옮긴이) 정보 더보기

경북대학교에서 재무 전공으로 경영학 석사학위를 받고, 한국외국어대학교에서 「장외개별주식옵션의 내재변동성 실증분석」으로 경영학 박사학위를 받았다. 2000년 ㈜ 외환선물 투자공학팀 애널리스트로 첫 직장생활을 시작한 이후 리딩투자증권 파생상품운용 팀 옵션딜러, 한국투자증권 리스크관리부 리스크 퀀트로 근무했다. 한화투자증권에서 장외파생상품 겸영 인가 취득에 참여한 이후 금융공학 팀, OTC파생 팀에서 장외파생상품 설계 및 마케팅 담당 차장으로 근무했다. 이후 금융자산평가회사인 ㈜ NICE P&I 금융공학연구소 실장으로 근무했으며, 현재는 정보사업본부에서 금융공학 컨설팅 업무를 수행하고 있다. 저서로는 『장외파생상품 실무입문』(서울경제경영, 2014)이 있으며, 번역서로는 『퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e』(에이콘, 2021)가 있다. SCI급 저널인 「PLOS ONE」을 비롯 국내 유수의 재무금융 및 경영 학술지인 증권학회지, 재무관리연구, 금융공학연구, 경영연구 등에 재무 및 파생상품 관련 논문을 게재했다. 중앙대학교에서 강사로 'R을 활용한 금융공학 실습' 과목을 강의했으며, 한국금융공학회 산학협력위원으로 활동하고 있다.

펼치기

홍창수의 다른 책 >

이기홍 (옮긴이) 정보 더보기

카네기멜론대학교에서 석사 학위를 받았고, 피츠버그대학교의 Finance Ph.D, CFA, FRM이자 금융, 투자, 경제분석전문가다. 삼성생명, HSBC, 새마을금고중앙회, 한국투자공사 등과 같은 국내 유수의 금융기관, 금융 공기업에서 자산 운용 포트폴리오 매니저로 근무했으며 현재 딥러닝과 강화학습을 금융에 접목시켜 이를 전파하고 저변을 확대하는 것을 보람으로 삼고 있다. 저서로는 『엑셀 VBA로 쉽게 배우는 금융공학 프로그래밍』(한빛미디어, 2009)이 있으며, 번역서로는 『포트폴리오 성공 운용』(미래에셋투자교육연구소, 2010), 『딥러닝 부트캠프 with 케라스』(길벗, 2017), 『프로그래머를 위한 기초 해석학』(길벗, 2018)과 에이콘출판사에서 출간한 『실용 최적화 알고리즘』(2020), 『초과 수익을 찾아서 2/e』(2020), 『자산운용을 위한 금융 머신러닝』(2021), 『실전 알고리즘 트레이딩 배우기』(2021), 『존 헐의 비즈니스 금융 머신러닝 2/e』(2021), 『퀀트 투자를 위한 머신러닝o딥러닝 알고리듬 트레이딩 2/e』(2021), 『자동머신러닝』(2021), 『금융 머신러닝』(2022) 등이 있다. 누구나 자유롭게 머신러닝과 딥러닝을 자신의 연구나 업무에 적용해 활용하는 그날이 오기를 바라며 매진하고 있다.

펼치기

이기홍의 다른 책 >