데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집

책 이미지

eBook 미리보기

책 정보

· 제목 : 데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집 (100개 이상의 실전 면접 문제로 배우는 머신러닝, 딥러닝, 강화학습 알고리즘)
· 분류 : 국내도서 > 컴퓨터/모바일 > 인공지능
· ISBN : 9791190665230
· 쪽수 : 528쪽
· 출판일 : 2020-06-30

책 소개

간단한 내용부터 복잡한 내용까지, 로지스틱 회귀, 랜덤 포레스트 등 전통적인 머신러닝에서 GANs, 강화학습 등 최신 알고리즘까지 차례대로 전개되며, 머신러닝 각각의 영역을 포괄하는 간결한 문답 형식으로 되어 있다.

CHAPTER 1 피처 엔지니어링 1
① 피처 정규화 3
② 범주형 피처 6
③ 고차원 결합 피처의 처리 방법 9
④ 결합 피처 12
⑤ 텍스트 표현 모델 14
⑥ Word2Vec 17
⑦ 이미지 데이터가 부족할 때는 어떻게 처리해야 할까요? 20

CHAPTER 2 모델 평가 23
① 평가 지표의 한계 25
② ROC 곡선 31
③ 코사인 거리의 응용 38
④ A/B 테스트의 함정 43
⑤ 모델 평가 방법 46
⑥ 하이퍼파라미터 튜닝 49
⑦ 과적합과 과소적합 52

CHAPTER 3 클래식 알고리즘 55
① 서포트 벡터 머신 57
② 로지스틱 회귀 67
③ 의사결정 트리 71

CHAPTER 4 차원축소 85
① PCA 최대분산 이론 87
② PCA 최소제곱오차 이론 92
③ 선형판별분석 96
④ 선형판별분석과 주성분분석 101

CHAPTER 5 비지도학습 107
① k평균 클러스터링 109
② 가우스 혼합 모델 121
③ 자기 조직화 지도 125
④ 클러스터링 알고리즘 평가 131

CHAPTER 6 확률 그래프 모델 137
① 확률 그래프 모델의 결합확률분포 139
② 확률 그래프 표현 142
③ 생성모델과 판별모델 146
④ 마르코프 모델 148
⑤ 토픽 모델 156

CHAPTER 7 최적화 알고리즘 163
① 지도학습에서의 손실함수 165
② 머신러닝에서의 최적화 문제 169
③ 전통적인 최적화 알고리즘 172
④ 경사하강법 검증 방법 177
⑤ 확률적 경사하강법 180
⑥ 확률적 경사하강법의 가속 184
⑦ L1 정규화와 희소성 192

CHAPTER 8 샘플링 199
① 샘플링의 역할 201
② 균등분포의 난수 204
③ 자주 사용하는 샘플링 방법 207
④ 가우스 분포 샘플링 212
⑤ 마르코프 체인 몬테카를로 219
⑥ 베이지안 네트워크 샘플링 225
⑦ 불균형 샘플 집합에서의 리샘플링 230

CHAPTER 9 피드 포워드 신경망 235
① 다층 퍼셉트론과 부울 함수 237
② 딥러닝의 활성화 함수 245
③ 다층 퍼셉트론의 오차역전파 알고리즘 249
④ 딥러닝 훈련 테크닉 257
⑤ 합성곱 신경망 263
⑥ ResNet 271

CHAPTER 10 순환신경망 277
① 순환신경망과 합성곱 신경망 279
② 순환신경망의 그래디언트 소실 문제 281
③ 순환신경망의 활성화 함수 284
④ LSTM 네트워크 286
⑤ Seq2Seq 모델 290
⑥ 어텐션 메커니즘 294

CHAPTER 11 강화학습 299
① 강화학습 기초 301
② 비디오 게임에서의 강화학습 308
③ 폴리시 그래디언트 313
④ 탐색과 이용 317

CHAPTER 12 앙상블 학습 323
① 앙상블 학습의 종류 325
② 앙상블 학습 단계와 예제 329
③ 기초 분류기 332
④ 편향과 분산 334
⑤ GBDT 알고리즘의 기본 원리 338
⑥ XGBoost와 GBDT의 차이점, 그리고 연관성 342

CHAPTER 13 생성적 적대 신경망 347
① 처음 만나는 GANs의 비밀 349
② WGAN: 저차원의 유령을 잡아라 357
③ DCGAN: GANs이 합성곱을 만났을 때 365
④ ALI 372
⑤ IRGAN: 이산 샘플의 생성 377
⑥ SeqGAN: 텍스트 시퀀스 생성 382

CHAPTER 14 인공지능의 응용 현황 391
① 알고리즘 마케팅 393
② 게임에서의 인공지능 409
③ 자율 주행에서의 AI 428
④ 기계 번역 439
⑤ 인간과 컴퓨터 상호작용 443

에필로그 및 저자 소개 449
참고문헌 465
찾아보기 470

저자소개

Hulu 데이터 과학팀 (지은이) 정보 더보기

• 주거웨(Zhuge Yue) • 왕지에(Wang Jie) • 지앙윈셩(Jiang Yunsheng) • 리판딩(Li Fanding) • 왕위징(Wang Yujing) • 조우한닝(Zhou Hanning) • 씨에시아오후이(Xie Xiaohui) • 천라밍(Chen Laming) • 리우춘양(Liu Chunyang) • 리우천하오(Liu Chenhao) • 쉬샤오란(Xu Xiaoran) • 펑웨이(Feng Wei) • 둥찌엔치앙(Dong Jianqiang) • 리우멍이(Liu Mengy) • 장궈신(Zhang Guoxin)

펼치기

김태헌 (옮긴이) 정보 더보기

외국계 IT 기업, 국내 금융사 AI 연구소, 글로벌 소비재 기업 등에서 다양한 AI 프로젝트를 수행했으며, 현재는 이커머스 기업의 핀테크 조직에서 수석 데이터 과학자 겸 머신러닝 알고리즘 엔지니어로 일하고 있다. 베이징 대학을 졸업한 후 캘리포니아 대학교 샌디에이고(UCSD)에서 국제경제학 석사 학위를 받았다. 또한, 세계 최대 규모의 데이터 과학 커뮤니티이자 경진대회 플랫폼인 캐글에서 그랜드 마스터로 활동 중이다. 저서로는 《금융 AI의 이해》(제이펍, 2024), 《AI 소사이어티》(미래의창, 2022/2022년 세종도서 교양부문 선정), 《퀀트 전략을 위한 인공지능 트레이딩》(한빛미디어, 2020)이 있으며, 역서로는 《그림으로 배우는 StatQuest 머신러닝 강의》, 《단단한 머신러닝》, 《데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집》(이상 제이펍) 등이 있다.

펼치기

김태헌의 다른 책 >

리뷰

([100자평]문답형식으로 되어있어서 편안하게 재밌게 읽을수있었습니다)

자세히

nan******

★★★★★(10)

([100자평]15인의 전문가들이 마치 앙상블 방식으로 저술한 점이 ...)

자세히

책속에서

데이터 과학자로 향하는 길은 순탄치 않을 것입니다. 하지만 그 길에는 아름다움과 광활함이 함께할 것입니다. 여러분이 해야 할 일은 자신이 어떤 일을 하고 싶은지를 명확히 하고, 묵묵히 이 책의 내용을 최대한 습득한 후, 조용히 이 책을 덮고서 생활 속 사소한 곳에서 머신러닝의 매력을 느껴보는 것입니다.

머신러닝 문제에서 특성은 벡터의 형태로 표현되는 경우가 많습니다. 따라서 두 특성 벡터 사이의 유사도를 분석할 때 코사인 유사도를 자주 사용합니다. 코사인 유사도 값의 범위는 [-1, 1]이고, 같은 두 벡터 사이의 유사도는 1입니다. 만약 거리와 유사한 형태로 표현하고 싶다면 1에서 코사인 유사도를 뺀 것이 코사인 거리가 됩니다. 따라서 코사인 거리가 취할 수 있는 값의 범위는 [0, 2]가 되고, 동일한 두 벡터의 코사인 거리는 0이 됩니다.

서점	할인가	할인률	배송비	혜택/추가	실질최저가	구매하기
	30,600원	-10%	0원	1,700원	28,900원	>
	30,600원	-10%	0원	카드할인 10% 3,060원	27,540원	>

서점	유형	등록개수	최저가	구매하기

서점	정가	할인가	마일리지	실질최저가	구매하기
	24,500원	-10%	1220원	20,830원	>

데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집

(100개 이상의 실전 면접 문제로 배우는 머신러닝, 딥러닝, 강화학습 알고리즘)

일반도서

중고도서

eBook

책 이미지

책 정보

책 소개

목차

저자소개

리뷰

책속에서

추천도서