책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9791195484737
· 쪽수 : 344쪽
· 출판일 : 2016-12-21
책 소개
목차
PART 01. 변화의 시작
01. 거리개념과 MDS
1. 생활에서 만나는 문제
2. 해결책을 위한 사고실험
3. 알고리즘과 수학적 정리
4. 코딩구현과 구체적인 해결방안
5. 다시 한 번 정리해 보자
02. Decision Tree(의사결정나무)
1. 생활에서 만나는 문제
2. 해결책을 위한 사고 실험
3. 알고리즘과 수학적 정리
4. 코딩구현과 구체적인 해결방안
5. 다시 한 번 정리해 보자
03. Clustering Analysis(군집분석)
1. 알고리즘과 수학적 정리
2. 코딩구현과 구체적인 해결방안
3. 다시 한 번 정리해 보자
04. k?nearest neighbors
1. 생활에서 만나는 문제
2. 해결책을 위한 사고실험
3. 코딩구현과 구체적인 해결방안
4. 다시 한 번 정리해 보자
05. Regression
1. 생활에서 만나는 문제
2. 알고리즘과 수학적 정리
3. 코딩구현과 구체적인 해결방안
4. 다시 한 번 정리해 보자
06. Neural Network
1. 기본적인 개념
2. 다층신경망(Multilayer Neural Network)
3. 알고리즘과 수학적 정리
4. 생활에서 만나는 문제
5. 다시 한 번 정리해 보자
07. Time Series Analysis
1. 생활 속의 문제
2. 본격적인 분석작업
3. 알고리즘과 수학적 정리
4. 정리하면서
08. naive Bayes
1. 생활 속의 문제
2. 코딩과 구체적인 구현
3. 나머지 문제
09. Association Analysis
1. 생활 속의 문제
2. 알고리즘
3. 코딩과 구체적인 구현
4. 시각화(Visualization)
10. Text Mining
1. 간단한 소개
2. 생활 속의 문제
3. 다른 방법을 써보자
PART 02. 푸른바다로 여행
11. Social Network Analysis
1. 생활에서 만나는 문제
2. SNA 관련이론
12. Logistic Regression
1. 생활에서 만나는 문제
2. 알고리즘과 수학적 정리
3. 코딩과 구체적인 구현
4. 끝내는 말
13. Rule Based Classification
1. 생활에서 만나는 문제
2. 알고리즘과 수학적 정리
3. 코딩과 구체적인 구현
4. 마지막 정리
14. Support Vector Machine
1. 생활에서 만나는 문제
2. 알고리즘과 수학적 정리
3. 코딩과 구체적인 구현
4. 마지막 정리
15. Finance Engineering
1. 생활에서 만나는 문제
2. 데이터 탐색
3. 포트폴리오 최적화 모델
4. 마지막 말
16. Genetic Algorithm
1. 생활에서 만나는 문제
2. 알고리즘과 원리
3. 코딩과 구체적인 구현
4. 마지막 말
17. Outlier Detection
1. 생활에서 만나는 문제
2. 코딩과 구체적인 구현
3. 마지막 말
18. Model Evaluation
1. Training/Test data
2. Metric
3. Cross Validation
4. Class imbalance
19. Ensemble Model
1. 앙상블 모형과 Random Forest
2. Bagging과 Boosting
3. 마지막 말
PART 03. 창공의 도약
20. SNA+Neural Network
1. 생활 속의 문제
2. 코딩과 알고리즘 구현
21. PCA+Clustering
1. 생활 속의 문제
2. 알고리즘과 코딩
22. Regression Tree
1. 시작하기
23. Monte Carlo Simulation
1. 시작하기
2. 생활 속의 문제
3. π구하기
4. 간단한 stock simulation
5. 간단한 SNA simulation
24. Stochastic Process
1. 시작하기
2. 알고리즘
3. 실제문제와 적용
25. Feed Forward Neural Network
1. 시작하기
2. 필기한 숫자를 인식하기
3. 알고리즘과 수학적 정리
4. 코딩구현과 구체적인 해결방안
5. 다시 한 번 정리해 보자
26. Convolutional Neural Network
1. 시작하기
2. Algorithm과 구체적인 개념
3. 수학적 정리
4. 또 다른 이야기
5. 코딩구현과 구체적인 해결방안
27. Restricted Boltzmann machine
1. 시작하기
2. 알고리즘과 수학적 정리
27장의 Appendix
찾아보기
저자소개
리뷰
책속에서
&&&& 저자 서문
안녕하세요 저자 양지헌입니다. 누구나 초반에는 데이터마이닝이나 기계학습이라는 생소한 분야를 공부하면서 고전했던 기억이 있습니다. 물론 어렵기는 하지만 그것이 너무나 철학적이고 종교적이라 무엇인가 심오한 내용이 있는 것은 결코 아닙니다. 결국은 현실적인 문제를 어떻게 효율적이고 체계적으로 접근하여 풀어볼까 고민하다가 차츰 학문으로 발전하게 된 것이죠.
보통 공부를 진행하다 보면 사람들 중에서 금융에 접목을 시켜보려는 사람도 있고 요새 뜨고 있는 AI에 집중하려고 하는 사람도 있으며 어떤 사람은 마케팅이나 CRM분야에서 적성을 찾는 사람도 보았습니다. 그런데 누구나 결국 모든 시작은 통계학이나 수학 그리고 데이터마이닝에서 시작하더라구요. 그리고 차츰 넓은 바다로 나아갑니다. 물론 세부적인 목적이나 자신의 진로방향에 따라서 조금씩 전공분야가 틀려질 수도 있겠지만요. 하지만 어떤 분야에서나 데이터를 수집하고 저장하고 그것을 적당히 처리해서 탐색하고 분석하고 패턴을 찾고 모델을 정립하고 다시 모델을 리모델링하고 다른 모델과 결합하는 등의 반복작업을 하는 것은 거의 비슷할 것입니다. 보통 이런 모든 분야에서 하는 일을 모두 모아서 데이터사이언스라고 합니다. 학교마다 조금씩 특색이 다르겠지만 보통 배우는 것은 기본적인 과목 외에 경영학 , 마케팅 , 프로그래밍 등의 분야도 있고 가르치는 교수님의 의도에 따라서도 조금씩 특화가 되겠지요. 어쨌거나 누구에게나 처음에는 낯선 분야일수밖에 없지만 백그라운드가 무엇인지가 미래의 성패를 좌지우지하는 것은 아니라고 생각합니다. 가장 중요한 것은 관심과 열의가 아닐까 해요. 어떤 분야나 관심이 많은 사람을 이기기는 힘들거든요.
저는 서진수 대표님과 강남의 삼계탕 집에서 만나서 머신러닝을 삼계탕 집 주인도 알 수 있도록 책을 쓸 수 없을까? 하는 논의를 했습니다. 저는 불가능이 아니라고 생각했습니다. 간단한 미적분 정도의 지식을 가지고도 너무 지나친 형식론을 피한다면 누구나 즐겁게 공부할 수 있을 것이라고 생각했습니다. 사실 이 책은 바로 그렇게 탄생한 책입니다. 대학교 1학년정도의 수학을 어느 정도 안다면 100%를 이해할 수 있을 것이고 고등학교 정도의 수학을 안다면 그래도 80~90%를 이해할 수 있을 것이라고 생각합니다. 저는 원래 이론을 매우 중시하고 철저한 형식을 따져야 한다고 늘 학교에서부터 배웠지만 지식과 의사전달은 그런 단순한 문제가 아니더라구요. 따라서 계속 고민고민을 하면서 현실적으로 실생활에 적용할 수 있는 친숙한 데이터과학을 설명해보기로 하였습니다. 만약 수학이나 알고리즘에 자신이 없다면 처음부터 완벽하게 알고리즘과 이론에 너무 큰 의미를 부여하지 않아도 좋습니다. 어느 정도 흐름을 파악하고 어떻게 코딩을 하는지 알면 그걸로 이 책의 소정의 목적을 달성했다고 보아도 좋거든요. 하지만 저는 혹시나 수식과 형식론을 중요시하는 분들을 위해서 정확한 논리전개나 꼭 필요한 알고리즘을 최대한 이해하기 쉽게 쓰도록 고민을 많이 하였습니다. 그래도 두 마리 토끼를 다 잡는다는 것이 생각처럼 쉽지는 않더라구요. 이 책은 데이터분석을 하기 위하여 필요한 기본적인 거의 모든 내용을 포함한다고 생각합니다. 그러면서 핵심적이고 기본적인 내용을 포함하되 전반적인 그림을 잡을 수 있도록 적당한 깊이를 유지하였습니다. 또한 R과 python의 기본문법은 어느 정도 알고 있다는 전제를 했다는 점을 알려드립니다. 마지막에 쓰인 딥러닝의 이론 부분은 어쩔 수 없이 수식을 좀 많이 쓰긴 했지만 역시 대학교 저학년 정도의 수학이기 때문에 자세히 풀다 보면 이해를 하게 될 것입니다. 원래는 수학이 중요하다기보다 수식에 담긴 이론의 창시자의 사상이 중요하거든요.
가끔 주변에 책을 좋아하는 많은 분석가나 컨설턴트들이 좋은 책이 나오면 보려고 샀다가 금방 실망하거나 질려서 구석에 쌓아놓고 안보는 경우가 많다고 하네요. 저는 절대 그런 책은 만들어서 시간낭비나 돈낭비를 하도록 만들고 싶지는 않습니다. 데이터과학자의 중요한 기본적인 소양은 매일 다방면의 텍스트를 (영어든지 한국어든지) 많이 읽는 것이라고 생각합니다. 우리가 데이터를 다루는 사람인데 수식이나 알고리즘에만 관심을 갖는다? 뉴스나 상식이나 다른 인문학에는 별로 관심이 없다? 이것이 말이 될까요? 무엇이든 관심을 가지고 그것이 사회이든 정치이든 문학이든 자연과학이든지 많이 읽고 창의력을 키우는 것이 중요하다고 생각합니다. 그러기 위해서는 열린 마음을 갖는 것이 좋겠죠?
이 책을 만들기 위하여 머신러닝에 관련된 거의 모든 사이트와 국내외 책을 찾아보고 참조하거나 영감을 얻었습니다. 그리고 어떻게 하면 가장 쉽고 이해하기 쉽게 알고리즘을 설명할 수 있을까 고민하고 대부분의 예제와 코딩을 직접 만들었습니다.
저는 이 책 한 권으로 머신러닝의 입문을 완벽하게 마스터하리라고 확신을 가지고 심혈을 다했는데 저만의 오만한 생각인지 독자들의 생각은 어떤지 정말 떨립니다. 마지막으로 이 책을 써보라고 권유하신 데이터사이언스 학과의 정여진교수님과 책 내용의 교정과 아이디어를 제공해주신 컨설턴트 김민정씨와 전새미씨에게 감사드립니다. 디자인과 쉬어가는 페이지에 대한 아이디어를 주신 대학원생 강승리씨와 디자이너인 제동생 양민영씨에게도 감사드리며 설문조사와 함께 이 책 전반의 마지막 교정을 해주신 데이터사이언스 석박사 연구원들과 데이터를 제공해주신 오창규 과학선생님과 이호상 컨설턴트에게 심심한 감사를 표합니다.
그리고 이 모든 지원을 아낌없이 주고 힘들 때마다 조언과 격려를 해주셨던 더알음 출판사 대표이신 서진수씨에게 너무나 고맙다는 말씀을 드립니다.
저자 양지헌 드림