logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

데이터 마이닝 in 파이썬

데이터 마이닝 in 파이썬

(비즈니스 애널리틱스를 위한)

갈리트 시뮤엘리, Peter C. Bruce, 피터 게데크, Nitin R. Patel (지은이), 조성준, 조재희, 조성배, 이성임, 신현정, 김성범 (옮긴이)
한빛아카데미(교재)
39,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
39,000원 -0% 0원
1,950원
37,050원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 39,000원 -10% 1950원 33,150원 >

책 이미지

데이터 마이닝 in 파이썬
eBook 미리보기

책 정보

· 제목 : 데이터 마이닝 in 파이썬 (비즈니스 애널리틱스를 위한)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791156646440
· 쪽수 : 592쪽
· 출판일 : 2023-02-10

책 소개

데이터를 분석하는 목적, 데이터의 양·유형·노이즈 등에 따라 적합한 분석 기법이 달라진다. 이 책은 전통적인 통계 기법부터 머신러닝 기법까지 데이터 마이닝 기술 전반을 다루어, 주어진 상황에 적합한 분석 기법을 선택할 수 있는 힘을 키워준다.

목차

PART 01 준비
Chapter 01 서문
1.1 비즈니스 애널리틱스 정의
1.2 데이터 마이닝 정의
1.3 데이터 마이닝 관련 용어
1.4 빅데이터
1.5 데이터 사이언스
1.6 다양한 분석 방법이 존재하는 이유
1.7 용어와 표기법
1.8 로드맵

Chapter 02 데이터 마이닝 프로세스 개요
2.1 서론
2.2 데이터 마이닝의 핵심 아이디어
2.3 데이터 마이닝 수행 단계
2.4 데이터 분석 사전 단계
2.5 예측력과 과적합
2.6 모델 구축: 선형 회귀 분석을 이용한 예제
2.7 로컬 컴퓨터에서 파이썬을 이용한 데이터 마이닝
2.8 데이터 마이닝 과정의 자동화
2.9 데이터 마이닝의 윤리 이슈
연습문제

PART 02 데이터 탐색과 차원 축소
Chapter 03 데이터 시각화
3.1 개요
3.2 예제 데이터
3.3 기본 차트: 막대그래프, 선그래프, 산점도
3.4 다차원 시각화
3.5 특수 시각화
3.6 주요 시각화 작업 요약
연습문제

Chapter 04 차원 축소
4.1 서론
4.2 차원의 저주
4.3 실질적인 고려 사항
4.4 데이터 요약
4.5 상관 분석
4.6 범주형 변수의 범주 개수 축소
4.7 범주형 변수에서 수치형 변수로의 변환
4.8 주성분 분석
4.9 회귀 모델을 사용한 차원 축소
4.10 분류 트리와 회귀 트리를 이용한 차원 축소
연습문제

PART 03 성능 평가
Chapter 05 예측 성능 평가
5.1 서론
5.2 예측 성능의 평가
5.3 분류기 성능의 판단
5.4 랭킹 성능의 판단
5.5 오버샘플링
연습문제

PART 04 예측 및 분류
Chapter 06 다중 선형 회귀
6.1 서론
6.2 설명 모델과 예측 모델의 모델링
6.3 회귀식의 추정과 예측
6.4 선형 회귀 분석의 변수 선택
연습문제

Chapter 07 k-NN 알고리즘
7.1 k-NN 분류기(범주형 결과)
7.2 k-NN 예측기(수치형 결과)
7.3 k-NN 알고리즘의 장점과 단점
연습문제

Chapter 08 나이브 베이즈 분류기
8.1 서론
8.2 완전한(정확한) 베이지안 분류기의 적용
8.3 나이브 베이즈 분류기의 장점과 단점
연습문제

Chapter 09 분류 회귀 트리
9.1 서론
9.2 분류 트리
9.3 분류 트리의 성능 평가
9.4 과적합 방지하기
9.5 분류 트리 모델의 분류 규칙
9.6 3개 이상의 클래스 분류하기
9.7 회귀 트리 모델
9.8 예측력 향상: 랜덤 포레스트와 부스트 트리
9.9 트리 모델의 장점과 단점
연습문제

Chapter 10 로지스틱 회귀 분석
10.1 서론
10.2 로지스틱 회귀 모델
10.3 예제: 개인 대출 신청 수락
10.4 분류 성능 평가
10.5 다중 클래스 분류에 대한 로지스틱 회귀
10.6 분석 예제: 연착 항공편 예측
연습문제

Chapter 11 신경망
11.1 서론
11.2 신경망의 개념과 구조
11.3 데이터에 신경망 적합하기
11.4 요구되는 사용자 입력
11.5 예측 변수들과 결과 변수 간의 관계 탐색
11.6 딥러닝
11.7 신경망의 장점과 단점
연습문제

Chapter 12 판별 분석
12.1 서론
12.2 클래스로부터 관측치에 이르는 거리
12.3 피셔의 선형 분류 함수
12.4 판별 분석의 분류 성능
12.5 사전 확률
12.6 서로 다른 오분류 비용
12.7 클래스가 3개 이상일 경우의 분류
12.8 판별 분석의 장점과 단점
연습문제

Chapter 13 방법론 결합: 앙상블과 업리프트 모델링
13.1 앙상블
13.2 업리프트 모델링
13.3 요약
연습문제

PART 05 레코드 간의 마이닝 관계
Chapter 14 연관 규칙과 협업 필터링
14.1 연관 규칙
14.2 협업 필터링
14.3 요약
연습문제

Chapter 15 군집 분석
15.1 서론
15.2 두 레코드 사이의 거리 측정
15.3 두 군집 사이의 거리 측정
15.4 계층적 응집 군집화
15.5 비계층적 군집화: k -평균 군집화 방법
연습문제

PART 06 시계열 예측
Chapter 16 시계열 데이터 분석
16.1 서론
16.2 탐색 모델 vs. 예측 모델
16.3 비즈니스에서 주로 사용되는 예측 기법
16.4 시계열 요소
16.5 데이터 분할 및 성능 평가
연습문제

Chapter 17 회귀 분석을 기반으로 한 예측
17.1 추세를 반영한 모델
17.2 계절성을 반영한 모델
17.3 추세와 계절성을 반영한 모델
17.4 자기상관과 아리마 모델
연습문제

Chapter 18 평활법
18.1 서론
18.2 이동 평균법
18.3 단순 지수 평활법
18.4 고급 지수 평활법
연습문제

PART 07 데이터 분석
Chapter 19 소셜 네트워크 애널리틱스
19.1 서론
19.2 방향/무방향 네트워크
19.3 네트워크 분석과 시각화
19.4 소셜 데이터의 측정 측도와 분류
19.5 네트워크 측도를 이용한 예측과 분류
19.6 파이썬을 이용한 소셜 네트워크 데이터 수집
19.7 소셜 네트워크 애널리틱스의 장점과 단점
연습문제

Chapter 20 텍스트 마이닝
20.1 서론
20.2 텍스트의 표 형식: 용어-문서 행렬과 ‘단어 주머니’
20.3 단어 주머니 vs. 문서 수준의 의미 추출
20.4 텍스트의 전처리
20.5 데이터 마이닝 방법의 구현
20.6 예제: 자동차와 전자 제품에 대한 온라인 논의
20.7 요약
연습문제

PART 08 사례
Chapter 21 사례
21.1 찰스 북클럽
21.2 독일 신용 평가 자료
21.3 테이코 소프트웨어 카탈로그 판매 회사
21.4 유권자
21.5 택시 예약 취소
21.6 목욕 비누 구매자 세분화
21.7 직접 우편 기금 조성
21.8 카탈로그 교차 판매
21.9 시계열 사례: 대중교통 수요 예측
이 책에 사용된 데이터 파일 목록
부록: 파이썬 유틸리티 함수
참고문헌
찾아보기

저자소개

갈리트 시뮤엘리 (지은이)    정보 더보기
현재 대만 국립 칭화대학교 서비스 사이언스 연구소의 칭화 특훈교수이며, 베스트셀러인 비즈니스를 위한 데이터마이닝 책의 공동저자이다. 그동안 관련 분야에서 다수의 전문서적을 출간하였으며, 최고 학술지에 다수의 논문을 게재하였다. 또한, 시뮤엘리 교수는 인도 경영대학, 미국 메릴랜드대학교 스미스 경영대학원, 인도 경영대학 대만 국립칭화대학교, Statistics.com 등에서 예측, 데이터마이닝, 통계학, 기타 데이터 분석 등의 과목을 설계하고, 강의한 경력이 있다.
펼치기
갈리트 시뮤엘리의 다른 책 >
피터 게데크 (지은이)    정보 더보기
데이터 과학자. 과학 계산과 데이터 과학 분야에서 30년 이상의 경험을 가지고 있다. 노바티스(Novartis)에서 계산화학자로 20년 동안 근무했고, 현재 컬래버레이티브 드러그 디스커버리(Collaborative Drug Discovery)에서 선임 데이터 과학자로 근무하며 약물 후보 물질의 생물학적, 물리화학적 특성을 예측하기 위한 머신러닝 알고리즘을 개발하는 일을 전문적으로 한다. 『Data Mining for Business Analytics』(Wiley, 2019)의 공동 저자이다. 프리드리히 알렉산더 대학교에서 화학 박사학위를 받았으며 독일 하겐 통신대학교(Fernuniversitat in Hagen)에서 수학을 전공했다.
펼치기
피터 게데크의 다른 책 >
조성배 (지은이)    정보 더보기
인간이 어떻게 생각하고 의식을 갖는지에 호기심을 갖고, 지능 컴퓨터를 만드는 과학자를 꿈꾸며 40년간 인공지능을 공부해 왔습니다. 한국과학기술원(KAIST)에서 박사학위를 받고, 일본 ATR 인간정보통신연구소, 캐나다 브리티시컬럼비아대학교 등에서 재임했으며, 현재는 연세대학교 컴퓨터과학과 교수이자 인공지능대학원 원장입니다. 인공지능 분야에서 수많은 연구자가 인용하는 다수의 학술논문을 저술하여, 연세대학교 펠로우(2023), 대한민국정부 근정포장(2022), 연세대학교 언더우드특훈교수(2021), 가헌학술상(2017), 한국정보과학회 학술상(2005) 등을 수상했습니다. 지금까지 쓴 책으로는 《우리는 인공지능과 함께할 수 있을까?》, 《왜 인공지능이 문제일까?》, 《데이터 천재들은 어떻게 기획하고 분석할까?》 (공저) 등이 있습니다.
펼치기
조성준 (지은이)    정보 더보기
빅데이터를 분석하는 데이터 마이닝, AI, 머신 러닝을 가르치고 연구하는 데이터 사이언티스트이자 빅데이터 연구가로 활동하고 있습니다. 서울대학교 산업공학과를 졸업하고, 워싱턴대학교에서 인공지능 연구로 석사 학위를, 메릴랜드대학교에서 신경망과 기계 학습 연구로 박사 학위를 받았습니다. 지금은 서울대학교에서 산업공학과 교수로 학생들을 가르치며, 빅데이터AI센터장 일도 하고 있어요. 국내 대표 기업 및 공공 기관에 초청되어 활발한 자문 및 강연 활동을 하고 있으며, 대중 강연을 통해 대한민국 최고 빅데이터 권위자이자 멘토로도 주목받고 있습니다.
펼치기
조재희 (지은이)    정보 더보기
광운대학교 정보융합학부 교수로 창업지원센터장, 입학처장, 국제처장을 역임했다. 네브래스카대학교에서 의사결정지원시스템 연구로 박사학위를 취득했고, 데이터 자산의 전략적 활용, 시공간 데이터분석, 다차원 모델링 연구로 주목받고 있다. 한국BI데이터마이닝학회장과 정부3.0 추진위원회 빅데이터분과 전문위원을 지냈으며, 다수의 논문을 발표하는 등 국내 데이터 발전을 위해 활발한 활동을 하고 있다.
펼치기
김성범 (지은이)    정보 더보기
고려대학교 산업경영공학부 교수. 조지아공과대학교에서 산업시스템공학 석사?박사 학위를 받았고, 텍사스주립대학교 산업공학과에서 교수를 지냈다. 고려대학교 공과대학 부학장, 인공지능공학연구소장, 기업산학연협력센터장을 역임하였다. 공저로 ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022), ≪첨단유산≫(2021), ≪4차 산업혁명의 미래를 설계한다≫(2018) 등이 있다.
펼치기
이성임 (지은이)    정보 더보기
서울대학교 지질과학과에서 학사, 통계학과에서 석사를 마치고 연세대학교 환경공해연구소에서 근무했다. 이후 서울대학교 통계학과에서 박사를 마치고, 동 대학 복잡계통계연구센터 박사후 연구원, 고려대학교 의과학연구원 연구 교수로 있다가 2004년부터 단국대학교에 재직 중이다. 데이터 마이닝과 범주형 자료분석, 생존 분석, 통계적 품질관리 등을 강의하고 있으며, 주된 연구 분야는 생존 분석과 통계적 모니터링 방법 등이다. 공역 저서로 《비즈니스 애널리틱스를 위한 데이터마이닝 in 파이썬》(2023)과 《비즈니스 애널리틱스를 위한 데이터마이닝 R edition》(2018), 공저로 《데이터 천재들은 어떻게 기획하고 분석할까?》(2022)가 있다.
펼치기
신현정 (옮긴이)    정보 더보기
아주대학교 산업공학과·인공지능학과 교수. 서울대학교에서 산업공학 박사 학위(데이터 마이닝 전공)를 받고 독일 막스플랑크연구소Max-Planck-Institute에서 연구원으로 재직하였다. 귀국 후 서울대학교 의과대학 연구 교수로 있다가 아주대학교 산업공학과에 부임하여 교수로 재직 중이다. 주 관심 분야는 기계학습과 데이터 마이닝 이론으로, 바이오/메디컬인포매틱스, 경제/금융, 치안/안보 분야에 대한 응용 연구를 진행하고 있다.
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9791156647140