logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

파이썬과 대스크를 활용한 고성능 데이터 분석

파이썬과 대스크를 활용한 고성능 데이터 분석

(대규모 데이터셋 분석, 시각화, 모델링부터 분산 앱 패키징과 배포까지)

제시 대니얼 (지은이), 이준용 (옮긴이)
한빛미디어
28,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
25,200원 -10% 0원
1,400원
23,800원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 22,400원 -10% 1120원 19,040원 >

책 이미지

파이썬과 대스크를 활용한 고성능 데이터 분석
eBook 미리보기

책 정보

· 제목 : 파이썬과 대스크를 활용한 고성능 데이터 분석 (대규모 데이터셋 분석, 시각화, 모델링부터 분산 앱 패키징과 배포까지)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791162243305
· 쪽수 : 360쪽
· 출판일 : 2020-10-05

책 소개

대스크를 활용한 데이터 정리에서 배포에 이르기까지 데이터 과학의 일반적인 워크플로를 따라가는 여정으로 우리를 안내한다. 확장 가능한 컴퓨팅을 익히고 이를 대스크가 어떤 방식으로 활용하는지 살펴본다.

목차

Part I 확장 가능한 컴퓨팅의 빌딩 블록

CHAPTER 1 왜 확장 가능한 컴퓨팅이 중요한가?
__1.1 왜 대스크인가?
__1.2 DAG 요리하기
__1.3 확장성, 동시성과 복구
__1.4 예제 데이터셋 소개
__1.5 마치며

CHAPTER 2 대스크 시작하기
__2.1 데이터 프레임 API와의 첫 만남
__2.2 DAG 시각화하기
__2.3 작업 스케줄링
__2.4 마치며

Part II 대스크 데이터 프레임을 이용해 정형 데이터 작업하기

CHAPTER 3 대스크 데이터 프레임 소개하기
__3.1 왜 데이터 프레임을 사용하는가?
__3.2 대스크와 팬더스
__3.3 대스크 데이터 프레임의 한계
__3.4 마치며

CHAPTER 4 대스크 데이터 프레임으로 데이터 불러오기
__4.1 텍스트 파일에서 데이터 읽기
__4.2 관계형 데이터베이스에서 데이터 읽어오기
__4.3 HDFS와 S3에서 데이터 읽어오기
__4.4 파케이 형식으로 데이터 읽어오기
__4.5 마치며

CHAPTER 5 데이터 프레임의 정리와 변환
__5.1 인덱스 및 축 작업하기
__5.2 결측값 다루기
__5.3 데이터 기록하기
__5.4 요소별 연산
__5.5 데이터 프레임의 필터링과 재색인
__5.6 데이터 프레임들을 조인하고 연결하기
__5.7 텍스트 파일과 파케이 파일에 데이터 쓰기
__5.8 마치며

CHAPTER 6 데이터 프레임 요약과 분석
__6.1 기술 통계
__6.2 내장된 집계 함수
__6.3 사용자 정의 집계 함수
__6.4 롤링(윈도우) 함수
__6.5 마치며

CHAPTER 7 시본 라이브러리로 데이터 프레임 시각화하기
__7.1 준비-리듀스-수집-플롯 패턴
__7.2 scatterplot 함수와 regplot 함수로 연속형 관계 시각화하기
__7.3 바이올린 플롯으로 범주형 관계 시각화하기
__7.4 히트맵으로 두 가지 범주형 관계 시각화하기
__7.5 마치며

CHAPTER 8 데이터 셰이더로 위치 데이터 시각화하기
__8.1 데이터 셰이더란 무엇이며 어떤 원리로 동작하는가?
__8.2 대화식 히트맵으로 위치 데이터 플로팅하기
__8.3 마치며

Part III 대스크의 확장과 배포

CHAPTER 9 백(Bags)과 배열 활용하기
__9.1 Bags으로 비정형 데이터 읽고 파싱하기
__9.2 요소 변형, 요소 필터링, 그리고 요소 폴딩하기
__9.3 Bags으로부터 배열 및 데이터 프레임 만들기
__9.4 자연어 툴킷으로 병렬 텍스트 분석을 위해 Bags 사용하기
__9.5 마치며

CHAPTER 10 대스크 ML을 이용한 머신러닝
__10.1 대스크 ML로 선형 모델 만들기
__10.2 대스크 ML 모델 평가 및 튜닝
__10.3 대스크 ML 모델 저장하기
__10.4 마치며

CHAPTER 11 대스크 확장 및 배포
__11.1 도커로 아마존 AWS에서 대스크 클러스터 빌드하기
__11.2 클러스터에서 대스크 작업 실행하고 모니터링하기
__11.3 AWS에서 대스크 클러스터 정리하기
__11.4 마치며

APPENDIX A 소프트웨어 설치
__A.1 아나콘다로 추가 패키지 설치하기
__A.2 아나콘다 없이 패키지 설치하기
__A.3 주피터 노트북 서버 시작하기
__A.4 NLTK 구성하기

저자소개

제시 대니얼 (지은이)    정보 더보기
경험이 풍부한 파이썬 개발자. 지난 3년간은 특별히 PyData 스택(팬더스, 넘파이, 사이파이, 사이킷런)과 함께 했다. 2016년 덴버 대학교의 비즈니스 정보 및 분석학과 부교수로 '데이터 과학을 위한 파이썬' 과목을 개설하고 가르쳤다. 현재는 덴버 지역의 미디어 기술 관련 업체에서 데이터 과학팀을 이끌고 있다.
펼치기
이준용 (옮긴이)    정보 더보기
인공지능과 빅데이터 기술에 관심이 많은 연구원. 한국과학기술원(KAIST)에서 전자공학 박사학위를 받고, 일본 ATR IRC 연구소에서 인간-로봇 상호작용에 대해 연구했으며, 미국 아이오와 주립대학교에서 대사회로 관련 데이터베이스를 구축했습니다다. 2014년부터 2021년까지 미국 퍼시픽 노스웨스트 국립연구소에서 다양한 생명과학 연구에 참여했습니다다. 현재는 한 바이오텍 기업에서 수석 데이터 과학자로 암 진단과 관련된 일을 하고 있습니다다. 역서로 『손에 잡히는 R 프로그래밍』(한빛미디어, 2015), 『파이썬과 대스크를 활용한 고성능 데이터 분석』(한빛미디어, 2020), 『데이터 과학을 위한 통계(2판)』(한빛미디어, 2021)가 있습니다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9791162247532