logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

케스케이딩 완벽 가이드

케스케이딩 완벽 가이드

(빅데이터 분석을 위한 하둡 워크플로우 관리 도구)

파코 네이선 (지은이), 오세봉, 장정호 (옮긴이)
한빛미디어
20,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

케스케이딩 완벽 가이드
eBook 미리보기

책 정보

· 제목 : 케스케이딩 완벽 가이드 (빅데이터 분석을 위한 하둡 워크플로우 관리 도구)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론
· ISBN : 9788968480775
· 쪽수 : 220쪽
· 출판일 : 2014-01-30

책 소개

하둡 에코시스템을 워크플로우 기반으로 손쉽게 관리하는 케스케이딩으로 애플리케이션을 작성하는 방법을 보여주는 책. 이 책 전반에서 다루는 간단한 예제들을 통해 대규모 클러스터에서 대규모 데이터셋을 효과적으로 분석하는 방법을 배우게 될 것이다.

목차

프롤로그
_P.1 요구 사항
_P.2 엔터프라이즈 데이터 워크플로우
_P.3 거대함 그 이상의 복잡성
_P.4 케스케이딩 API의 탄생 배경
_P.5 예제 코드 사용

1장. 시작하기
_1.1 프로그램 개발 환경 준비
_1.2 예제 1 : 초간단 케스케이딩 애플리케이션
_1.3 빌드와 실행
_1.4 케스케이딩의 분류 체계
_1.5 예제 2 : 흔한 단어 세기
_1.6 플로우 다이어그램
_1.7 대규모 환경에서의 케스케이딩

2장. 파이프 어셈블리 확장
_2.1 예제 3 : 사용자 정의 연산
_2.2 토큰 다듬기
_2.3 예제 4 : 복제 조인
_2.4 불용어와 복제 조인
_2.5 아파치 피그와 비교
_2.6 아파치 하이브와 비교

3장. 테스트 주도 개발
_3.1 예제 5 : TF-IDF 구현
_3.2 예제 6 : 테스트가 포함된 TF-IDF
_3.3 테스트에 관한 부언

4장. 케스케이딩용 스칼라 DSL
_4.1 스콜딩을 사용하는 이유
_4.2 스콜딩 시작하기
_4.3 스콜딩으로 작성한 예제 3 : 사용자 정의 연산
_4.4 함수형 프로그래밍에 관한 부언
_4.5 스콜딩으로 작성한 예제 4 : 복제 조인
_4.6 그레이들로 스콜딩 애플리케이션 빌드하기
_4.7 아마존 AWS에서 수행

5장. 케스칼로그-케스케이딩을 위한 클로저 DSL
_5.1 케스칼로그를 사용하는 이유
_5.2 케스칼로그 시작하기
_5.3 케스칼로그로 작성한 예제 1 : 초간단 애플리케이션
_5.4 케스케이딩으로 작성한 예제 4 : 복제 조인
_5.5 케스칼로그로 작성한 예제 6 : 테스트가 포함된 TF-IDF
_5.6 케스칼로그 기술적 내용과 사례

6장. 맵리듀스 그 이상
_6.1 애플리케이션과 조직
_6.2 링구알, ANSI SQL을 위한 도메인 특화 언어
_6.3 패턴, 예측 모델 마크업 언어를 위한 DSL

7장. 워크플로우 추상화
_7.1 핵심 통찰력
_7.2 패턴 언어
_7.3 문학적 프로그래밍
_7.4 관심사 분리
_7.5 함수형 관계형 프로그래밍
_7.6 엔터프라이즈 대 스타트업

8장. 사례 연구 : 팰로앨토시의 오픈 데이터
_8.1 왜 오픈 데이터인가?
_8.2 팰로앨토시
_8.3 원시 데이터 소스에서 데이터 제품으로 이동
_8.4 추천기를 위한 메트릭 보정
_8.5 공간 색인
_8.6 개인화
_8.7 추천
_8.8 빌드와 실행
_8.9 추천기 워크플로우 요점

부록. 워크플로우 문제 해결

저자소개

파코 네이선 (지은이)    정보 더보기
Concurrent에서 개발자 지원 프로그램을 이끌고 있는 데이터 과학자다. 스탠포드 대학에서 수학/통계와 분산 컴퓨팅을 복수 전공했으며 IT업체에서 25년간 일해왔다. 하둡, R, 예측 분석, 머신 러닝 그리고 자연어 처리 분야의 전문가로서 대규모 클라우드 기반의 데이터 인프라와 함께 여러 전문 데이터 과학팀을 만들고 이끌어 왔다. 'AWS Start-Up Tour'에서 두 차례 강연했으며, 하둡과 데이터 과학 그리고 클라우드 컴퓨팅에 대해 자주 이야기한다.
펼치기
오세봉 (옮긴이)    정보 더보기
티맥스 소프트에서 웹 어플리케이션 서버를 개발하다 빅데이터에 관심이 생겨 KT 넥스알에 입사했다. 재직 중에 『하이브 완벽 가이드』(한빛미디어, 2013), 『케스케이딩 완벽 가이드』(한빛미디어, 2014)와 『MVC 구조의 확실한 해답 AngularJS 디렉티브』(에이콘, 2016)을 번역했다. KT 넥스알을 나와 어린이용 스마트워치(LINE 키즈폰)를 출시했으며 이때부터 안드로이드 개발을 시작했다. 대학 때부터 웹을 비롯한 UI에 관심이 많아 안드로이드 UI에 적응하는 데 오래 걸리지는 않았지만 SQLite를 비롯한 안드로이드 서비스는 자료가 많지 않아 시행착오를 많이 겪어야 했다. 현재는 SK텔레콤에서 빅데이터를 이용한 데이터 분석과 관련된 일을 하고 있다.
펼치기
장정호 (옮긴이)    정보 더보기
네이버 검색 소프트웨어 엔지니어. 2006년에 티맥스에서 애플리케이션/시스템 간 데이터 전송 시스템 개발을 시작으로, 다음커뮤니케이션에서 데이터 마이닝 업무, SAP에서 칼럼 기반의 인메모리 RDBMS인 HANA 개발에 동참했으며, 그 후 빅데이터 저장/분석 시스템 영역에 관한 연구를 통해 네이버에서 데이터 분석 시스템을 개발을 담당하고 있습니다. 한빛미디어에서 『쿠퍼네티스 모범 사례』(2020), 『하둡 완벽 가이드(4판)』(2017), 『하이브 완벽 가이드』(2013) 등을 번역했습니다. SK텔레콤의 데이터 플랫폼 엔지니어. 네이버와 SAP에서 데이터 플랫폼과 데이터베이스 개발에 참여했습니다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책