logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

Hadoop 에코시스템

Hadoop 에코시스템

(맵리듀스 프로그래밍과 하둡 클러스터 운영 실습)

게리 터킹튼 (지은이), 송영탁, 김현준 (옮긴이)
  |  
에이콘출판
2015-08-25
  |  
35,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 31,500원 -10% 0원 1,750원 29,750원 >
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

Hadoop 에코시스템

책 정보

· 제목 : Hadoop 에코시스템 (맵리듀스 프로그래밍과 하둡 클러스터 운영 실습)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론
· ISBN : 9788960777460
· 쪽수 : 460쪽

책 소개

하둡을 직접 설치하는 방법부터 시작해, 다양한 데이터 처리 방법 및 실습, 심지어 저자의 비밀 노하우까지 알려주며 활용 사례 위주로 읽기 쉽게 작성됐다. 하둡 에코시스템을 직접 몸으로 부딪혀 가며 익힐 수 있는 쉽고 유용한 입문서이자 자습서이다.

목차

1장 무엇을 이야기할 것인가
__빅데이터 처리
__아마존 웹 서비스를 이용한 클라우드 컴퓨팅
__정리

2장 하둡의 설정과 실행
__로컬 우분투 호스트의 하둡
__일래스틱 맵리듀스 사용하기
__로컬 하둡과 EMR 하둡의 비교
__정리

3장 맵리듀스의 이해
__키/값 쌍
__맵리듀스를 위한 하둡 자바 API
__맵리듀스 프로그램 만들기
__WordCount 동작과정을 살펴보기
__하둡 특화된 데이터 타입들
__입력/출력
__정리

4장 맵리듀스 프로그램 개발
__하둡에서 자바 이외의 언어 활용
__대규모 데이터 분석
__카운터와 상태정보, 그 외 출력
__정리
__쉬운, 고급, 그리고 그 사이

5장 고급 맵리듀스 기술
__조인
__그래프 알고리즘
__언어 독립적인 자료 구조
__정리

6장 하둡의 내구성
__장애
__정리

7장 클러스터 운영
__EMR 사용자를 위한 참고 사항
__하둡 설정 속성
__클러스터 셋업
__클러스터 접근 제어
__네임노드 관리
__HDFS 관리
__맵리듀스 관리
__확장
__정리

8장 하이브를 써서 관계형 관점으로 데이터 바라보기
__하이브 개요
__하이브 셋업
__하이브 사용
__아마존 웹 서비스상의 하이브
__정리

9장 관계형 데이터베이스와 연동
__주요 데이터 흐름
__MySQL 구성
__하둡으로 데이터 불러오기
__하둡에서 데이터 내보내기
__AWS
__정리

10장 플룸을 이용한 데이터 수집
__AWS에 관한 노트
__데이터, 데이터, 온 세상에 데이터.....
__아파치 플룸 소개
__더 큰 그림
__정리

11장 다음 선행지
__책에서 다룬 내용과 다루지 않은 내용
__다가오는 하둡의 변화
__다양한 하둡 배포판
__다른 아파치 프로젝트
__다양한 하둡 프로그래밍 방식
__AWS 자원
__정보의 원천
__정리

저자소개

게리 터킹튼 (지은이)    정보 더보기
14년의 경험 대부분을 대규모 분산 시스템 설계와 개발에 몰두했다. 임프로브 디지털(Improve Digital) 사의 데이터 엔지니어 총괄 책임자와 리드 아키텍트로서 회사에서 생산되는 대규모 데이터를 보관, 처리, 추출하는 시스템 개발의 책임자이다. 임프로브 디지털 사에 오기 전엔 영국 아마존(Amazon.co.uk)에서 아마존의 전세계 모든 제품 카탈로그 정보를 처리하는 시스템을 개발하는 대다수의 소프트웨어 개발팀을 이끌었다. 이전에는 영국과 미국의 공공 기관에서 종사했다. 북아일랜드의 벨페스트 퀸즈 대학에서 자연과학 학사 학위와 박사 학위를 받았고, 미국 스티븐스 공과 대학에서 공학 석사 학위를 받았다.
펼치기
김현준 (옮긴이)    정보 더보기
텍사스 오스틴 주립대학교 컴퓨터과학 학사학위를 이수했으며, 오스틴의 브랜딩 및 마케팅 업체에서 SEO와 웹 분석가로 활동했다. Rackspace의 클라우드 서비스를 처음 접하면서 클라우드와 분산 시스템에 관심을 가지게 됐다. 이후 한국 SK C&C 클라우드 컴퓨팅 팀에서 3년간 클라우드와 빅데이터 기술을 경험했으며, 현재는 쿠팡에서 빅데이터 기반 웹 분석, 고객 및 소비자 분석 업무를 맡고 있다. 주요 관심분야는 고객관리 및 분석과 빅데이터 기술의 접목이다.
펼치기
송영탁 (옮긴이)    정보 더보기
일리노이 공대에서 컴퓨터 과학 석사 학위를 받고, 클라우드 컴퓨팅과 대용량 데이터 처리/분석 관련 업무를 해 왔다. 지금은 다음카카오에서 대용량 데이터 분석 업무를 하고 있다.
펼치기

책속에서

★ 옮긴이의 말 ★



프로그래머들 사이에서는 ‘백문이 불여일견’ 을 살짝 바꾼 ‘백문이 불여일타’라는 말이 유명하다. ‘백 번 보는 것보다 한번 쳐 보는 것이 낫다’라는 의미이다. 특히 언어나 프레임워크를 익힐 때에 마음에 와 닿는 말이다. 깊이 있게 활용하려면 물론 기반이 되는 이론이나 내부 구조를 도구를 잘 알아야 한다. 하지만, 도구를 처음 익힐 땐 직접 몸으로 부딪혀 보고 손으로 실습하며 문제를 풀어 보아야 이 도구가 어떤 문제를 푸는 데 유용하고, 어떤 식으로 활용하는가 하는 점을 배울 수 있다. 그런 점에서 이 책은 굉장히 실용적인 접근을 한다. 각 장마다 제일 먼저 필수적인 개념을 설명하고, 이해하기 쉬운 예제, 실습을 통해 설명한 개념을 활용하는 방법을 익힐 수 있게 한다. 그 이후에 예제와 실습에 관한 내용을 상세하게 설명해 주고, 도전 과제를 제시한다. 얇고 쉬운 책이지만, 빅데이터의 개념과 하둡 파일 시스템, 맵리듀스 프로그래밍, 하둡 클러스터 설치와 운용에 관한 내용이 모두 담겨 있다.

그 뿐만이 아니라, 데이터 수집이나 기존 시스템과의 연계를 위한 하둡 생태계의 주요 오픈소스에 관한 설명도 빠뜨리지 않았다. 아마존의 클라우드 서비스를 이용하는 실습도 있으니, 클라우드에 관심 있는 독자들은 더 재미있게 공부할 수 있다.

이 책은 혼자 공부하는 자습서로 쓸 수도 있고, 분산 시스템 수업의 실습 교재로 활용해도 좋다고 생각된다. 막연하게 이름만 들어봤던 빅데이터 분석 시스템이 무엇인지 궁금하다면 이 책으로 직접 몸으로 부딪혀가며 익혀보기를 추천한다.


추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책