logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

Hadoop 완벽 가이드

Hadoop 완벽 가이드

톰 화이트 (지은이), 김우현, 심탁길 (옮긴이)
한빛미디어
40,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

Hadoop 완벽 가이드
eBook 미리보기

책 정보

· 제목 : Hadoop 완벽 가이드 
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788979147469
· 쪽수 : 616쪽
· 출판일 : 2010-05-30

책 소개

하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 저술한 책으로, 하둡을 가장 완벽하게 다루고 있다. 저자는 하둡 창시자인 더그 커팅을 비롯한 각기 전문가의 강력한 조언을 받았고 이를 충실하게 반영했다. 이 책은 하둡은 물론이고 하둡과 연동해서 사용할 수 있는, 아파치 하둡 프로젝트의 서브 프로젝트인 피그, 주키퍼, HBase, 하이브, 스쿱, 에이브 등에 대해서도 다룬다. Last.fm, 페이스북, 랙페이스의 하둡 활용 사례를 통해 어떻게 하둡을 활용해야 하는지 배울 수 있다. 본 한글판은 역자주를 통해 하둡 최신 정보를 반영

목차

1장 하둡과의 만남
1 데이터!
2 데이터 저장소와 분석
3 다른 시스템과의 비교
RDBMS
그리드 컴퓨팅
자발적 컴퓨팅(Volunteer Computing)
4 하둡의 역사
5 아파치 하둡 프로젝트

2장 맵리듀스
1 기상 데이터셋
데이터 포맷
2 유닉스 도구로 데이터 분석하기
3 하둡으로 데이터 분석하기
맵과 리듀스
자바 맵리듀스
4 분산형으로 확장하기
데이터 흐름
컴바이너 함수
분산 맵리듀스 잡 실행하기
5 하둡 스트리밍
루비
파이썬
하둡 파이프
컴파일 및 실행

3장 하둡 분산 파일시스템
1 HDFS 설계
2 HDFS 개념
블록
네임노드와 데이터노드
3 명령행 인터페이스
기본적인 파일시스템 연산
4 하둡 파일시스템
인터페이스
5 자바 인터페이스
하둡 URL로부터 데이터 읽기
파일시스템 API를 사용하여 데이터 읽기
데이터 쓰기
디렉터리
파일시스템에 질의하기
데이터 삭제
6 데이터 흐름
파일 읽기 해부
파일 쓰기 상세
일관성 모델
7 distcp 병렬 복사
HDFS 클러스터 균형 유지
8 하둡 아카이브
하둡 아카이브 사용하기
제약 사항

4장 하둡 I/O
1 데이터 무결성
HDFS와 데이터 무결성
LocalFIleSystem
ChecksumFileSystem
2 압축
코덱
압축과 입력 분할
맵리듀스에서 압축 사용하기
3 직렬화
Writable 인터페이스
Writable 클래스
맞춤형 Writable을 구현하기
직렬화 프레임워크
4 파일 기반 데이터 구조
SequenceFile
MapFile

5장 맵리듀스 프로그래밍
1 환경설정파일 API
리소스 결합하기
변수 확장
2 개발환경 설정하기
환경설정파일 관리하기
GenericOptionsParser, Tool, ToolRunner
3 유닛 테스트 작성하기
매퍼
리듀서
4 로컬에서 실행하기
로컬 잡 실행하기
드라이버 테스트하기
5 클러스터에서 실행하기
패키징
잡 배포하기
맵리듀스 웹 UI
결과 얻기
잡 디버깅
원격 디버거 사용하기
6 잡 튜닝하기
태스크 프로파일하기
7 맵리듀스 작업 흐름
맵리듀스 잡으로 문제를 분해하기
종속적인 잡 실행

6장 맵리듀스 작동 방법
1 맵리듀스 잡 실행 상세분석
잡 제출
잡 초기화
태스크 할당
태스크 실행
진행 상황과 상태 갱신
잡 완료
2 실패
태스크 실패
태스크트래커 실패
잡트래커 실패
3 잡 스케줄링
페어 스케줄러
4 셔플과 정렬
맵 과정
리듀스 관점
환경설정 튜닝
5 태스크 실행
투기적 실행
태스크 JVM 재사용
비정상 레코드 생략하기
태스크 실행 환경

7장 맵리듀스 타입과 포맷
1 맵리듀스 타입
기본적인 맵리듀스 잡
2 입력 포맷
입력 스플릿과 레코드
텍스트 입력
바이너리 입력
다중 입력
데이터베이스 입력과 출력
3 출력 포맷
Text Output
바이너리 출력
Multiple Outputs
느린 출력
Database Output

8장 맵리듀스 기능
1 카운터
내장 카운터
사용자 정의 자바 카운터
사용자 정의 스트리밍 카운터
2 정렬
준비
부분 정렬
전체 정렬
보조 정렬
3 조인
맵-사이드 조인
리듀스-사이드 조인
4 사이드 데이터 분배
잡 환경설정파일 사용
분산 캐시
5 맵리듀스 라이브러리 클래스

9장 하둡 클러스터 설정
1 클러스터 명세
네트워크 위상
2 클러스터 설정 및 설치
자바 설치
하둡 사용자 생성
하둡 설치
설치 점검하기
3 SSH 설정
4 하둡 환경 설정
환경 설정 파일 관리
개발 환경 설정
중요한 하둡 데몬 속성
하둡 데몬 주소와 포트 번호
다른 하둡 속성들
5 설치 후
6 하둡 클러스터 벤치마킹
하둡 밴치마크
사용자 잡
7 하둡 클라우드
아마존 EC2의 하둡

10장 하둡 관리
1 HDFS
영속적인 데이터 구조
안전모드
감사 로깅
도구
2 모니터링
로깅
매트릭스
자바 관리 익스텐션
3 관리
일상적인 관리 절차
노드 위임과 해제
업그레이드

11장 피그
1 피그의 설치 및 실행
실행 유형
피그 프로그램 실행
그런트
피그 라틴 편집기
2 예제
예제 생성
3 데이터베이스와 비교
4 피그 라틴
구조
문장
표현
타입
스키마
함수
5 사용자 정의 함수
필터 UDF
평가 UDF
로드 UDF
6 데이터 처리 연산자
데이터 로드 및 저장
데이터 필터링
데이터 분류 및 조인
데이터 정렬
데이터 결합 및 분리
7 실전 피그 사용
병렬 처리
파라미터 대체

12장 HBase
1 HBasics
배경
2 개념
짧은 데이터 모델 여행
구현
3 설치
테스트 드라이브
4 클라이언트
자바
REST와 Thrift
5 예제
스키마
데이터 적재
웹 쿼리
6 HBase와 RDBMS
성공적인 서비스
HBase
사용 사례: streamy.com의 HBase
7 연습
버전
사랑과 증오: HBase와 HDFS
사용자 인터페이스
매트릭스
스키마 설계

13장 주키퍼
1 주키퍼의 설치와 실행
2 예제
주키퍼를 이용한 그룹 멤버쉽
그룹 생성
그룹 가입
그룹 멤버 목록화
그룹 삭제
3 주키퍼 서비스
데이터 모델
연산
구현
일관성
세션
4 주키퍼로 응용프로그램 구현하기
환경 설정 서비스
탄력적인 주키퍼 응용프로그램
락 서비스
더 많은 분산 데이터 구조와 프로토콜들
5 주키퍼 실 서비스
탄력성과 성능
환경 설정

14장 사례 연구
1 Last.fm의 하둡 사용 사례
Last.fm: 소셜 음악 혁명
Last.fm과 하둡
하둡으로 차트 생성하기
트랙 통계 프로그램
요약
2 페이스북의 하둡과 하이브
소개
페이스북과 하둡
가상의 사용 사례 연구
하이브
문제점과 향후의 작업
3 너치 검색 엔진
배경
데이터 구조
너치의 하둡 데이터 처리에 관한 선택 예제
요약
5 랙스페이스에서의 로그 처리
요구 사항/ 문제
간략한 역사
하둡 선택
수집과 저장소
로그에 대한 맵리듀스
6 캐스케이딩
필드, 튜플, 파이프
연산
탭, 스킴, 플로우
캐스케이딩의 실제 예제
유연성
쉐어디스에서의 하둡과 캐스케이딩
요약
7 아파치 하둡의 테라바이트 정렬

부록A 아파치 하둡 설치하기
1 준비사항
2 설치
3 환경 설정

부록B 클라우데라의 하둡 배포판
1 준비사항
2 독립 실행 모드
3 의사 분산 모드
4 완전 분산 모드
5 하둡 관련 패키지

부록C NCDC 기상 데이터의 준비

저자소개

톰 화이트 (지은이)    정보 더보기
2007년 2월부터 아파치 하둡 커미터가 되었고, 이후 아파치 소프트웨어 재단의 일원이 되었다. 현재 하둡에 대한 지원과 트레이닝을 제공하는 회사인 클라우데라에서 일하고 있다. 그전에는 독립적인 하둡 고문으로서 하둡을 설치, 사용, 확장하려는 회사와 일했다. oreilly.com, java.net, IBM developerWorks에 수많은 글을 썼으며 몇몇 컨퍼런스에서 하둡에 관해 연설했다. 케임브리지 대학교에서 수학 학사학위를 취득하고, 영국 리즈Leeds 대학교에서 과학 철학 석사학위를 취득하였다.
펼치기
김우현 (옮긴이)    정보 더보기
안동사범학교 본과 졸업 한국방송통신대학 행정학과 졸업 영남대학교 교육대학원 졸업 교육공무원 (43년 재직, 정년퇴임) 전, 장학관 (안동 및 경주교육청) 전, 학교장 (구미신평중 외 2개교) 현, 한국침구사협회 회원 현, 대한민국건국회 회원 침구전문 자격 약용식물관리사 자격 체조심판자격 유도, 합기도, 검도 등 (초단) [저서 및 논문] 김우현 동요작곡집 외 작곡집 5회 출판, 농악교본, 경기민요해설집, 전통음악의 원리와 교육, 교가 작곡(상모중 외 200여개 학교), 각종 교육연구대회(교육부 장관상) 12차례 수상 [표창] 황조근정훈장(대통령) 환경교육 공로 표창(환경부장관) 각종 분야 교육부장관상(3회) 도교육감 및 각종 표창(30여회)
펼치기
심탁길 (옮긴이)    정보 더보기
삼성SDS, NHN, SK C&C 등에서 개발팀을 이끌며 클라우드 컴퓨팅 서비스 개발, 빅데이터 분석 등의 업무를 수행했다. 현재 틈틈이 야간에 시간을 내서 클라우드와 빅데이터 분야의 오픈소스 프로젝트를 준비 중이다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책