logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

시작하세요! 하둡 프로그래밍

시작하세요! 하둡 프로그래밍

(개정 2판, 빅데이터 분석을 위한 하둡 기초부터 YARN까지)

정재화 (지은이)
위키북스
42,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
알라딘 판매자 배송 89개 1,300원 >
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

시작하세요! 하둡 프로그래밍
eBook 미리보기

책 정보

· 제목 : 시작하세요! 하둡 프로그래밍 (개정 2판, 빅데이터 분석을 위한 하둡 기초부터 YARN까지)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 데이터베이스 프로그래밍 > 데이터베이스 구축
· ISBN : 9791158390389
· 쪽수 : 760쪽
· 출판일 : 2016-05-13

책 소개

위키북스 데이터베이스 & 빅데이터 시리즈 13권. 이 책은 하둡을 처음 시작하거나 이미 하둡을 사용해본 적이 있는 개발자를 대상으로 하며, 하둡의 기본 원리부터 실무 응용까지 초보자의 입장을 배려해서 친절하고 상세하게 설명한다.

목차

[1부] 하둡 기초

▣ 01. 하둡 살펴보기
1.1 빅데이터의 시대
1.2 하둡이란?
1.3 하둡 에코시스템
1.4 하둡에 대한 오해
1.5 하둡의 과제
1.6 하둡 배포판

▣ 02. 하둡 개발 준비
2.1 실행 모드 결정
2.2 리눅스 서버 준비
2.3 하둡 다운로드
2.4 하둡 실행 계정 생성
2.5 호스트 파일 수정
2.6 인코딩 방식 설정
2.7 자바 설치
2.8 SSH 설정
2.9 하둡 압축 파일 풀기
2.10 하둡 환경설정 파일 수정
2.11 하둡 실행
2.12 예제 실행

▣ 03. 하둡 분산 파일 시스템
3.1 HDFS 기초
3.2 HDFS 아키텍처
3.3 HDFS 명령어
3.4 클러스터 웹 인터페이스
3.5 HDFS 입출력 예제

▣ 04. 맵리듀스 시작하기
4.1 맵리듀스의 개념
4.2 맵리듀스 아키텍처
4.3 WordCount 만들기

[02부] 맵리듀스 애플리케이션 개발

▣ 05. 맵리듀스 기초 다지기
5.1 맵리듀스 잡의 실행 단계
5.2 분석용 데이터 준비
5.3 항공 출발 지연 데이터 분석
5.4 항공 도착 지연 데이터 분석
5.5 사용자 정의 옵션 사용
5.6 카운터 사용
5.7 다수의 파일 출력
5.8 체인

▣ 06. 정렬
6.1 보조 정렬
6.2 부분 정렬
6.3 전체 정렬

▣ 07. 조인
7.1 조인 데이터 준비
7.2 맵 사이드 조인
7.3 리듀스 사이드 조인

[03부] 하둡 운영 및 활용

▣ 08. 맵리듀스 튜닝
8.1 셔플 튜닝
8.2 콤바이너 클래스 적용
8.3 맵 출력 데이터 압축
8.4 DFS 블록 크기 수정
8.5 JVM 재사용
8.6 투기적인 잡 실행
8.7 압축 코덱 선택

▣ 09. 하둡 운영
9.1 클러스터 계획
9.2 네임노드 HA 구성
9.3 파일 시스템 상태 확인
9.4 밸런서
9.5 HDFS 어드민 명령어 사용
9.6 데이터 저장 공간 관리
9.7 데이터노드 제거
9.8 데이터노드 추가
9.9 네임노드 장애 복구
9.10 데이터노드 장애 복구
9.11 셸 스크립트를 이용한 배포 관리
9.12 리눅스 서버 설정

▣ 10. 하둡 부가기능 활용
10.1 하둡 스트리밍
10.2 잡 스케줄러
10.3 MR유닛

▣ 11. 클라우드 환경에서의 하둡 실행
11.1 아마존 웹 서비스(AWS) 소개
11.2 AWS 가입
11.3 EC2 하둡 설정
11.4 S3 설정
11.5 EMR 사용

[04부] 하둡2와의 만남

▣ 12. 하둡2 소개
12.1 하둡2의 등장 배경
12.2 하둡2 특징
12.3 얀
12.4 네임노드 HA
12.5 HDFS 페더레이션
12.6 HDFS 스냅샷
12.7 쇼트 서킷 조회
12.8 헤테로지니어스 스토리지

▣ 13. 하둡2 설치
13.1 프로토콜 버퍼 설치
13.2 하둡2 다운로드
13.3 가상 분산 모드 설치
13.4 네임노드 HA 설치
13.5 하둡2 빌드

▣ 14. 얀 애플리케이션 개발
14.1 예제 애플리케이션 소개
14.2 클라이언트 구현
14.3 애플리케이션마스터 구현
14.4 애플리케이션 구현
14.5 애플리케이션 실행

▣ 15. 얀 아키텍처의 이해
15.1 얀 작업 흐름
15.2 얀 단계별 동작 방식
15.3 보조서비스
15.4 프리엠션
15.5 타임라인 서비스
15.6 얀 이벤트 처리 방식
15.7 아키텍처 심화 학습

▣ 16. 얀 클러스터 운영
16.1 얀 명령어
16.2 포트 설정
16.3 맵리듀스 설정
16.4 얀 스케줄러 설정
16.5 노드매니저 추가 및 제거
16.6 리소스매니저 HA 구성

[05부] 하둡 에코시스템

▣ 17. 하이브
17.1 하이브 아키텍처
17.2 하이브 설치
17.3 하이브QL
17.4 파티션 테이블
17.5 데이터 정렬
17.6 데이터 저장 포맷

▣ 18. 스쿱
18.1 스쿱 아키텍처
18.2 스쿱 설치
18.3 TPC-H 데이터 구성
18.4 데이터 임포트
18.5 데이터 익스포트

▣ 19. 타조
19.1 SQL-온-하둡이란?
19.2 SQL-온-하둡 분류 기준
19.3 타조란?
19.4 타조 설치
19.5 항공 운항 통계 데이터 분석
19.6 파일 포맷
19.7 하이브 연동

[06부] 하둡 적용 사례

▣ 20. 하둡 적용 사례
20.1 네이버: 하둡과 몽고디비를 이용한 로그 분석 시스템
20.2 아프리카TV의 추천 시스템 구축 사례
20.3 타조를 이용한 코호트 분석

[부록]

▣ A. 하둡 개발 환경 설정
A.1 이클립스
A.2 메이븐
A.3 Git

▣ B. HDFS 롤링 업그레이드
B.1 HDFS 롤링 업그레이드란?
B.2 HDFS 롤링 업그레이드 실행하기
B.3 HDFS 업그레이드 복원

▣ C. 용어 설명

▣ D. 참고문헌

저자소개

정재화 (지은이)    정보 더보기
지난 10여년 동안 SI, 대용량 분석 인프라, 웹 퍼블리싱 등 다양한 프로젝트를 경험해왔다. 현재 그루터에서 아파치 오픈 소스 프로젝트인 Tajo 개발 및 빅데이터 시스템 구축 업무를 담당하고 있다. 오픈소스 컨트리뷰션을 좋아하며, 개인 블로그(http://blrunner.com)를 통해 빅데이터 플랫폼에 관한 지식들을 공유하고 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책