책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 데이터베이스 프로그래밍 > 데이터베이스 구축
· ISBN : 9788998139759
· 쪽수 : 692쪽
· 출판일 : 2014-12-31
책 소개
목차
[1부] 하둡 기초
▣ 01장: 하둡 살펴보기
1.1 빅데이터의 시대
1.2 하둡이란?
1.3 하둡 에코시스템
1.4 하둡에 대한 오해
1.5 하둡의 과제
1.6 하둡 배포판 살펴보기
▣ 02장: 하둡 개발준비
2.1 실행 모드 결정
2.2 리눅스 서버 준비
2.3 하둡 다운로드
2.4 하둡 실행 계정 생성
2.5 호스트 파일 수정하기
2.6 인코딩 방식 설정
2.7 자바 설치
2.8 SSH 설정
2.9 하둡 압축 파일 풀기
2.10 하둡 환경설정 파일 수정
2.11 하둡 실행
2.12 예제 실행하기
▣ 03장: 하둡 분산 파일 시스템
3.1 HDFS 기초
3.2 HDFS 아키텍처
3.3 HDFS 명령어 사용하기
3.4 클러스터 웹 인터페이스
3.5 HDFS 입출력 예제
▣ 04장: 맵리듀스 시작하기
4.1 맵리듀스의 개념
4.2 맵리듀스 아키텍처
4.3 WordCount 만들기
[2부] 맵리듀스 애플리케이션 개발
▣ 05장: 맵리듀스 기초 다지기
5.1 맵리듀스 잡의 실행 단계
5.2 분석용 데이터 준비
5.3 항공 출발 지연 데이터 분석
5.4 항공 도착 지연 데이터 분석
5.6 카운터 사용
5.7 다수의 파일 출력
5.8 체인(Chain)
▣ 06장: 정렬 구현하기
6.1 보조 정렬
6.2 부분 정렬(Partial Sort)
6.3 전체 정렬(Total Sort)
▣ 07장: 조인 구현하기
7.1 조인 데이터 준비
7.2 맵-사이드 조인
7.3 리듀스-사이드 조인
[3부] 하둡 운영 및 활용
▣ 08장: 맵리듀스 튜닝하기
8.1 셔플 튜닝
8.2 콤바이너 클래스 적용
8.3 맵 출력 데이터 압축
8.4 DFS 블록 크기 수정
8.5 JVM 재사용
8.6 투기적인 잡 실행
8.7 압축 코덱 선택
▣ 09장: 하둡 운영하기
9.1 클러스터 계획하기
9.2 네임노드 HA 구성
9.3 파일 시스템 상태 확인
9.4 밸런서
9.5 HDFS 어드민 명령어 사용
9.6 데이터 저장 공간 관리
9.7 데이터노드 제거
9.8 데이터노드 추가
9.9 네임노드 장애 복구
9.10 데이터노드 장애 복구
9.11 셸 스크립트를 이용한 배포 관리
▣ 10장: 하둡 부가기능 이용하기
10.1 하둡 스트리밍
10.2 잡 스케줄러
10.3 MR유닛
▣ 11장: 클라우드 환경에서 하둡 실행하기
11.1 아마존 웹 서비스(AWS) 소개
11.2 AWS 가입
11.3 EC2 하둡 설정
11.4 S3 설정
11.5 EMR 사용
[4부] 하둡2와의 만남
▣ 12장: 하둡2 소개
12.1 하둡2의 등장 배경
12.2 하둡2 특징
12.3 얀
12.4 네임노드 HA
12.5 HDFS 페더레이션
12.6 HDFS 스냅샷
12.7 단락 조회
▣ 13장: 하둡2 설치
13.1 프로토콜 버퍼 설치
13.2 하둡2 다운로드
13.3 가상 분산 모드 설치하기
13.4 네임노드 HA 설치
13.5 하둡2 빌드
▣ 14장: 얀 애플리케이션 개발하기
14.1 예제 애플리케이션 소개
14.2 클라이언트 구현
14.3 애플리케이션마스터 구현
14.4 애플리케이션 구현
14.5 애플리케이션 실행
▣ 15장: 얀 아키텍처 이해하기
15.1 얀 작업 흐름
15.2 얀 단계별 동작 방식
15.3 보조서비스
15.4 얀 이벤트 처리 방식
15.5 아키텍처 심화 학습
▣ 16장: 얀 클러스터 운영하기
16.1 얀 명령어 사용하기
16.2 포트 설정
16.3 맵리듀스 설정
16.4 얀 스케줄러 설정
16.5 노드매니저 추가 및 제거
16.6 리소스매니저 HA 구성하기
[5부] 하둡 에코 시스템
▣ 17장: 하이브 활용하기
17.1 하이브 아키텍처
17.2 하이브 설치
17.3 하이브QL
17.4 파티션 테이블
17.5 데이터 정렬
17.6 데이터 저장 포맷
▣ 18장: 스쿱
18.1 스쿱 아키텍처
18.2 스쿱 설치하기
18.3 TPC-H 데이터 구성하기
18.4 데이터 임포트
18.5 데이터 익스포트
▣ 19장: 타조 활용하기
19.1 SQL-온-하둡이란?
19.2 SQL-온-하둡 분류 기준
19.3 타조란?
19.4 타조 설치하기
19.5 항공 운항 통계 데이터 분석하기
19.6 파일 포맷
19.7 하이브 연동
[6부] 하둡 적용 사례
▣ 20장: 하둡 적용 사례
20.1 네이버: 하둡과 몽고디비를 이용한 로그 분석 시스템
20.2 아프리카TV의 추천 시스템 구축 사례
20.3 타조를 이용한 코호트 분석
[부록]
▣ A: 하둡 개발환경 설정하기
A.1 이클립스
A.2 메이븐
A.3 Git
▣ B: 용어설명
▣ C: 참고문헌