책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론
· ISBN : 9788960777460
· 쪽수 : 460쪽
책 소개
목차
1장 무엇을 이야기할 것인가
__빅데이터 처리
__아마존 웹 서비스를 이용한 클라우드 컴퓨팅
__정리
2장 하둡의 설정과 실행
__로컬 우분투 호스트의 하둡
__일래스틱 맵리듀스 사용하기
__로컬 하둡과 EMR 하둡의 비교
__정리
3장 맵리듀스의 이해
__키/값 쌍
__맵리듀스를 위한 하둡 자바 API
__맵리듀스 프로그램 만들기
__WordCount 동작과정을 살펴보기
__하둡 특화된 데이터 타입들
__입력/출력
__정리
4장 맵리듀스 프로그램 개발
__하둡에서 자바 이외의 언어 활용
__대규모 데이터 분석
__카운터와 상태정보, 그 외 출력
__정리
__쉬운, 고급, 그리고 그 사이
5장 고급 맵리듀스 기술
__조인
__그래프 알고리즘
__언어 독립적인 자료 구조
__정리
6장 하둡의 내구성
__장애
__정리
7장 클러스터 운영
__EMR 사용자를 위한 참고 사항
__하둡 설정 속성
__클러스터 셋업
__클러스터 접근 제어
__네임노드 관리
__HDFS 관리
__맵리듀스 관리
__확장
__정리
8장 하이브를 써서 관계형 관점으로 데이터 바라보기
__하이브 개요
__하이브 셋업
__하이브 사용
__아마존 웹 서비스상의 하이브
__정리
9장 관계형 데이터베이스와 연동
__주요 데이터 흐름
__MySQL 구성
__하둡으로 데이터 불러오기
__하둡에서 데이터 내보내기
__AWS
__정리
10장 플룸을 이용한 데이터 수집
__AWS에 관한 노트
__데이터, 데이터, 온 세상에 데이터.....
__아파치 플룸 소개
__더 큰 그림
__정리
11장 다음 선행지
__책에서 다룬 내용과 다루지 않은 내용
__다가오는 하둡의 변화
__다양한 하둡 배포판
__다른 아파치 프로젝트
__다양한 하둡 프로그래밍 방식
__AWS 자원
__정보의 원천
__정리
책속에서
★ 옮긴이의 말 ★
프로그래머들 사이에서는 ‘백문이 불여일견’ 을 살짝 바꾼 ‘백문이 불여일타’라는 말이 유명하다. ‘백 번 보는 것보다 한번 쳐 보는 것이 낫다’라는 의미이다. 특히 언어나 프레임워크를 익힐 때에 마음에 와 닿는 말이다. 깊이 있게 활용하려면 물론 기반이 되는 이론이나 내부 구조를 도구를 잘 알아야 한다. 하지만, 도구를 처음 익힐 땐 직접 몸으로 부딪혀 보고 손으로 실습하며 문제를 풀어 보아야 이 도구가 어떤 문제를 푸는 데 유용하고, 어떤 식으로 활용하는가 하는 점을 배울 수 있다. 그런 점에서 이 책은 굉장히 실용적인 접근을 한다. 각 장마다 제일 먼저 필수적인 개념을 설명하고, 이해하기 쉬운 예제, 실습을 통해 설명한 개념을 활용하는 방법을 익힐 수 있게 한다. 그 이후에 예제와 실습에 관한 내용을 상세하게 설명해 주고, 도전 과제를 제시한다. 얇고 쉬운 책이지만, 빅데이터의 개념과 하둡 파일 시스템, 맵리듀스 프로그래밍, 하둡 클러스터 설치와 운용에 관한 내용이 모두 담겨 있다.
그 뿐만이 아니라, 데이터 수집이나 기존 시스템과의 연계를 위한 하둡 생태계의 주요 오픈소스에 관한 설명도 빠뜨리지 않았다. 아마존의 클라우드 서비스를 이용하는 실습도 있으니, 클라우드에 관심 있는 독자들은 더 재미있게 공부할 수 있다.
이 책은 혼자 공부하는 자습서로 쓸 수도 있고, 분산 시스템 수업의 실습 교재로 활용해도 좋다고 생각된다. 막연하게 이름만 들어봤던 빅데이터 분석 시스템이 무엇인지 궁금하다면 이 책으로 직접 몸으로 부딪혀가며 익혀보기를 추천한다.