책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 데이터베이스 프로그래밍 > 데이터베이스 구축
· ISBN : 9788993827897
· 쪽수 : 400쪽
· 출판일 : 2015-01-27
책 소개
목차
1장 빅데이터 개요
1.1 빅데이터 정의 및 배경
1.2 빅데이터 역사
1.3 빅데이터 기술
1.4 적용 사례
1.4.1 구글 감기 트렌드 분석
1.4.2 아마존 추천검색
1.4.3 미국 오바마 선거 캠프
1.4.4 서울시 심야버스 노선
2장 Hadoop 2.0
2.1 Hadoop 2.0 특징
2.2 HDFS 2
2.3 YARN
3장 Hadoop 2.2 개발환경
3.1 Hadoop 2.2 설치
3.1.1 SSH 설정
3.1.2 Hadoop 2.2 설치 및 환경설정
3.2 Hadoop Eclipse Plugin 설치
3.3 실습 데이터 준비
3.3.1 데이터 다운로드
3.3.2 데이터 분석
3.3.3 데이터 추출 함수
4장 HDFS 프로그래밍
4.1 HDFS 명령어 설명
4.1.1 파일 조회
4.1.2 파일 조작
4.1.3 파일 관리
4.2 HDFS API 설명
4.2.1 Configuration 클래스
4.2.2 Path 클래스
4.2.3 FileSystem 클래스
4.2.4 FileStatus 클래스
4.3 실습
5장 기본 Map-Reduce 프로그래밍
5.1 개요
5.2 API 설명
5.2.1 Map Reduce 기본 데이터 타입 클래스
5.2.2 Map 클래스
5.2.3 Reduce 클래스
5.2.4 Job 클래스
5.2.5 InputFormat 클래스
5.2.6 OutputFormat 클래스
5.3 기본 예제
5.3.1 글자수 계산 예제 (WordCount)
5.3.2 데이터 추출 실습 예제 (MapredDataETL)
6장 고급 Map-Reduce 프로그래밍
6.1 사용자 정의 복합키
6.1.1 개념
6.1.2 API 설명
6.1.3 복합키 예제 (MapredDataSort)
6.2 다중 출력
6.2.1 개념
6.2.2 API 설명
6.2.3 다중 출력 예제 (MapredDataMultioutputs)
6.3 Join
6.3.1 개념
6.3.2 API 설명
6.3.3 Join 예제 (MapredDataJoin)
6.4 Chain Map/Reduce
6.4.1 개념
6.4.2 API 설명
6.4.3 Chain Map Reduce 예제 (MapredDataChain)
7장 Hive 프로그래밍
7.1 개요 및 아키텍처
7.1.1 Hive 개요 및 아키텍처
7.1.2 설치 및 Eclipse 연동
7.2 HiveQL
7.2.1 데이터 형
7.2.2 데이터 정의 언어
7.2.3 데이터 조작 언어
7.2.4 데이터 쿼리 언어
7.3 실습
8장 NoSQL 등장
8.1 NoSQL의 정의와 개요
8.2 NoSQL의 데이터 모델 및 종류
8.2.1 Key-Value 형
8.2.2 Column 형
8.2.3 Document 형
9장 HBase 프로그래밍
9.1 HBase 개요
9.1.1 HBase 개념 및 구조
9.1.2 HBase 설치 및 설정
9.1.3 기본 관리
9.2 HBase Java API
9.2.1 기본 API 설명
9.2.2 관리 기능 API 설명
9.2.3 Map/Reduce API 설명
9.3 HBase Java 예제
9.3.1 HBase Java API 예제 1
9.3.2 HBase MapReduce 예제 1
9.3.3 HBase MapReduce 예제 2
10장 MongoDB 프로그래밍
10.1 MongoDB 개요
10.1.1 MongoDB 개념 및 구조
10.1.2 MongoDB 설치 및 설정
10.1.3 기본 관리
10.2 Mongo Java API
10.2.1 API 설명
10.2.2 Mongo Java API 예제 1 (MongoJavaClient)
10.2.3 Mongo Java API 예제 2 (MongoJavaMapred)
10.3 Mongo Hadoop API
10.3.1 API 설명
10.3.2 Mongo Hadoop API 예제 1 (MongoHadoopDBInsert)
저자소개
리뷰
책속에서
현재 차세대 정보통신 기술의 핵심 키워드의 하나로 빅 데이터를 거론하는 것은 너무 당연한 선택일 것이다. 비단 우리나라뿐만 아니라 전 세계의 정보통신 분야에서도 빅데이터는 가장 주목받는 트렌드 중 하나이다. 어느 정보통신 전문매체에 나온 기사에서 미국 어느 백화점의 빅데이터 사례를 읽어 본 적이 있다.
이 백화점은 고객들의 동선 파악은 물론 카메라를 통하여 고객의 눈동자 움직임까지 데이터로 수집하고 빅데이터 시스템에서 분석하여 이를 제품 전시에 활용한다는 내용이었다. 국내에서도 서울시의 이동통신 빅데이터를 활용한 교통시스템 분석은 우리에게도 익숙한 성공사례이다. 이런 빅데이터 기술의 성장은 이 책의 내용에서도 언급하겠지만 미국 Google 사의 Google File System과 Map-Reduce 논문으로 시작하여 아파치 재단의 Hadoop 이라는 오픈소스의 보급이 가능했기 때문일 것이다. 지금도 전 세계의 많은 빅데이터 기술 업체들은 더 편리하고 진보된 오픈 소스 형태의 프로젝트를 선보이고 있다. 많은 국내 기업들도 다양한 빅데이터 관련 프로젝트를 진행하고 있다. 그루터의 타조(Tajo) 프로젝트, KT 넥스알의 NDAP 플랫폼, 클라우다인의 플라밍고 프로젝트 등이 있다.(이하 생략)
- 서문 중에서