logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

엔터프라이즈 데이터 레이크 구축

엔터프라이즈 데이터 레이크 구축

(람다 아키텍처 기반의 엔터프라이즈 데이터 레이크 구축 가이드, 2019년 대한민국학술원 우수학술도서 선정도서)

톰시 존, 판카이 미스라 (지은이), 양원국, 우성한, 이영호 (옮긴이)
에이콘출판
40,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

엔터프라이즈 데이터 레이크 구축
eBook 미리보기

책 정보

· 제목 : 엔터프라이즈 데이터 레이크 구축 (람다 아키텍처 기반의 엔터프라이즈 데이터 레이크 구축 가이드, 2019년 대한민국학술원 우수학술도서 선정도서)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791161751399
· 쪽수 : 688쪽
· 출판일 : 2018-04-30

책 소개

디지털 트랜스포메이션을 추구하는 기업이 빅데이터 가치 실현에 필요한 기업 내 단일 저장소인 '데이터 레이크'를 구축할 수 있도록 안내한다. 데이터에 대한 이해부터 아키텍처 구축에 필요한 코드까지 모든 과정을 망라해, 데이터 레이크 구축에 어려움을 겪는 기업에게 도움이 될 것이다.

목차

1부. 개요

1장. 데이터에 대한 소개
__데이터 탐색
__엔터프라이즈 데이터란?
__엔터프라이즈 데이터 관리
__빅데이터의 개념
__데이터의 연관성
__데이터의 품질
__데이터는 어디에 있을까?
__엔터프라이즈 환경의 현재 상태
__기업의 디지털 트랜스포메이션은
__데이터 레이크 사용 사례 이해
__요약


2장. 데이터 레이크의 개념
__데이터 레이크란 무엇인가?
__데이터 레이크는 기업을 어떻게 도울 수 있을까?
__데이터 레이크는 어떻게 동작하는가?
__데이터 레이크와 데이터 웨어하우스의 차이점
__데이터 레이크 구축을 위한 접근법
__람다 아키텍처 기반의 데이터 레이크
__요약


3장. 람다 아키텍처 패턴
__람다 아키텍처란?
__람다 아키텍처의 역사
__람다 아키텍처의 원칙
__람다 아키텍처의 컴포넌트
__람다 아키텍처의 완전한 동작 방식
__람다 아키텍처의 장점
__람다 아키텍처의 단점
__람다 아키텍처 관련 기술 개요
__람다 아키텍처 응용
__람다 아키텍처의 실제 활용 사례
__카파 아키텍처
__요약


4장. 데이터 레이크에 적용된 람다 아키텍처
__하둡 배포판
__엔터프라이즈 환경의 빅데이터 체계를 위한 선택 기준
__데이터 처리를 위한 배치 계층
__제공 계층
__요약


2부. 데이터 레이크의 기술적 구축 단위

5장. 아파치 스쿱을 사용한 배치 데이터 획득
__데이터 레이크의 배경: 데이터 획득
__아파치 스쿱인 이유
__스쿱으로 작업
__스쿱 커넥터
__스쿱의 HDFS 지원
__스쿱 작동 예
__스쿱을 사용해야 하는 경우
__스쿱을 사용하지 말아야 하는 경우
__실시간 스쿱: 가능한가?
__대안
__요약


6장. 아파치 플룸을 사용한 스트림 데이터로부터 데이터 획득
__데이터 레이크 관점에서 데이터 획득
__플룸을 선택한 이유
__플룸 아키텍처 원칙
__플룸 아키텍처
__플룸 이벤트: 스트림 데이터
__플룸 에이전트
__플룸 소스
__플룸 채널
__플룸 싱크
__플룸 설정
__플룸 트랜잭션 관리
__기타 플룸 컴포넌트
__문맥 라우팅
__플룸 구동 예제
__플룸을 사용할 때
__플룸을 사용하지 말아야 할 때
__다른 선택 사항
__요약


7장. 아파치 카프카를 사용한 메시지 전달 계층
__데이터 레이크의 상황: 메시지 전달 계층
__왜 아파치 카프카인가?
__카프카 구조
__기타 카프카 컴포넌트
__카프카 프로그래밍 인터페이스
__프로듀서와 컨슈머 신뢰성
__카프카 보안
__메시지 중심 미들웨어로서의 카프카
__카프카의 수평 확장 아키텍처
__카프카 커넥트
__카프카 동작 예제
__카프카를 사용할 때
__카프카를 사용하지 말아야 할 때
__기타 옵션
__요약


8장. 아파치 플링크를 사용한 데이터 처리
__데이터 레이크의 상황: 데이터 흡수 계층
__아파치 플링크를 사용하는 이유
__플링크의 동작 방식
__플링크 API
__플링크 동작 예제
__플링크를 사용해야 하는 경우
__플링크를 사용하면 안 되는 경우
__플링크의 대안
__요약


9장. 아파치 하둡을 사용한 데이터 저장소
__데이터 레이크의 상황: 데이터 저장 및 람다 배치 계층
__하둡을 사용하는 이유
__하둡의 동작 방식
__하둡 에코시스템
__하둡 배포판
__HDFS와 데이터 형식
__근실시간 애플리케이션을 위한 하둡
__하둡 배포 모드
__하둡 동작 예제
__하둡을 사용하면 안 되는 경우
__기타 하둡 처리 옵션
__요약


10장. 일래스틱서치 색인 데이터 저장소
__데이터 레이크의 상황: 데이터 저장소와 람다 속도 계층
__일래스틱서치란?
__일래스틱서치를 사용하는 이유
__일래스틱서치의 동작 방식
__엘라스틱 스택
__엘라스틱 클라우드
__일래스틱서치 DSL(쿼리 DSL)
__일래스틱서치의 노드
__일래스틱서치와 관계형 데이터베이스
__일래스틱서치 에코시스템
__일래스틱서치 배포 옵션
__일래스틱서치 클라이언트
__빠른 스트리밍 계층을 위한 일래스틱서치
__일래스틱서치 데이터 소스
__콘텐츠 색인을 위한 일래스틱서치
__일래스틱서치와 하둡
__일래스틱서치 동작 예제
__일래스틱서치를 사용해야 하는 경우
__일래스틱서치를 사용하면 안 되는 경우
__일래스틱서치의 다른 대안
__요약


3부. 모두 통합

11장. 데이터 레이크 컴포넌트 연동
__데이터 레이크를 어디까지 구현했을까?
__데이터 레이크의 핵심 아키텍처 원칙
__엔터프라이즈 환경의 데이터 레이크가 직면한 과제
__데이터 레이크에 기대하는 것
__다른 활동을 위한 데이터 레이크
__데이터 저장소에 대해 자세히 알아보기
__데이터 처리에 대해 자세히 알아보기
__데이터 보안에 대한 생각
__데이터 암호화에 대한 생각
__데이터 관리 및 거버넌스
__데이터 감사에 대한 생각
__데이터 추적성에 대한 생각
__제공 계층 더 알아보기
__요약


12장. 데이터 레이크 활용 방법 제안
__엔터프라이즈 환경에 사이버 보안 적용
__기업에 대한 고객 인식 알아내기
__효율적인 창고 관리
__브랜드 개발과 기업 마케팅
__더 높은 수준의 개인화 구현
__IoT 데이터 분석 능력 갖추기
__더 실용적이고 유용한 데이터 기록 저장소
__기존 데이터 웨어하우스 인프라 보완
__통신사의 보안 및 규제 준수
__요약

저자소개

톰시 존 (지은이)    정보 더보기
인도의 케랄라 출신으로 아랍에미리트의 두바이에 거주하고 있는 엔지니어링 분야 전문가(BTech)이자 다양한 산업 분야에서 14년 이상의 경력을 쌓은 엔터프라이즈 자바(Java) 전문가다. 오라클 주식회사(Oracle Corporation)와 언스트&영(Ernst&Young)에서 근무했고, 현재 에미레이트 IT 그룹(Emirates Group IT)에서 코어 아키텍처 팀의 수석 아키텍터다. 엔터프라이즈급 애플리케이션 개발을 전문으로 하며, 조직이 기업 표준으로써 신기술을 통합할 수 있도록 최고 멘토 및 전도사로 활동 중이다. 기술 전도사로서 주니어 개발자와 엔지니어의 멘토로 가까이서 협력하고, 웹과 미들웨어부터 다양한 영구 저장소에 이르기까지 여러 주제에 대한 기술 전도사로서 다양한 포럼에서 강연한다.
펼치기
판카이 미스라 (지은이)    정보 더보기
공학을 전공했으며, 여러 비즈니스 영역 및 기술 분야에서 16년 이상의 경력을 가진 기술 분야의 전도사다. 여러 조직에서 근무했던 경력이 있고, 2015년부터 에미레이트 IT 그룹에서 근무했다. 멀티스택 솔루션 설계와 구축을 전문으로 한다. 인도의 기술 포럼에서 강연을 해왔고, 대용량, 근 실시간 데이터 처리 및 분석을 하는 확장형 아키텍처 제품을 만들어왔다.
펼치기
우성한 (옮긴이)    정보 더보기
현재 빅데이터 솔루션 전문업체인 KT NexR의 책임 연구원으로 재직 중이다. 다수의 기업에서 모바일 게임, SNS 서비스, 결제 시스템 등 다양한 S/W 분야의 개발 경험이 있으며, 2011년 빅데이터의 매력에 빠져 빅데이터 분야의 오픈소스들을 다루기 시작했다. KT NexR의 대표적인 빅데이터 분석 솔루션 NDAP 개발에 참여했으며, 지금은 아키텍처 설계부터 프론트엔드/백엔드 개발까지 수행하는 풀 스택 엔지니어로서 실시간 빅데이터 처리 및 분석 솔루션인 Lean Stream 개발에 참여하고 있다.
펼치기
이영호 (옮긴이)    정보 더보기
현재 kt NexR에서 R&D2 팀장을 맡고 있습니다. 시스템 통합과 빅데이터 솔루션 개발을 수행하던 멤브로스 대표를 역임했습니다. kt NexR에 빅데이터 엔지니어로 입사한 후 살아 있는 빅데이터를 경험했습니다. 다수의 배치/실시간 빅데이터 프로젝트에 참여했으며, 기술서적 번역과 빅데이터 강의를 즐깁니다. 현재 팀원들과 함께 아파치 스파크 기반의 빅데이터 처리 솔루션을 개발하고 있으며 빅데이터의 대중화에 큰 관심을 가지고 있습니다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책