logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

Pig를 이용한 빅데이터 처리 패턴

Pig를 이용한 빅데이터 처리 패턴

프라딥 파수풀레티 (지은이), 이미정 (옮긴이)
  |  
에이콘출판
2014-09-26
  |  
30,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

Pig를 이용한 빅데이터 처리 패턴

책 정보

· 제목 : Pig를 이용한 빅데이터 처리 패턴 
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 데이터베이스 프로그래밍 > 데이터베이스 구축
· ISBN : 9788960776081
· 쪽수 : 360쪽

책 소개

acorn+PACKT 시리즈. 이 책은 빅데이터 분석 능력을 경험할 수 있게 해주는 실용서다. 피그 언어에 대한 설명뿐만 아니라 피그가 사용되는 패턴, 그리고 하둡 생태계에 존재하는 여러 툴들과 함께 적용된 사례를 자세히 설명하고 있다.

목차

1장 피그 디자인 패턴의 기초
__디자인 패턴의 이해
__피그 디자인 패턴의 범위
__하둡에 관한 쉽고 자세한 설명: 지침서
____전사적 IT 환경
____분산 시스템의 일반적인 문제
____하둡의 출현
____하둡 파헤치기
____하둡 분산 파일 시스템
________HDFS 설계 목적
________HDFS 동작
____맵리듀스
________맵리듀스가 동작하는 방법
________맵리듀스 내부
__피그: 대략적인 개요
____피그의 기초
____전사적 IT 환경과 피그 관련성
____피그 동작: 개요
________피그 작동
________사용 사례
________전체 코드
________데이터셋
__코드를 이용한 피그의 이해
____피그의 확장성
____코드에 사용된 연산자
____EXPLAIN 연산자
____피그의 데이터 모델
________기본형
________복합형
__정리

2장 데이터 유입과 배출 패턴
__데이터 유입과 배출 환경
__전사적 IT 환경에서 사용되는 데이터의 유형들
__다중정형화 데이터를 위한 유입, 배출 패턴
____로그 유입을 위해 고려해야 할 사항
________아파치 로그 유입 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
____커스텀 로그 유입 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
____이미지 유입과 배출 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
__NoSQL 데이터에 대한 유입과 배출 패턴
____몽고DB 유입과 배출 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
____H베이스 유입과 배출 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
__정형 데이터에 대한 유입과 배출 패턴
____하이브 유입과 배출 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
__반정형화 데이터에 대한 유입과 배출 패턴
____메인프레임 유입 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
____XML 유입과 배출 패턴
________배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
____코드 일부
________결과
________추가 정보
__JSON 유입과 배출 패턴
____배경
________패턴을 사용하는 이유
________사용 사례
________패턴 구현
________코드 일부
________결과
________추가 정보
__정리

3장 데이터 프로파일링 패턴
__빅데이터에 대한 데이터 프로파일링
____빅데이터 프로파일링 관점
____빅데이터 프로파일링을 위한 표본추출 시 고려사항
________피그의 표본추출 지원
__데이터 프로파일링에서 피그 사용 기초
__데이터 타입 추론 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
________피그 스크립트
________자바 UDF
____결과
____추가 정보
__기본 통계 프로파일링 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
________피그 스크립트
________매크로
____결과
____추가 정보
__패턴 매칭 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
________피그 스크립트
________매크로
____결과
____추가 정보
__문자열 프로파일링 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
________피그 스크립트
________매크로
____결과
____추가 정보
__비정형 텍스트 프로파일링 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
________피그 스크립트
________형태소분석을 위한 자바 UDF
________TF-IDF 생성을 위한 자바 UDF
____결과
____추가 정보
__정리

4장 데이터 검증과 정제 패턴
__빅데이터를 위한 데이터 검증과 정제
__검증과 정제를 위한 피그 선택
__제약조건 검증과 정제 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__정규표현식 검증과 정제 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
__오류 데이터 검증과 정제 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__비정형 텍스트 데이터 검증과 정제 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__정리

5장 데이터 변형 패턴
__데이터 변형
__구조 변형 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__데이터 정규화 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__데이터 통합 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__집계 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__데이터 일반화 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__정리

6장 데이터 축소 패턴
__데이터 축소: 개요
__빅데이터를 위한 데이터 축소에서 고려해야 할 사항
__차원 축소: 주성분 분석 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
________PCA 구현의 한계
____코드 일부
____결과
____추가 정보
__수치 축소 히스토그램 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__수치 축소 표본추출 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____추가 정보
__수치 축소 클러스터링 디자인 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__정리

7장 고급 패턴과 향후 작업
__클러스터링 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__주제 발견 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__자연어 처리 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__분류화 패턴
____배경
____패턴을 사용하는 이유
____사용 사례
____패턴 구현
____코드 일부
____결과
____추가 정보
__향후 트렌드
____데이터 중심 패턴의 출현
____솔루션 중심 패턴의 출현
____프로그램화 제약사항을 다루는 패턴
__정리

저자소개

프라딥 파수풀레티 (지은이)    정보 더보기
아키텍처링 분야와 실시간 시스템 및 실시간 데이터주도형 시스템 개발에 16년간 몸담았다. 현재는 탄탄한 데이터 플랫폼 및 기계 학습 알고리즘을 수행해서 얻은 데이터 산출물을 개발하는 일에 관심을 두고 있다. 또한 미래 데이터 관리 및 분석이 요구되는 빅데이터에 대한 깊은 기술적 이해를 바탕으로 비즈니스 문제를 밝혀 냄으로써 고객에게 가치를 전달하고 있다. 빅데이터에 대한 관심이 매우 높으며, 빅데이터는 인간의 시간, 비용, 노력을 줄여주는 혁신의 요람지가 될 것이라 믿고 있다. 데이터 과학의 모든 면에 대한 풍부한 경험을 바탕으로 데이터 제품팀을 만들고, 이후 고객이 엔드투엔드(end-to-end) 전략을 구축하는 데 성공적으로 공헌했다. 엔드투엔트 전략이란 고객의 현재 데이터 구조를 일괄 분석과 실시간 분석 모두를 지원할 수 있는 혼합 패턴으로 변환하는 방법에 관한 것이다. 이 모든 것은 람다 구조(lambda architecture)로 수행되었다. 자연어 처리 및 높은 수준의 학습 기법을 기반으로 다차원 다중구조 데이터를 분석해서 얻은 데이터 산출물로 단기성공사례를 제공하는 최고기관(COE, Center of Excellence)을 설립했다. 포춘 500대 기업에게 기술 자문을 하는데, 그가 다루는 기술 영역은 빅데이터 전략, 제품 관리, 시스템 아키텍처, 소셜 네트워크 분석, 협상, 갈등 해결, 비선형 카오스 역학(chaos and nonlinear dynamics), 국제정책, 고성능 컴퓨팅, 고급 통계 기법, 위기관리, 마케팅, 다차원 데이터 가시화, 인간 컴퓨터 상호작용(HCI, Human-Computer Interaction), 기계 학습, 정보검색, 데이터마이닝 등에 달한다. 또한 창조적인 사람들 과 복잡한 문제를 해결하기 위해 혁신적인 방법으로 모호한 영역을 다뤄본 다양한 경험을 가지고 있다. 시를 읽고 쓰며, 가잘(ghazals)이 표현하는 기쁨을 누리고, 아이들과 함께 불가능한 발명에 대해 토론하며 시간을 보내는 것을 좋아한다. 또한 유적지 탐사에도 관심이 있다.
펼치기
이미정 (옮긴이)    정보 더보기
성균관대 전자전기컴퓨터 공학부 학사학위를, 한동대 정보통신공학 석사학위를 이수했다. 삼성전자 LSI 기술개발실 엔지니어로 시작해 오라클 미들웨어 사업부 컨설턴트로, 현재는 Splunk Korea 세일즈 엔지니어로 활동하고 있다. 역서로 『Pig를 이용한 빅데이터 처리 패턴』(에이콘, 2014), 『Splunk 6 핵심기술』(에이콘, 2015), 『파이썬으로 배우는 대규모 머신러닝』(에이콘, 2017), 『Splunk 7 에센셜』(에이콘, 2019)이 있다.
펼치기

추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책