logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

  • 네이버책
  • 알라딘
  • 교보문고
"대용량데이터"(으)로 15개의 도서가 검색 되었습니다.
9791158390921

Real MongoDB (대용량 데이터 처리를 위한)

이성욱  | 위키북스
43,200원  | 20180130  | 9791158390921
MongoDB의 "Know-How"가 아닌 "Know-Why"를 전달해 드립니다! MongoDB 메뉴얼은 아주 간결하고 기본적인 내용에 충실하게 작성되어 있다. 하지만 문법이나 명령만으로는 DBMS를 사용할 수 없다. 내부 작동 방식을 모르면 수많은 시행착오를 거치게 되며, 이런 시행착오는 결국 서비스 품질 저하로 연결될 것이다. 이 책에서는 MongoDB 서버를 사용하는 데 꼭 필요한 아키텍처와 함께 MongoDB 내부(Internal)에 대해 자세히 설명하고 있다. 또한 다양한 시행 착오를 줄이기 위한 주의 사항들에 대해서도 설명한다. 이 책은 MongoDB 서버(특히 MongoDB 1.x와 2.x 버전)에 실망했던 독자들에게 다시 한 번 MongoDB 서버의 가능성을 보여주고, 새로운 DBMS 솔루션을 찾고 있는 독자들에게 대안을 제시해 줄 것이라 생각한다.
9791161755137

빅데이터 마이닝 (하둡을 이용한 대용량 데이터 마이닝 기법)

쥬어 레스코벡, 아난드 라자라만, 제프리 데이비드 울만  | 에이콘출판
45,000원  | 20210429  | 9791161755137
웹, 소셜 미디어, 모바일 활동, 센서, 인터넷 상거래, 그 외 많은 애플리케이션의 발달로 엄청난 규모의 데이터가 생성되고 있으며, 데이터 마이닝으로 이런 데이터에서 유용한 정보를 얻을 수 있다. 이 책은 데이터 마이닝 분야의 핵심 과제들을 해결하고, 대규모 데이터에 적용할 수 있는 현실적인 알고리즘들에 초점을 맞추고 있다
9791161755397

스트리밍 시스템 (대용량 데이터 처리를 위한 핵심 개념과 원리)

타일러 아키다우, 슬라바 체르냑, 루벤 락스  | 에이콘출판
31,500원  | 20210630  | 9791161755397
스트리밍 데이터 처리, 차원을 높이다! 저자가 작성했던 블로그 글인 “스트리밍 101”에서 시작해 스트리밍 데이터 처리 시스템을 구축하고 사용하는 데 필요한 주요 개념을 “무엇”, “어디서”, “언제”, “어떻게”라는 네 가지 질문 위에 차근히 쌓아간다. 특정 시스템이나 문맥 안에서 부정확하게 쓰이는 개념을 분리해 명확히 전달하고 실제 사례에 어떻게 적용하는지 보여준다. 스트리밍 데이터 처리를 위해 어떤 시스템을 선택하든 개념을 확고하게 이해하는 것은 시스템을 이해하는 데 단단한 지반이 돼 줄 것이다.
9788966185030

Hadoop NoSQL (대용량 데이터 분석 및 처리를 위한)

서상원  | 길벗
0원  | 20130103  | 9788966185030
『Hadoop NoSQL』은 하둡 뿐만 아니라 실질적인 빅데이터 분석에 쓰이는 전문 도구들을 심도 있게 다루고 있으며, 예제와 그림을 통해 쉽게 접근할 수 있도록 하였다. 간단한 예제를 통하여 HBase를 설치하고 운영하는 방법뿐만 아니라, HBase의 한계를 보완하기 위한 NHN과 KT 클라우드웨어 주도로 이뤄진 국내 오픈소스 프로젝트인 DuoBase내의 HBase까지 속속들이 파헤쳐 본다.
9791158391034

빅데이터 분석을 위한 스파크 2 프로그래밍 (대용량 데이터 처리부터 머신러닝까지)

백성민  | 위키북스
31,500원  | 20180412  | 9791158391034
스파크를 처음 접하는 입문자를 위한 안내서! 하둡으로 대표되던 빅데이터 처리 기술은 빅데이터와 머신러닝, 딥러닝의 붐을 타고 믿을 수 없을 만큼 빠른 속도로 발전해가고 있습니다. 작년 봄 이 책의 초판이 출시되던 해에 스파크는 이미 최고의 데이터 처리 플랫폼 중 하나로 인정받고 있었습니다. 하지만 더 이상 큰 폭의 개편은 없을 것만 같았던 스파크는 그 후로도 더욱 주목할 만한 변화를 거듭하면서 불과 1년이 지난 지금 더욱더 새로워진 API와 고도화된 성능을 갖춘 최적의 데이터 처리 플랫폼으로 변화를 거듭하고 있습니다. 이 책은 스파크를 처음 접하는 개발자들이 빠른 시간 내에 스파크가 무엇이고 어디에 어떻게 활용할 수 있는지 실무에 필요한 감을 잡을 수 있도록 스파크의 전체 모듈에 대한 설명과 예제를 담고 있습니다. 특히 스파크를 써 보고 싶지만 새로운 언어를 배우는 데 따르는 부담 때문에 망설이던 개발자들을 위해 스칼라, 자바, 파이썬 예제를 수록했습니다. 이 책을 통해 스파크에 대한 기초를 다지고 나면 각자의 영역에서 스파크가 제공하는 풍부한 기능들을 더 깊이 있고 자유롭게 활용할 수 있게 될 것입니다.
9791158390549

스파크 2 프로그래밍 (대용량 데이터 처리부터 머신러닝까지)

백성민  | 위키북스
0원  | 20170208  | 9791158390549
스파크를 처음 접하는 입문자를 위한 안내서! 2017년 현재, 스파크는 RDD보다도 더 뛰어난 기능으로 무장한 데이터셋을 추가로 도입해서 머신러닝, 그래프 알고리즘, 실시간 스트리밍 처리는 물론이고 하둡, R, 하이브(Hive), 카프카(Kafka), 아파치 제플린(Zeppelin) 등 빅데이터 분야의 기존 스타들과의 연동을 통해 데이터 처리와 관련된 거의 대부분의 영역에서 영향력을 넓혀가고 있다. 이 책은 스파크를 처음 접하는 개발자들이 빠른 시간 내에 스파크가 무엇이고 어디에 어떻게 활용할 수 있는지 실무에 필요한 감을 잡을 수 있도록 스파크 전체 모듈에 대한 설명과 예제를 담고 있다. 특히 스파크를 써 보고 싶지만 새로운 언어를 배우는 부담 때문에 망설이던 개발자들을 위해 스칼라, 자바, 파이썬 예제를 수록하였다.
9788960779532

빅데이터 마이닝 (하둡을 이용한 대용량 데이터 마이닝 기법)

쥬어 레스코벡  | 에이콘출판
36,000원  | 20170210  | 9788960779532
하둡을 이용한 대용량 데이터 마이닝 기법! 웹과 인터넷 상거래의 발달로 엄청난 규모의 데이터가 생성되고 있으며, 데이터 마이닝으로 이런 데이터에서 유용한 정보를 얻는 것이 가능하다. 이 책 『빅데이터 마이닝』은 데이터 마이닝 분야의 핵심 과제를 해결하고 대규모 데이터에 적용할 수 있는 현실적인 알고리즘에 초점을 맞추었다. 알고리즘의 자동 병렬처리를 위해 중요하게 사용되는 툴인 맵리듀스 프레임워크에 대한 논의로 책을 시작한다. 이후 지역성 기반 해싱 기법을 설명한다. 이는 대규모로 수집된 데이터에서 비슷한 객체를 일일이 비교하지 않고 찾아내기 위한 기본 지식 체계이기 때문에 알아둘 필요가 있다. 또한 정확한 처리를 위해 매우 빨리 입력되는 데이터를 마이닝하는 스트림 처리 알고리즘을 설명한다. 그리고 웹 체계화를 위한 페이지랭크 개념 및 이와 관련된 기법들을 다룬다. 나머지 장에서는 빈발 항목 집합 찾기와 클러스터링, 그리고 이 각각을 메인 메모리에 담을 수 없을 정도로 큰 데이터 관점에서 처리하는 방법, 그 외 전자상거래에서 중요하게 사용되는 추천 시스템 및 웹 광고에 대해 다룬다. 제2판에는 소셜 네트워크와 머신 러닝 및 차원 축소 기법이 포함됐다. 데이터베이스와 웹 기술을 선도하는 학자들이 쓴 이 책은 전공자들과 실무자들에게 유용한 책이 될 것이다.
9788960779792

하이브 핵심정리 (하둡 기반 대용량 데이터 저장, 관리의 핵심 솔루션)

다융 두  | 에이콘출판사
18,000원  | 20170228  | 9788960779792
이 책은 빅데이터 도메인의 배경과 개념을 소개하고, 하이브 작업 환경을 설정하는 방법을 설명한다. 많은 예시를 통해 빅데이터의 값을 찾는 방법과 변환하는 방법을 소개하며 하이브 언어를 효율적으로 사용할 수 있는 기술도 안내한다. 마지막에는 성능, 보안과 같은 고급 주제 뿐만 아니라, 하이브의 확장까지 설명한다. 이 책은 하이브 언어를 실무에 적용하고, 확장하고자 하는 이들에게 훌륭한 가이드가 되어 줄 것이다.
9791189909239

구글 빅쿼리 완벽 가이드 (빅데이터, AI, 머신러닝 엔지니어를 위한 대용량 데이터 분석 도구)

발리아파 락쉬마난, 조던 티가니  | 책만
23,560원  | 20201126  | 9791189909239
빅데이터, 데이터 엔지니어링, 머신러닝을 위한 대용량 데이터 분석과 처리의 모든 것 협업과 신속함을 갖춘 작업 공간을 구축하는 동시에 페타바이트 규모의 데이터셋을 처리해보자. 이 책은 기업 전체에서 추출한 데이터를 통합하고 대화형 데이터 분석과 대규모 데이터셋 기반의 머신러닝을 가능케 하는 쿼리 엔진을 제공하는 구글 빅쿼리에 대한 완벽 가이드다. 기업은 빅쿼리를 사용해 하나의 편리한 프레임워크로 데이터를 효율적으로 저장, 쿼리, 수집, 학습할 수 있다. 이 책의 저자 발리아파 락쉬마난과 조던 티가니는 공개 클라우드 상에서 자동으로 확장되는 서버리스 아키텍처에 기반한 최신 데이터 웨어하우징을 위한 모범 사례를 제시하고 있다. 이제 막 빅쿼리를 시작하면서 전반적인 기능을 훑어보고자 하는 독자는 물론 빅쿼리를 이용해 특정 업무를 해결하고자 하는 독자에게도 완벽한 가이드가 되어 줄 것이다.
9791161750705

PySpark 배우기 (파이썬과 스파크 2.0으로 대용량 데이터 처리 애플리케이션 다루기)

토마스 드라바스, 데니 리  | 에이콘출판사
0원  | 20171030  | 9791161750705
스파크의 동작 원리와 구성 요소 등을 설명하는 것으로 시작해, 스파크가 왜 고속 처리나 분산 처리에 유리한 구조를 하고 있는지, 속도 개선에 가장 큰 영향을 준 부분은 어떤 부분인지를 이해하기 쉽게 설명한다. 다음으로는 스파크 분석 라이브러리 사용법과 그 라이브러리를 이용한 실제 데이터 분석에 초점을 두고 있다. 마지막으로 실시간으로 들어오는 데이터에 대해서 어떻게 처리하고 테스트하는지와 최종적으로 만들어진 애플리케이션을 스파크 혹은 다른 방법을 통해서 패키지화하는 방법을 제공한다.
9791186697191

스파크를 활용한 빅데이터 분석 (대용량 빅데이터 분석을 위한 스파크 실무 가이드)

모하마드 굴러  | 비제이퍼블릭
0원  | 20160704  | 9791186697191
빅데이터 분석을 위한 스파크의 기초 안내서. 이 책은 스파크와 함께 사용할 수 있는 HDFS, 에이브로(Avro), 파퀘이(Parquet), 카프카(Kafka), 카산드라(Cassandra), Hbase, 메소스 등의 다른 빅데이터 기술에 대해서, 그리고 머신 러닝과 그래프 분석에 대한 개념에 대해서도 소개하고 있다. 이처럼 스파크를 사용하기 위해 알아야 하는 기술들을 총망라하고 있기 때문에, 빅데이터 분석에 대한 내용을 충분히 학습할 수 있다. 특히 프로그래밍 언어에 대한 기본적인 지식을 가지고 있으면 금상첨화라고 할 수 있다.
9791161752402

빅데이터 분석을 위한 스칼라와 스파크 (대용량 빅데이터 분석과 머신 러닝까지 활용하는, 2019년 대한민국학술원 우수학술도서 선정도서)

레자울 카림, 스리다 알라  | 에이콘출판
45,000원  | 20181224  | 9791161752402
2019년 대한민국학술원 우수학술도서 선정도서 스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 가장 먼저 스칼라를 소개하고, 스칼라 애플리케이션 개발에 필요한 객체지향 개념과 함수형 프로그래밍 개념을 설명한다. 스파크에 초점을 맞춰 RDD와 데이터 프레임을 사용한 기본 추상화를 다룬다. 그 다음 스파크 SQL, GraphX, 스파크 구조화 스트리밍을 사용해 구조화된 데이터와 구조화되지 않은 데이터를 분석하고 모니터링, 설정, 디버깅, 테스팅, 배포와 같은 고급 주제를 살펴본다. 또한 SparkR 및 PySpark API를 사용한 스파크 애플리케이션을 개발하는 방법, 아파치 제플린(Zeppelin)을 사용한 대화식 데이터 분석, Alluxio를 함께 사용해 인메모리 데이터를 처리하는 방법을 다룬다. 이 책을 다 살펴본 후, 스파크를 완벽하게 이해하고 풀 스택 데이터 분석을 수행할 수 있을 것이다. 이 책은 최신 2.3.2 버전을 기준으로 작성됐다. 기존의 원서에서 제공하는 코드의 오타와 호환성을 수정한 옮긴이의 github 저장소를 제공한다. ■ 스칼라의 객체지향 개념과 함수형 프로그래밍 개념 이해 ■ 스칼라 컬렉션 API 이해 ■ 스파크의 핵심 추상화를 알기 위해 RDD와 데이터 프레임으로 작업하기 ■ 스파크 SQL과 GraphX를 사용해 구조 데이터와 구조화되지 않은 데이터 분석 ■ 스파크 구조화 스트리밍을 사용해 확장 가능하고 내결함성 있는 스트리밍 애플리케이션 개발 ■ 스파크 MLlib과 스파크 ML에서 많이 사용되는 알고리즘으로 예측 모델을 구축할 수 있는 분류, 회귀 분석, 차원 감소, 추천 시스템과 같은 머신 러닝 모범 사례 ■ 방대한 양의 데이터를 클러스터링하는 클러스터링 모델 구축 ■ 스파크 애플리케이션 튜닝, 디버깅, 모니터링 이해 ■ 실제 독립형(Standalone), 메소스(Mesos), 얀(YARN), 쿠버네티스(Kubernetes) 모드의 클러스터에 스파크 애플리케이션 배포 스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 스파크나 스칼라에 대한 지식은 없더라도 이전 프로그래밍 경험(특히 다른JVM 언어)이 있다면 스파크나 스칼라에 대한 개념을 이해하는 데 매우 유용하다. 스칼라는 지난 몇 년 동안 특히 데이터 과학과 분석 분야에서 꾸준히 증가하고 있다. 스파크는 스칼라로 작성됐고 분석 분야에서 널리 사용되고 있다. 이 책은 빅데이터를 잘 다룰 수 있는 스파크를 설명한다.
9788996311447

대용량 데이터베이스 성능 튜닝 (튜닝의 기본원리를 배울 수 있고 실습이 가능한 책)

주종면  | 데이터북
34,000원  | 20111111  | 9788996311447
튜닝의 기본원리를 배우고 실습이 가능한『대용량 데이터베이스 성능 튜닝』. 어려운 튜닝 기술을 그림과 원리 위주로 설명하는 기술서이다. 실습을 통해 배울 수 있도록 구성했으며, 오라클 7버전부터 최신 버전의 모든 튜닝 기술을 소개한다.
9788996311416

오라클 NEW 대용량 데이터베이스 성능 튜닝

주종면  | 데이터북
0원  | 20090921  | 9788996311416
대용량 데이터베이스의 성능을 향상하자! 오라클 ACE 주종면의 『오라클 NEW 대용량 데이터베이스 성능 튜닝』. 데이터베이스 튜닝 기술을 소개하는 이론서이자 실무서다. 저자가 한국데이터베이스진흥원과의 협력을 통해 개발한 데이터베이스 튜닝 방법론을 바탕으로, 쉽게 데이터베이스 튜닝 기술을 배울 수 있도록 구성한 것이다. 이 책은 오라클 DBMS에 대한 모든 튜닝 방법과 순서가 그림을 통해 설명하고 있다. 오라클 DBMS를 이용한 정보 시스템을 개발하고자 하는 개발자, 분석가, 설계자, 그리고 DBA를 위해 저술되었다. 대용량 데이터베이스의 성능을 향상하는 방법을 중점적으로 다루고 있다. 그림을 풍부하게 곁들여 이해를 도와준다. 실무에서 바로 활용이 가능한 예제도 풍부하게 수록하고 있다. ☞ (이한출판사)의 개정판입니다. ☞ CP Say! 『오라클 NEW 대용량 데이터베이스 성능 튜닝』의 바탕이 되는 데이터베이스 튜닝 방법론은, 저자가 대표로 있는 PLAN 정보기술의 홈페이지(http://www.plandb.co.kr)를 통해 무료로 제공되고 있습니다. PLAN 정보기술의 상황에 따라 변경 혹은 중지될 수 있습니다.
9791161751771

대용량 머신 러닝과 스파크 (빅데이터 기반의 머신 러닝 애플리케이션 구축)

레자울 카림, 마헤디 카이저  | 에이콘출판
31,500원  | 20180716  | 9791161751771
아파치 스파크와 스파크 ML 라이브러리를 이용해 대용량 데이터에서 특징을 찾고 머신 러닝 파이프 라인을 구축하며, 이를 새로운 데이터와 문제 유형에 맞게 튜닝하는 방법을 배운다. 그리고 모델을 빌드하고 프로덕션 환경에 배포하는 방법도 살펴본다. 머신 러닝 및 스파크에 관해 최소한의 지식만 있더라도 예제를 따라 해보면서 머신 러닝과 솔루션을 함께 탐색할 수 있다.
1
최근 본 책