logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

아파치 Solr 4 구축과 관리

아파치 Solr 4 구축과 관리

(오픈소스 루씬 기반 엔터프라이즈 검색 플랫폼)

라팔 쿠크 (지은이), 이해영, 박재호 (옮긴이)
에이콘출판
35,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

아파치 Solr 4 구축과 관리
eBook 미리보기

책 정보

· 제목 : 아파치 Solr 4 구축과 관리 (오픈소스 루씬 기반 엔터프라이즈 검색 플랫폼)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론
· ISBN : 9788960775497
· 쪽수 : 408쪽
· 출판일 : 2014-04-30

책 소개

acorn+PACKT 시리즈. 검색과 관련된 기본 프레임워크를 제공하는 아파치 루씬(Apache Lucene)을 기반으로 만들어진 전문 검색 엔진인 솔라(Solr)를 사용하는 과정에서 자주 발생하는 문제와 고민을 풀어준다.

목차

1장 아파치 솔라 설정
____개요
____제티에서의 솔라 실행
____아파치 톰캣에서의 솔라 실행
____데이터 클러스터링
____올바른 디렉토리 구현 선택
____자체 색인을 사용하지 않게 철자 검사기 설정
____솔라 캐시 구성
____웹 페이지를 가져와 색인하는 방법
____추출 요청 처리기 설정 방법
____기본 유사성 구현 변경

2장 자료 색인
____개요
____PDF 파일 색인
____고유 필드 자동 생성
____이진 파일에서의 메타데이터 추출
____JDBC로 자료 추출 처리기 구성
____자료 추출 처리기로 데이터베이스에서 자료 색인
____자료 추출 처리기와 델타 질의로 자료를 추출하는 방법
____URL 데이터 소스로 자료 추출 처리기를 사용하는 방법
____자료 추출 처리기로 가져오며 자료를 수정하는 방법
____문서의 단일 필드 갱신
____여러 통화 처리
____문서 언어 알아내기
____기본 키 필드 색인 최적화

3장 텍스트 자료 분석
____개요
____페이로드를 이용한 추가 정보 저장
____텍스트에서 XML 태그와 HTML 태그의 제거
____한 필드 내용을 다른 필드로 복사
____단어를 다른 단어로 변경
____카멜 케이스(CamelCase)로 텍스트 분할
____여백으로만 텍스트 분할
____어간 추출 없이 복수 단어를 단수로 만들기
____문자열 전체를 소문자로 만들기
____색인에 지리적 위치 저장
____자료에서 어간 추출
____효율적인 문자열 끝 와일드카드 검색을 위한 텍스트 준비
____숫자와 비 여백 문자로 텍스트 분할
____훈스펠을 어간 추출기로 사용
____자신만의 어간 사전 사용
____어간 추출 방지

4장 솔라 질의
____개요
____특정 필드 값 조회
____필드 값으로 결과 정렬
____단어가 아니라 구문으로 검색
____단어보다 구문 우선 검색
____특정 문서 우선 반환
____단어 거리가 가까운 문서 우선 반환
____한 지점에서 거리로 결과 정렬
____부분 일치로만 문서 가져오기
____함수로 점수 계산에 영향 주기
____질의 중첩
____반환된 문서 수정
____부모-자식 관계 사용
____성능 관점에서의 오타 무시
____중복 문서 감지 및 무시
____필드 앨리어스 사용
____결과에 함수 값 반환

5장 패싯 메커니즘 사용
____개요
____필드 값이 같은 문서 수 가져오기
____값 범위가 같은 문서 수 가져오기
____질의와 하위 질의에 일치하는 문서 수 가져오기
____패싯 결과에서 필터 제거
____알파벳순으로 패싯 결과 정렬
____패싯을 이용한 자동 완성 기능 구현
____필드 값이 없는 문서 수 가져오기
____한 질의에서 두 필드에 다른 패싯 제한 주기
____결정 트리 패싯 사용
____연관 그룹에서 가장 적합한 문서에 대한 패싯 계산

6장 솔라 성능 개선
____개요
____결과 페이지 전환 속력 높이기
____문서 캐시 구성
____질의 결과 캐시 구성
____필터 캐시 구성
____시작 혹은 커밋 직후의 솔라 성능 개선
____캐시에 전체 결과 페이지 저장
____고윳값 수가 작은 필드에 대한 패싯 작업 성능 개선
____색인 과정에서 솔라 성능 저하 시 대처 방법
____질의 성능 분석
____필터 캐시 저장 피하기
____필터 질의 실행 순서 제어
____숫자 범위 질의 성능 개선

7장 클라우드를 위한 솔라
____개요
____새로운 SolrCloud 클러스터 생성
____단일 클러스터 내부에 2개의 컬렉션 설정
____SolrCloud 클러스터 관리
____SolrCloud 클러스터 관리 GUI의 이해
____분산 색인과 검색
____이미 존재하는 라이브 클러스터에 레플리카 수 늘이기
____샤드 사이에서 자동화된 문서 배포 멈추기

8장 솔라의 다양한 기능
____개요
____결과 목록에 반환된 문서와 유사한 문서 더 얻기
____일치된 단어의 강조
____긴 텍스트 필드를 강조하고 좋은 성능을 얻는 방법
____함수 값으로 결과 정렬
____발음에 따른 단어 검색
____정의된 단어의 무시
____검색 결과의 통계 계산
____사용자의 오타 점검
____결과를 그룹으로 묶기 위한 필드 값 사용
____결과를 그룹으로 묶기 위한 질의 사용
____결과를 그룹으로 묶기 위한 함수 질의 사용

9장 문제 해결
____개요
____너무 많이 열린 파일 처리
____메모리 부족 문제 해결
____비영어권 자료의 적절한 정렬
____색인을 작게 만들기
____솔라 문제 진단
____스와핑 피하기

부록 : 실제 상황

저자소개

라팔 쿠크 (지은이)    정보 더보기
타고난 팀 리더이자 소프트웨어 개발자다. 현재 세마텍스트사(Sematext Inc.)에서 컨설턴트 겸 소프트웨어 엔지니어로 일하며 아파치 루씬(Lucene)과 솔라(Solr), 일래스틱서치 (Elasticsearch), 하둡(Hadoop) 스택같은 오픈소스 기술에 집중하고 있다. 금융 소프트웨어부터 전자상거래 제품에 이르기까지 다양한 소프트웨어 분야에서 12년이 넘는 경험을 쌓았다. 자바를 주로 사용하나 목표를 더 빠르게 더 쉽게 달성해 주는 도구와 프로그래밍 언어라면 무엇이든 환영한다. 또한 solr.pl 사이트의 공동 창립자로서 사이트에서 자신의 지식을 공유하며 사람들이 겪는 솔라와 루씬 문제를 도와 주려 애쓴다. 루씬 유로콘(Lucene Eurocon), 베를린 버즈워즈(Berlin Buzzwords), 아파치콘(ApacheCon) 등 전 세계 학회에서 연사로도 활동한다. 2002년 처음으로 루씬을 접했을 때는 별다른 감흥을 못 느꼈으나, 2003년에 다시 루씬을 접하고 나서야 루씬이라는 프레임워크에 대한 생각을 바꿨고 검색 기술에서 잠재력을 보았다. 그러다가 솔라가 나왔고 이것이 시발점이었다. 그때 이후 쿠크는 검색 기술과 자료 분석에 집중해오다가, 2010년 중반에 일래스틱서치로 작업을 시작했다. 현재 루씬, 솔라, 일래스틱서치, 정보 검색 분야가 주요 관심사다.
펼치기
이해영 (옮긴이)    정보 더보기
포항공과대학교 컴퓨터공학과 학부와 퍼듀대학교 전자계산학과 대학원을 졸업했다. 현재 프리랜서 번역가다. 『English for Developers : IT 트렌드로 배우는 개발자 영어 독해』를 저술했고, 『The Art of Project Management : 마음을 움직이는 프로젝트 관리』, 『Rapid Development : 프로젝트 쾌속 개발 전략』(이상 한빛미디어), 『조엘 온 소프트웨어』(에이콘), 『프로젝트가 서쪽으로 간 까닭은 : 프로젝트 군상의 86가지 행동 패턴』, 『피플웨어(3판)』, 『Clean Code 클린 코드 : 애자일 소프트웨어 장인 정신』(이상 인사이트)을 번역했다.
펼치기
박재호 (옮긴이)    정보 더보기
포항공과대학교 컴퓨터공학과 학부와 대학원을 졸업했다. 임베디드 시스템 개발, 기업용 백업 소프트웨어 개발, 방송국 콘텐츠 수신제한 시스템 개발과 운영 지원, 클라우드에서 동작하는 서비스 개발에 이르기까지 다양한 실무 경험을 토대로 고성능 고가용성 시스템을 설계하고 있다. 코스닥 상장사인 엑셈 CTO로 인공지능과 스마트팩토리 관련 개발을 총괄했으며, 클라우드용 모니터링 시스템을 위한 아키텍처 설계도 주도했다. 지금은 레인보우브레인에서 CTO로 생성형 AI 제품 개발에 힘쓰고 있다. 『클린 코드, 이제는 파이썬이다』, 『마이크로서비스 도입, 이렇게 한다』, 『Clean Code 클린 코드』, 『피플웨어』 등을 번역하고, 『LLM을 활용한 실전 AI 애플리케이션 개발』 등을 감수하는 등 번역, 감수, 집필한 책이 40여 권을 넘는다. 각종 기술 소식을 다루는 블로그 ‘컴퓨터 vs 책’과 개발자를 위한 유튜브 ‘채널 박재호’(youtube.com/c/박재호dev)를 운영하며, 개발자들을 위한 각종 교육과 세미나도 지속적으로 진행하고 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책