책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 프로그래밍 기초/개발 방법론
· ISBN : 9788960775497
· 쪽수 : 408쪽
· 출판일 : 2014-04-30
책 소개
목차
1장 아파치 솔라 설정
____개요
____제티에서의 솔라 실행
____아파치 톰캣에서의 솔라 실행
____데이터 클러스터링
____올바른 디렉토리 구현 선택
____자체 색인을 사용하지 않게 철자 검사기 설정
____솔라 캐시 구성
____웹 페이지를 가져와 색인하는 방법
____추출 요청 처리기 설정 방법
____기본 유사성 구현 변경
2장 자료 색인
____개요
____PDF 파일 색인
____고유 필드 자동 생성
____이진 파일에서의 메타데이터 추출
____JDBC로 자료 추출 처리기 구성
____자료 추출 처리기로 데이터베이스에서 자료 색인
____자료 추출 처리기와 델타 질의로 자료를 추출하는 방법
____URL 데이터 소스로 자료 추출 처리기를 사용하는 방법
____자료 추출 처리기로 가져오며 자료를 수정하는 방법
____문서의 단일 필드 갱신
____여러 통화 처리
____문서 언어 알아내기
____기본 키 필드 색인 최적화
3장 텍스트 자료 분석
____개요
____페이로드를 이용한 추가 정보 저장
____텍스트에서 XML 태그와 HTML 태그의 제거
____한 필드 내용을 다른 필드로 복사
____단어를 다른 단어로 변경
____카멜 케이스(CamelCase)로 텍스트 분할
____여백으로만 텍스트 분할
____어간 추출 없이 복수 단어를 단수로 만들기
____문자열 전체를 소문자로 만들기
____색인에 지리적 위치 저장
____자료에서 어간 추출
____효율적인 문자열 끝 와일드카드 검색을 위한 텍스트 준비
____숫자와 비 여백 문자로 텍스트 분할
____훈스펠을 어간 추출기로 사용
____자신만의 어간 사전 사용
____어간 추출 방지
4장 솔라 질의
____개요
____특정 필드 값 조회
____필드 값으로 결과 정렬
____단어가 아니라 구문으로 검색
____단어보다 구문 우선 검색
____특정 문서 우선 반환
____단어 거리가 가까운 문서 우선 반환
____한 지점에서 거리로 결과 정렬
____부분 일치로만 문서 가져오기
____함수로 점수 계산에 영향 주기
____질의 중첩
____반환된 문서 수정
____부모-자식 관계 사용
____성능 관점에서의 오타 무시
____중복 문서 감지 및 무시
____필드 앨리어스 사용
____결과에 함수 값 반환
5장 패싯 메커니즘 사용
____개요
____필드 값이 같은 문서 수 가져오기
____값 범위가 같은 문서 수 가져오기
____질의와 하위 질의에 일치하는 문서 수 가져오기
____패싯 결과에서 필터 제거
____알파벳순으로 패싯 결과 정렬
____패싯을 이용한 자동 완성 기능 구현
____필드 값이 없는 문서 수 가져오기
____한 질의에서 두 필드에 다른 패싯 제한 주기
____결정 트리 패싯 사용
____연관 그룹에서 가장 적합한 문서에 대한 패싯 계산
6장 솔라 성능 개선
____개요
____결과 페이지 전환 속력 높이기
____문서 캐시 구성
____질의 결과 캐시 구성
____필터 캐시 구성
____시작 혹은 커밋 직후의 솔라 성능 개선
____캐시에 전체 결과 페이지 저장
____고윳값 수가 작은 필드에 대한 패싯 작업 성능 개선
____색인 과정에서 솔라 성능 저하 시 대처 방법
____질의 성능 분석
____필터 캐시 저장 피하기
____필터 질의 실행 순서 제어
____숫자 범위 질의 성능 개선
7장 클라우드를 위한 솔라
____개요
____새로운 SolrCloud 클러스터 생성
____단일 클러스터 내부에 2개의 컬렉션 설정
____SolrCloud 클러스터 관리
____SolrCloud 클러스터 관리 GUI의 이해
____분산 색인과 검색
____이미 존재하는 라이브 클러스터에 레플리카 수 늘이기
____샤드 사이에서 자동화된 문서 배포 멈추기
8장 솔라의 다양한 기능
____개요
____결과 목록에 반환된 문서와 유사한 문서 더 얻기
____일치된 단어의 강조
____긴 텍스트 필드를 강조하고 좋은 성능을 얻는 방법
____함수 값으로 결과 정렬
____발음에 따른 단어 검색
____정의된 단어의 무시
____검색 결과의 통계 계산
____사용자의 오타 점검
____결과를 그룹으로 묶기 위한 필드 값 사용
____결과를 그룹으로 묶기 위한 질의 사용
____결과를 그룹으로 묶기 위한 함수 질의 사용
9장 문제 해결
____개요
____너무 많이 열린 파일 처리
____메모리 부족 문제 해결
____비영어권 자료의 적절한 정렬
____색인을 작게 만들기
____솔라 문제 진단
____스와핑 피하기
부록 : 실제 상황