책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 개발/방법론 > 웹 서비스/웹 프로그래밍
· ISBN : 9791161756844
· 쪽수 : 492쪽
책 소개
목차
1장. IT를 위한 머신러닝
__IT의 역사적 도전 과제 극복
__엄청나게 많은 데이터 처리
__자동화된 이상 탐지의 출현
__비지도 ML 대 지도 ML
__이상 탐지를 위한 비지도 ML 사용하기
____특이에 관해 정의하기
____정상 상태 학습하기
____확률 모델
____모델 학습하기
____디트랜드
____특이성에 대한 점수화
____시간 요소
__데이터 프레임 분석에 지도 ML 적용하기
____지도 학습 과정
__요약
2장. 활성화와 운영화
__기술 요구 사항
__일래스틱 ML 기능 활성화
____자체 관리형 클러스터에서 ML 활성화
____클라우드에서 ML 활성화 - 일래스틱서치 서비스
__운영화의 이해
____ML 노드
____작업
____시계열 분석에서 데이터 버킷팅
____일래스틱 ML에 데이터 공급
____제공하는 인덱스
______.ml-config
______.ml-state-*
______.ml-notification-*
______.ml-annoataions-*
______.ml-stats-*
______.ml-anomalies-*
____이상 탐지 오케스트레이션
____이상 탐지 모델 스냅숏
__요약
3장. 이상 탐지
__기술 요구 사항
__일래스틱 ML 작업 유형
__탐지기 해부
____함수
____필드
____partition 필드
____by 필드
____over 필드
____공식(formula)
__이벤트 비율의 변화 탐지
____카운트 함수 탐색
____다른 카운트 함수
______논제로 카운트
______디스팅트 카운트
__메트릭 값에서 변화 탐지
____메트릭 함수
______min, max, mean, median과 metric
______varp
______sum, not-null sum
__고급 탐지기 함수의 이해
____레어(rare)
____프리퀀시 레어(frequency rare)
____정보 내용(information content)
____지오그래픽(geographic)
____시간
__범주형 피처로 분석 분할
____분할 필드 설정
____partition과 by_field를 사용한 분할의 차이점
____이중 분할에 한계가 있을까?
__시간 분석과 모집단 분석의 이해
__비정형 메시지 범주화 분석
____범주화에 훌륭한 후보가 되는 메시지 유형
____범주화에 사용되는 프로세스
____범주 분석
____범주화 작업 예제
____범주화 사용을 피해야 하는 경우
__API를 통한 일래스틱 ML 관리
__요약
4장. 예측
__기술 요구 사항
__예언과 대비되는 예측
__예측 사용 사례
__작업의 예측 이론
__단일 시계열 예측
__예측 결과 검토
__다중 시계열 예측
__요약
5장. 결과 해석
__기술 요구 사항
__일래스틱 ML 결과 인덱스 보기
__이상 징후 점수
____버킷 수준 스코어링
____정규화
____인플루언서 수준 점수
____인플루언서
____레코드 수준 점수
__결과 인덱스 스키마의 세부 정보
____버킷 결과
____레코드 결과
____인플루언서 결과
__다중 버킷 이상 징후
____다중 버킷 이상 징후 예제
____다중 버킷 스코어링
__예측 결과
____예측 결과 쿼리
__결과 API
____결과 API 엔드포인트
____전체 버킷 조회 API
____범주 조회 API
__사용자 정의 대시보드와 캔버스 워크패드
____대시보드 "임베디블"
____TSVB에서 이상 징후 주석
____캔버스 워크패드 사용자 정의
__요약
6장. ML 분석에 기반한 얼러팅
__기술 요구 사항
__얼러팅 개념 이해
____모든 이상 징후가 얼럿일 필요는 없다
____실시간 얼러팅에는 타이밍이 중요하다
__ML UI에서 얼럿 작성
____샘플 이상 탐지 작업 정의
__샘플 작업에 대한 얼럿 생성
____실시간 이례적인 행위 시뮬레이션
____얼럿 수신과 검토
__와치(watch)로 얼럿 만들기
____레거시 기본 ML 와치의 구조 이해
______trigger 섹션
______input 섹션
______condition 섹션
______action 섹션
____사용자 정의 와치는 몇 가지 고유한 기능을 제공할 수 있다
______연결된 입력과 스크립트 내의 조건
______연결된 입력 간에 정보 전달
__요약
7장. AIOps와 근본 원인 분석
__기술 요구 사항
__AIOps 용어의 이해
__KPI의 중요성과 한계 이해
__KPI를 넘어서
__더 나은 분석을 위한 데이터 조직화
____이상 탐지 데이터피드에 대한 사용자 정의 쿼리
____수집 시 데이터 강화
__컨텍스트 정보 활용
____분석 분할
____통계적 인플루언서
__RCA를 위해 모든 것을 통합
____가동 중단 배경
____상관관계와 공유된 인플루언서
__요약
8장. 다른 일래스틱 스택 앱에서 이상 탐지
__기술 요구 사항
__일래스틱 APM의 이상 탐지
____APM에 대한 이상 탐지 활성화
____APM UI에서 이상 탐지 작업 결과 조회
____데이터 인식기를 통한 ML 작업 생성
__로그 앱의 이상 탐지
____로그 카테고리
____로그 이상 징후
____메트릭 앱의 이상 탐지
__업타임 앱의 이상 탐지
__일래스틱 시큐리티 앱의 이상 탐지
____사전 구축된 이상 탐지 작업
__탐지 얼럿으로서의 이상 탐지 작업
__요약
9장. 데이터 프레임 분석 소개
__기술 요구 사항
__변환하는 방법 학습
____왜 변환이 유용한가?
____변환 작업의 내부 구조
____전자 상거래 주문을 분석하기 위해 변환 사용
____더 고급 수준의 피벗과 집계 구성 탐색
____배치 변환과 연속 변환의 차이점 발견
____연속 변환을 사용해 소셜 미디어 피드 분석
__고급 변환 구성에 페인리스 사용
____페인리스 소개
____변수, 연산자, 제어 흐름
____함수
__파이썬과 일래스틱서치로 작업하기
____파이선 일래스틱서치 클라이언트에 대해 간략하게 둘러보기
____일런드의 개발 목적 이해
____일런드와 함께하는 첫걸음
__요약
__더 읽어보기
10장. 아웃라이어 탐지
__기술 요구 사항
__아웃라이어 탐지의 내부 작동 이해
____아웃라이어 탐지에 사용하는 4가지 기술 이해
______거리 기반 기술
______밀도 기반 기술
__피처 영향력 이해
______각 점에 대한 피처 영향력은 어떻게 계산하는가?
____아웃라이어 탐지는 이상 탐지와 어떻게 다른가?
______확률 모델 기반 대 인스턴스 기반
______점수화
______데이터 특성
______온라인 대 배치(batch)
__실제 아웃라이어 탐지 적용
__Evaluate API로 아웃라이어 탐지 평가
__아웃라이어 탐지를 위한 하이퍼파라미터 조정
__요약
11장. 분류 분석
__기술 요구 사항
__분류: 데이터에서 훈련된 모델로
____데이터에서 분류 모델 학습
____피처 엔지니어링
____모델 평가
__분류의 첫 걸음
__분류의 내부 구조: 그래디언트 부스트 의사결정 트리
____의사결정 트리 소개
____그래디언트 부스트 의사결정 트리
__하이퍼파라미터
__결과 해석
____분류 확률
____분류 점수
____피처 중요도
__요약
__더 읽어보기
12장. 회귀
__기술 요구 사항
__회귀 분석을 사용해 주택 가격 예측
__회귀를 위한 의사결정 트리 사용
__요약
__더 읽어보기
13장. 추론
__기술 요구 사항
__훈련된 모델 API 및 파이썬을 사용해 훈련된 머신러닝 모델을 검사하고 가져오며 내보내기
__훈련된 모델 API 살펴보기
____훈련된 모델 API와 파이썬을 사용해 훈련된 모델 내보내기와 가져오기
__추론 프로세서와 인제스트 파이프라인 이해하기
____인제스트 파이프라인에서 누락되거나 손상된 데이터 처리
____예측에 대한 더 많은 통찰력을 얻기 위한 추론 프로세서 구성 옵션 사용하기
__일런드를 사용해 외부 모델을 일래스틱서치로 가져오기
____일런드에서 지원하는 외부 모델에 대해 알아보기
____scikit-learn의 DecisionTreeClassifier로 훈련하고 일런드를 사용해 일래스틱서치로 가져오기
__요약
부록. 이상 탐지 팁
__기술 요구 사항
__분할 작업 대 비분할 작업의 인플루언서 이해하기
__단측함수를 유리하게 사용하기
__기간 무시하기
____예정된 (알려진) 시간 윈도 무시하기
______캘린더 이벤트 생성
______원하는 타임프레임을 무시하기 위해 데이터피드 중지 및 시작
____예기치 못한 시간 윈도를 사후에 무시하기
______작업의 복제와 과거 데이터의 재실행
______작업을 이전 모델 스냅숏으로 되돌리기
__사용자 정의 규칙과 필터 유리하게 사용하기
____사용자 정의 규칙 만들기
______"하향식" 얼러팅 철학에 대한 사용자 지정 규칙의 장점
__이상 탐지 작업 처리량에 관한 고려 사항
__사용 사례의 과도한 엔지니어링 방지하기
__런타임 필드에서 이상 탐지 사용하기
__요약