logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

피처 엔지니어링, 제대로 시작하기

피처 엔지니어링, 제대로 시작하기

(데이터에서 효과적으로 정보를 추출하는 원리와 기법, 2019년 대한민국학술원 우수학술도서 선정도서)

앨리스 젱, 아만다 카사리 (지은이), 김우현 (옮긴이)
에이콘출판
25,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

피처 엔지니어링, 제대로 시작하기
eBook 미리보기

책 정보

· 제목 : 피처 엔지니어링, 제대로 시작하기 (데이터에서 효과적으로 정보를 추출하는 원리와 기법, 2019년 대한민국학술원 우수학술도서 선정도서)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9791161752426
· 쪽수 : 280쪽
· 출판일 : 2018-12-26

책 소개

수치형 데이터, 범주형(카테고리) 데이터를 다루는 기법뿐만 아니라 텍스트, 이미지, 그리고 고차원 데이터에서 머신 러닝을 위해 좋은 피처를 추출하는 기법과 그 원리를 설명하고 실습을 통해 직관을 얻을 수 있도록 해준다.

목차

1장. 머신 러닝 파이프라인
__데이터
__과제
__모델
__피처
__모델 평가


2장. 숫자를 위한 멋진 트릭
__스칼라, 벡터, 공간
__카운트 처리
____바이너리 변환
____양자화 또는 비닝
__로그 변환
____로그 변환의 역할
____거듭제곱 변환: 로그 변환의 일반화
__피처 스케일링 또는 정규화
____min-max 스케일링
____표준화(분산 스케일링)
____ℓ2 정규화
__상호작용 피처
__피처 선택
__요약
__참고 문헌


3장. 텍스트 데이터: 플래트닝, 필터링, 청킹
__bag-of-x: 자연어 텍스트를 평면 벡터로 변환
____BoW
____bag-of-n-grams
__정제된 피처를 위한 필터링
____불용어
____빈도 기반 필터링
____어간 추출
__의미의 단위: n-grams에서 구문까지
____파싱과 토큰화
____구문 탐색을 위한 연어 추출
__요약
__참고 문헌


4장. 피처 스케일링의 효과: BoW에서 tf-idf로
__tf-idf: BoW 비틀기
__tf-idf 테스트
____분류 데이터셋 생성
____tf-idf 변환으로 BoW를 스케일링
____로지스틱 회귀를 이용한 분류
____일반화로 로지스틱 회귀 튜닝
__심층 분석: 무슨 일이 일어나고 있는가?
__요약
__참고 문헌


5장. 범주형 변수: 로봇닭 시대에 달걀 개수 세기
__범주형 변수 인코딩
____원-핫 인코딩
____더미 코딩
____이펙트 코딩
____범주형 변수 인코딩의 장단점
__대규모 범주형 변수 처리
____피처 해싱
____빈 카운팅
__요약
__참고 문헌


6장. 차원 축소: PCA로 데이터 팬케이크 납작하게 만들기
__직관
__수식 유도
____선형 투영법
____분산과 경험적 분산
____주성분: 첫 번째 식
____주성분: 행렬-벡터식
____주성분의 일반적인 해
____피처 변환
____PCA 구현
__PCA의 활약
__화이트닝과 ZCA
__PCA의 고려 사항과 한계
__사용 예
__요약
__참고 문헌


7장. k-means 모델 스태킹을 통한 비선형 피처 생성
__k-means 클러스터링
__곡면 분할로서의 클러스터링
__분류를 위한 k-means 피처 생성
____조밀한 피처 생성
__장단점과 몇 가지 사항들
__요약
__참고 문헌


8장. 피처 생성 자동화: 이미지 피처 추출과 딥러닝
__가장 단순한 이미지 피처(그리고 이것이 동작하지 않는 이유)
__수동 피처 추출: SIFT와 HOG
____이미지 그래디언트
____그래디언트 오리엔테이션 히스토그램
____SIFT 아키텍처
__심층 신경망으로 이미지 피처 학습
____완전 연결 계층
____컨볼루션 계층
____ReLU 변환
____응답 정규화 계층
____풀링 계층
____AlexNet의 구조
__요약
__참고 문헌


9장. 다시 피처로: 학술 논문 추천 시스템 구축
__항목 기반 협업 필터링
__첫 번째 단계: 데이터 가져오기, 정제하기, 피처 파싱하기
____학술 논문 추천 시스템: 단순 접근법
__두 번째 단계: 피처 엔지니어링과 더 똑똑한 모델
____학술 논문 추천 시스템: 테이크 2
__세 번째 단계: 추가 피처 = 추가 정보
____학술 논문 추천 시스템: 테이크 3
__요약
__참고 문헌


부록 A. 선형 모델링과 선형대수 기초
__선형 분류 개관
__행렬 분석
____벡터에서 부분공간으로
____특이값 분해
____데이터 행렬의 기본적인 네 가지 부분공간
__선형 시스템 풀이
__참고 문헌

저자소개

앨리스 젱 (지은이)    정보 더보기
머신 러닝, 알고리즘, 플랫폼 개발 분야의 테크니컬 리더다. 현재 아마존 애드버타이징(Amazon Advertising) 사의 리서치 사이언스 매니저로 근무하고 있다. 그전에는 GraphLab/Dato/Turi에서 툴킷 개발 및 사용자 교육을 담당했고, 마이크로소프트 리서치(Microsoft Research) 사에서 머신 러닝 연구원으로 일했다. UC 버클리(Berkeley)에서 전기공학 및 컴퓨터과학으로 박사(PhD) 학위를, 컴퓨터과학 및 수학으로 학사(BA) 학위를 받았다.
펼치기
아만다 카사리 (지은이)    정보 더보기
기술의 다음 지평을 탐구하고 그것이 가져올 영향을 가장 잘 보여줄 수 있는 리더이자 엔지니어다. 현재 Concur Labs의 수석 프로덕트 매니저 겸 데이터 과학자며 SAP Concur의 Concur Labs AI Research 팀의 공동 창립자다. 지난 16년 동안 데이터 과학, 머신 러닝, 복잡계 시스템, 로보틱스 등의 다양한 분야에서 핵심적인 역할을 수행했다. 미국 해군 사관학교(US Naval Academy)에서 제어 시스템 엔지니어링으로 학사(BS) 학위를, 버몬트 대학교(University of Vermont)에서 전기공학으로 석사(MS) 학위를 받았다.
펼치기
김우현 (옮긴이)    정보 더보기
대학생 시절, 선배와 함께 창업한 이후 20년 넘게 소프트웨어 개발자로 살고 있으며 인공지능 분야에서 새로운 길을 만들어 가고 있다. 숙명여자대학교 나노/바이오 전산화학 연구센터에서 데이터 과학자로 근무했으며, 현재 프리랜서 AI 개발자로 일하는 중이다. 옮긴 책으로는 에이콘출판사에서 출간한 『R 데이터 구조와 알고리즘』(2017), 『자바 데이터 사이언스 쿡북』(2018), 『피처 엔지니어링, 제대로 시작하기』(2018), 『The Python 3 Standard Library by Example』(2020), 『파이썬 객체지향 프로그래밍 4/e』(2022) 등이 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책