logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

파이썬으로 배우는 응용 텍스트 분석

파이썬으로 배우는 응용 텍스트 분석

(언어 인식 데이터 제품 개발을 위한 머신러닝)

벤자민 벵포트, 레베카 빌브로, 토니 오제다 (지은이), 박진수 (옮긴이)
제이펍
27,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
24,300원 -10% 0원
카드할인 10%
2,430원
21,870원 >
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

파이썬으로 배우는 응용 텍스트 분석
eBook 미리보기

책 정보

· 제목 : 파이썬으로 배우는 응용 텍스트 분석 (언어 인식 데이터 제품 개발을 위한 머신러닝)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791188621774
· 쪽수 : 392쪽
· 출판일 : 2019-11-29

책 소개

언어 인식(language-aware) 제품을 구축하는 일에 머신러닝을 활용하는 데이터 과학자의 접근 방식을 볼 수 있다. 특히, 문맥이나 사용 언어에 맞춰 특징을 처리하는 기술(즉, 특징 공학)이나 벡터화ㆍ분류ㆍ토픽 모델링ㆍ엔터티 분해ㆍ그래프 분석ㆍ시각적 조정 같은 기술도 다루고 있다.

목차

CHAPTER 01 언어와 계산 1
데이터 과학 패러다임 2
언어 인식 데이터 제품 4
데이터 제품 파이프라인 6
데이터로서의 언어 9
언어의 계산 모델 10
언어 자질 11
맥락 자질 15
구조적 자질 17
결론 20

CHAPTER 02 사용자 정의 말뭉치 구축 21
말뭉치란 무엇인가? 22
영역 특정 말뭉치 22
Baleen 수집 엔진 23
말뭉치 데이터 관리 25
말뭉치 디스크 구조 27
말뭉치 리더 30
NLTK를 사용한 스트리밍 데이터 액세스 32
HTML 말뭉치 읽기 34
데이터베이스에서 말뭉치 읽기 38
결론 40

CHAPTER 03 말뭉치의 전처리와 가공 41
문서 쪼개 보기 42
핵심 내용 식별 및 추출 42
문서를 단락별로 나누기 44
분할: 문장별로 나누기 46
토큰화: 개별 토큰 식별 48
품사 태깅 49
중간 말뭉치 분석론 50
말뭉치 변환 52
중간 전처리 및 저장 52
처리된 말뭉치 읽기 56
결론 58

CHAPTER 04 텍스트 벡터화와 변환 파이프라인 59
공간 내 단어 61
빈도 벡터 62
원핫 인코딩 64
용어빈도-역문서빈도 67
분산 표현 71
사이킷런 API 74
BaseEstimator 인터페이스 74
TransformerMixin 확장 76
파이프라인 81
파이프라인의 기초 81
하이퍼파라미터 최적화를 위한 격자 검색 83
특징결합을 사용한 특징추출 강화 84
결론 86

CHAPTER 05 텍스트 분석을 위한 분류 89
텍스트 분류 90
분류 문제 식별 91
분류기 모델 92
텍스트 분류 애플리케이션 만들기 94
교차검증 94
모델 구성 98
모델 평가 100
결론 105

CHAPTER 06 텍스트 유사성을 위한 군집화 107
텍스트에 대한 비지도학습 108
문서 유사성에 의한 군집화 109
거리 계량 110
부분 군집화 112
위계적 군집화 118
문서 토픽 모델링 122
잠재 디리클레 할당 122
잠재 의미 분석 130
음이 아닌 행렬 인수분해 133
결론 134

CHAPTER 07 문맥 인식 텍스트 분석 137
문법 기반 특징추출 138
문맥 자유 문법 139
구문론적 구문분석기 139
키프레이즈 추출 141
엔터티 추출 144
엔그램 특징추출 145
엔그램 인식 CorpusReader 147
올바른 엔그램 창 선택하기 149
유의한 병치 150
엔그램 언어 모델 153
빈도 및 조건부 빈도 154
최대 가능도 추정 157
알 수 없는 단어: 백오프 및 평활화 160
언어 생성 163
결론 164

CHAPTER 08 텍스트 시각화 167
특징공간 시각화 168
시각적 특징분석 168
유도된 특징공학 179
모델 진단 187
군집 시각화 188
계급 시각화 190
분류 오차 진단 191
시각적 조향 195
실루엣 점수 및 엘보 곡선 195
결론 198

CHAPTER 09 텍스트의 그래프 분석 201
그래프 계산 및 분석 203
그래프 기반 시소러스 만들기 203
그래프 구조 분석 205
그래프의 시각적 분석 206
텍스트에서 그래프 추출하기 207
소셜 그래프 만들기 208
소셜 그래프에서 통찰력 얻기 211
엔터티 분해 219
그래프상의 엔터티 분해 220
구조로 차단하기 221
퍼지 차단 221
결론 224

CHAPTER 10 챗봇 227
대화의 기초 228
대화: 간략한 의견 교환 230
대화 유지 233
예의바른 대화 규칙 236
인사와 경례 236
의사불통 다루기 241
재미있는 질문 244
의존 구문분석 245
구 구조 분석 246
질문 검출 249
스푼에서 그램으로 251
도움을 위한 학습 256
이웃이 되기 257
추천 정보 제공 260
결론 263

CHAPTER 11 멀티프로세싱과 스파크를 사용한 텍스트 분석론 확장 265
파이썬 멀티프로세싱 266
병렬로 작업 실행 269
프로세스 풀 및 큐 274
병렬 말뭉치 전처리 276
스파크를 사용한 클러스터 컴퓨팅 278
스파크 작업의 해부학 278
말뭉치 배포 280
RDD 운영 282
스파크를 이용한 자연어 처리 284
결론 296

CHAPTER 12 딥러닝과 그 이후 299

응용 신경망 300
신경 언어 모델 300
인공 신경망 301
딥러닝 아키텍처 306
정서 분석 311
심층 구조 분석 313
미래가 바로 눈앞에 318

용어 해설 321
찾아보기 338

저자소개

토니 오제다 (지은이)    정보 더보기
데이터 과학 자문 및 기업 훈련, 연구 및 오픈소스 공동 작업을 수행하는 회사인 디스트릭트 데이터 랩스(District Data Labs)의 창립자 겸 최고경영자로서, 그곳에서 오픈소스 도구를 사용한 응용 분석(사업 전략, 최적화, 예측 및 커리큘럼)에 집중하고 있다.
펼치기
벤자민 벵포트 (지은이)    정보 더보기
분산 시스템 기술과 머신러닝 및 그 밖의 기술에도 해박한 데이터 과학자다. 자연어 처리에서부터 파이썬을 이용한 데이터 과학, 하둡과 스파크를 이용한 분석에 이르기까지 다양한 주제에 관한 글을 쓴다.
펼치기
레베카 빌브로 (지은이)    정보 더보기
데이터 과학자이자 파이썬 프로그래머이자 교사이자 연사이자 작가다. 특징분석에서 모델 선택 및 하이퍼파라미터 조율에 이르기까지 시각적인 진단을 위한 머신러닝을 전문으로 하고, 자연어 처리, 의미 망 추출, 엔터티 분해 및 고차원 정보에 관해 연구했다.
펼치기
박진수 (옮긴이)    정보 더보기
정보기술(IT)과 관련하여 다양한 개발·저술·번역·기술 편집·기술 교정·자문·발표·기고를 해왔으며, 1인 기업을 세웠다가 닫기도 했다. 최근에는 주로 인공지능과 관련한 번역·자문·강의를 하고 있다. 저술하고 번역한 책들이 많아서 좁은 지면에 모두 나열하기 어렵지만, 원하는 독자라면 이 책들을 온라인 서점에서 역자의 이름으로 쉽게 검색해서 찾아볼 수 있을 것이다. 제이펍에서 출간한 번역서로는 《케라스 창시자의 딥러닝 with R》, 《R로 배우는 텍스트 마이닝》, 《파이썬으로 배우는 응용 텍스트 분석》, 《검색을 위한 딥러닝》, 《객체지향 사고 프로세스》, 《레시피로 배우는 아두이노 쿡북(제3판)》 등이 있다.
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책