logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

자연어 처리 쿡북 with 파이썬

자연어 처리 쿡북 with 파이썬

(파이썬으로 NLP를 구현하는 60여 가지 레시피)

크리슈나 바브사, 나레쉬 쿠마르, 프라탑 단게티 (지은이), 지은 (옮긴이)
에이콘출판
30,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
27,000원 -10% 0원
1,500원
25,500원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

자연어 처리 쿡북 with 파이썬
eBook 미리보기

책 정보

· 제목 : 자연어 처리 쿡북 with 파이썬 (파이썬으로 NLP를 구현하는 60여 가지 레시피)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161752655
· 쪽수 : 344쪽
· 출판일 : 2019-01-31

책 소개

데이터 과학 시리즈. 파이썬과 자연어 툴킷(NLTK)을 이용해 자연어처리(NLP)를 수행하는 다양한 방법을 알려주는 독창적인 레시피가 담긴 책이다.

목차

1장. 말뭉치와 워드넷
__소개
__내장 말뭉치 액세스
__외부 말뭉치 다운로드, 로드하고 액세스하기
__브라운 코퍼스에서 세 가지 장르의 wh 단어 모두 세기
__웹 및 채팅 텍스트 자료 파일 중 하나에서 빈도 분포 작업 탐색
__모호한 단어를 가지고 워드넷을 사용해 모든 의미 탐구
__두 개의 구별되는 동의어 집합을 선택하고 워드넷을 사용해 상위어와 하위어 개념 탐색
__워드넷으로 명사, 동사, 형용사, 부사의 다의어 평균 계산


2장. 처리 전 텍스트, 소싱, 정규화
__소개
__문자열 연산의 중요성
__문자열 연산 심화
__파이썬에서 PDF 파일 읽기
__파이썬에서 워드 문서 읽기
__PDF, DOCX, 일반 텍스트 파일을 가져와 사용자 정의 말뭉치 생성
__RSS 피드에서 내용 읽기
__BeautifulSoup를 사용한 HTML 파싱


3장. 전처리
__소개
__토큰화-NLTK 내장 토크나이저 사용법
__스테밍-NLTK 내장 스테머 사용법
__원형 복원-NLTK WordnetLemmatizer 사용법
__불용어-불용어 말뭉치 사용법과 불용어가 만들어내는 차이점 확인
__편집 거리-두 문자열 간의 편집 거리를 찾기 위한 알고리즘 작성
__두 단문 처리와 둘 사이의 공통 어휘 추출


4장. 정규표현식
__소개
__정규표현식-*, +, ? 사용법
__정규표현식-$와 ^, 단어의 시작과 끝이 아닌 단어를 사용하는 방법
__여러 개의 리터럴 문자열과 하위 문자열 검색
__날짜 정규표현식과 문자 집합 또는 문자 범위 집합 만들기
__문장에서 모든 다섯 글자 단어를 찾고 약어 만들기
__자체 정규식 토크나이저 작성법
__자체 정규식 스테머 작성법


5장. 품사 태깅과 문법
__소개
__내장 태거 탐구
__자체 태거 작성
__자체 태거 학습
__자체 문법 작성 학습
__확률적 문맥 무관 문법-CFG 작성
__재귀 CFG 작성


6장. 청킹, 문장 구문 분석, 의존성
__소개
__내장 청커 사용
__간단한 청커 작성
__청커 학습
__재귀 하향 구문 분석
__시프트 변환 구문 분석
__의존 문법과 투사 의존성 구문 분석
__차트 구문 분석


7장. 정보 추출과 텍스트 분류
__소개
__내장 개체명 인식 기능 사용
__딕셔너리 생성, 반전, 사용
__피처셋 선택
__분류기를 사용한 문장 분할
__문서 분류
__문맥 기반 품사 태거 작성


8장. 고급 NLP 레시피
__소개
__NLP 파이프라인 생성
__텍스트 유사도 문제 해결
__주제 식별
__텍스트 요약
__대용어 해결
__단어 의미 명확화
__감정 분석 수행
__고급 감정 분석 탐색
__대화형 비서 또는 챗봇 만들기


9장. NLP의 딥러닝 적용
__소개
__TF-IDF 생성 후 심층 신경망을 이용한 이메일 분류
__합성곱망 CNN 1D를 이용한 IMDB 감정 분류
__양방향 LSTM을 이용한 IMDB 감정 분류
__신경 단어 벡터 시각화를 사용해 고차원의 단어를 2차원으로 시각화


10장. NLP 분야에서 딥러닝의 고급 응용
__소개
__LSTM을 사용해 셰익스피어의 저서에서 고급 자동 텍스트 생성
__메모리 네트워크를 사용해 에피소드 데이터에 대한 질의 응답
__순환 신경망을 사용해 다음 단어를 예측하는 언어 모델링-LSTM
__딥러닝 순환망을 사용하는 생성 챗봇 개발-LSTM

저자소개

나레쉬 쿠마르 (그림)    정보 더보기
「포춘(Fortune)」이 선정한 5백대 기업에서 대규모 인터넷 애플리케이션을 설계, 구현하고 운용하는 데 수십 년 이상의 전문 경험을 보유하고 있다. 전자상거래, 웹 호스팅, 의료, 빅데이터 및 분석, 데이터 스트리밍, 광고, 데이터베이스 등의 분야에서 실무 경험을 쌓은 풀스택 아키텍트다. 오픈소스를 신봉하며 적극적으로 기여한다. 리눅스 시스템 내부에서부터 프론트엔드에 이르기까지 최신식의 기술을 알고자 노력한다. 인도 라자스탄주(Rajasthan)에 있는 비츠 필라니(BITS-Pilani)대학에서 컴퓨터과학과 경제학을 복수 전공했다.
펼치기
프라탑 단게티 (지은이)    정보 더보기
방갈로 TCS 혁신 연구소의 '분석과 통찰' 부서에서 구조화 이미지 및 텍스트 솔루션 개발과 관련된 머신 러닝과 딥러닝 솔루션을 개발하고 있다. 분석학과 데이터 과학 분야에 폭넓은 경험을 갖고 있으며, 봄베이 IIT에서 산업공학과 오퍼레이션 리서치로 석사 학위를 받았다. 인공지능에 큰 관심을 갖고 있으며, 쉬는 날에는 차세대 기술과 혁신적 기법과 관련된 책을 즐겨 읽는다.
펼치기
크리슈나 바브사 (지은이)    정보 더보기
서비스업, 은행업, 헬스케어 등과 같은 다양한 산업 영역에서 10년간 근무하며 자연어 처리, 소셜미디어 분석, 텍스트 마이닝 작업을 했다. Stanford CoreNLP, IBM의 SystemText와 BigInsights, GATE, NLTK와 같은 다양한 NLP 라이브러리에서 텍스트 분석과 관련된 산업 문제를 해결하기 위해 연구했다. 또한 유명 TV 프로그램과 인기 있는 리테일 브랜드와 제품에 대한 소셜미디어 반응을 분석하는 일을 하고 있다. 2010년 NAACL에서 감정 분석 기술에 관한 논문을 발표했다. 최근에 NLP 파이프라인/툴 세트를 만들어 대중에게 오픈소스로 공개했다. 학문과 기술 외에도 오토바이와 축구에 대해 열정을 지니고 있다. 여가 시간에는 여행하고 탐험하는 것을 좋아한다. 오토바이로 인도를 일주하고 배낭여행으로 동남아시아와 유럽의 대부분의 국가를 여행했다.
펼치기
지은 (옮긴이)    정보 더보기
인포메이션 아키텍처, 데이터 시각화, 콘텐츠 큐레이션 등 다방면에 관심이 많다. 장르를 불문하고, 글을 짓는 작가들 그리고 어떤 언어로 된 글을 다른 언어의 글로 옮기는 데 힘을 쏟고 있는 모든 이에게 경의를 표한다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책