logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

스파크를 이용한 자연어 처리

스파크를 이용한 자연어 처리

(대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다)

앨릭스 토머스 (지은이), 이창현 (옮긴이)
한빛미디어
34,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
30,600원 -10% 0원
1,700원
28,900원 >
30,600원 -10% 0원
카드할인 10%
3,060원
27,540원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 27,200원 -10% 1360원 23,120원 >

책 이미지

스파크를 이용한 자연어 처리
eBook 미리보기

책 정보

· 제목 : 스파크를 이용한 자연어 처리 (대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791162244654
· 쪽수 : 440쪽
· 출판일 : 2021-08-20

책 소개

Spark NLP로 효율적인 애플리케이션을 설계하고 제작하는 방법을 소개한다. 구체적인 예제와 친절한 설명을 통해 기본적인 언어학과 문자 체계부터 감성 분석, 검색 엔진 구축까지 Spark NLP를 사용하는 데 필요한 모든 것을 다룬다.

목차

[PART I 기초]

CHAPTER 1 시작하기
1.1 Spark NLP와 자연어 처리
1.2 기타 도구
1.3 환경 설정
1.4 아파치 스파크에 익숙해지기
1.5 Spark NLP를 사용한 Hello World

CHAPTER 2 자연어 처리 기초
2.1 자연어 처리 정의
2.2 언어학
2.3 사회언어학
2.4 화용론
2.5 문자
2.6 인코딩
2.7 연습 문제: 토큰화
2.8 참고 자료

CHAPTER 3 아파치 스파크의 NLP 라이브러리
3.1 병렬처리, 동시성과 분산 컴퓨팅
3.2 아파치 스파크의 아키텍처
3.3 스파크 SQL과 Spark MLlib
3.4 NLP 라이브러리
3.5 Spark NLP
3.6 연습 문제: 토픽 모델 구축
3.7 참고 자료

CHAPTER 4 딥러닝 기초
4.1 경사 하강법
4.2 역전파
4.3 합성곱 신경망
4.4 순환 신경망
4.5 연습 문제 1
4.6 연습 문제 2
4.7 참고 자료

[PART II 빌딩 블록]

CHAPTER 5 단어 처리
5.1 토큰화
5.2 어휘 감소
5.3 단어 가방
5.4 CountVectorizer
5.5 n-gram
5.6 시각화: 단어 및 문서 분산
5.7 연습 문제
5.8 참고 자료

CHAPTER 6 정보 검색
6.1 역 인덱스
6.2 벡터 공간 모델
6.3 연습 문제
6.4 참고 자료

CHAPTER 7 분류와 회귀
7.1 BoW 기능
7.2 정규식 특성
7.3 특성 선택
7.4 모델링
7.5 반복
7.6 연습 문제

CHAPTER 8 케라스를 사용한 시퀀스 모델링
8.1 문장 분할
8.2 섹션 분할
8.3 품사 태깅
8.4 조건부 무작위장
8.5 청킹 및 구문 분석
8.6 언어 모델
8.7 순환 신경망
8.8 연습 문제: 문자 n-gram
8.9 연습 문제: 단어 언어 모델
8.10 참고 자료

CHAPTER 9 정보 추출
9.1 개체명 인식
9.2 상호 참조 해결
9.3 어서션 상태 감지
9.4 관계 추출
9.5 마치며
9.6 연습 문제

CHAPTER 10 주제 모델링
10.1 k-평균
10.2 잠재 의미 분석
10.3 음수 미포함 행렬 분해
10.4 잠재 디리클레 할당
10.5 연습 문제

CHAPTER 11 단어 임베딩
11.1 Word2Vec
11.2 글로브
11.3 패스트텍스트
11.4 변환자
11.5 ELMo, BERT와 XLNet
11.6 doc2vec
11.7 연습 문제

[PART III 애플리케이션]

CHAPTER 12 감성 분석과 감지
12.1 문제 진술과 제약
12.2 프로젝트 계획
12.3 솔루션 설계
12.4 솔루션 구현
12.5 솔루션 테스트와 측정
12.6 검토
12.7 마치며

CHAPTER 13 지식 베이스 구축
13.1 문제 진술과 제약
13.2 프로젝트 계획
13.3 솔루션 설계
13.4 솔루션 구현
13.5 솔루션 테스트와 측정
13.6 검토
13.7 마치며

CHAPTER 14 검색엔진
14.1 문제 진술과 제약 조건
14.2 프로젝트 계획
14.3 솔루션 설계
14.4 솔루션 구현
14.5 솔루션 테스트 및 측정
14.6 검토
14.7 마치며

CHAPTER 15 챗봇
15.1 문제 진술 및 제약
15.2 프로젝트 계획
15.3 솔루션 설계
15.4 솔루션 구현
15.5 솔루션 테스트 및 측정
15.6 검토
15.7 마치며

CHAPTER 16 객체 문자 인식
16.1 OCR 작업의 종류
16.2 문제 진술 및 제약
16.3 프로젝트 계획
16.4 솔루션 구현
16.5 솔루션 테스트 및 측정
16.6 모델 중심 지표
16.7 검토
16.8 마치며

[PART IV NLP 시스템 구축]

CHAPTER 17 다국어 지원
17.1 언어 유형
17.2 시나리오: 학술 논문 분류
17.3 다양한 언어의 텍스트 처리
17.4 전이 학습과 다국어 딥러닝
17.5 언어 간 검색
17.6 체크리스트
17.7 마치며

CHAPTER 18 수동 레이블링
18.1 가이드라인
18.2 시나리오: 학술 논문 분류
18.3 레이블러 간 동의
18.4 반복 레이블링
18.5 텍스트 레이블링
18.6 체크리스트
18.7 마치며

CHAPTER 19 NLP 애플리케이션 제작
19.1 Spark NLP 모델 캐시
19.2 Spark NLP와 텐서플로 통합
19.3 체크리스트
19.4 마치며

저자소개

앨릭스 토머스 (지은이)    정보 더보기
와이즈큐브(Wisecube)의 데이터 과학자다. 자연어 처리와 머신러닝에 임상 데이터, 신원 데이터, 고용주 및 구직자 데이터를 비롯해 현재는 생화학 데이터까지 사용하고 있다. 아파치 스파크 0.9 버전부터 UIMA와 OpenNLP를 포함한 NLP 라이브러리와 프레임워크로 작업해왔다.
펼치기
이창현 (지은이)    정보 더보기
컴퓨터공학을 전공하고 20여 년 간 다양한 산업체에서 소프트웨어(SW) 개발자로 활동했다. 최근에는 AI 활용 솔루션 및 데이터 보안 연구에 깊은 관심을 가지고 있으며, 평소에도 연구한 기술을 정리하고 소통하는 것을 즐긴다. 이러한 성향 덕분에 집필, 번역, 강의 등을 통해 독자 및 학생들과 활발히 소통하고 있으며, 특히 미래의 IT 개발자를 꿈꾸는 학생들을 교육하는 데 주력하고 있다. 현) 이창현코딩연구소 대표 전) 성신여자대학교 융합보안공학과 겸임교수 전) 서울시중부기술교육원 응용소프트웨어과 교수 전) ㈜SK 이노에이스 모바일엔진개발 전) ㈜웹젠 3D엔진 개발 대표 저서 『백엔드 입문자를 위한 모던 자바스크립트&Node.js』 길벗캠퍼스, 2023 『나혼자 C언어』 디지털북스, 2021 『나혼자 파이썬』 디지털북스, 2020 『C# 프로그래밍의 정석』 혜지원, 2019 등 총 9권 번역서 『스파크를 이용한 자연어 처리』 한빛미디어, 2021 『데이터 익명화를 위한 파이프라인』 한빛미디어, 2022 블로그 : https://blog.naver.com/jamsuham75 유튜브 : https://www.youtube.com/@jamsuham75
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9791162246573