책 이미지

책 정보
· 분류 : 국내도서 > 대학교재/전문서적 > 한국방송통신대학교 > 자연과학대학 > 컴퓨터과학과
· ISBN : 9788920036743
· 쪽수 : 272쪽
· 출판일 : 2020-07-25
목차
제1장 데이터의 개념 및 환경 변화
1. 데이터의 개념
2. 데이터 환경의 변화
3. 데이터 활용을 위한 제도적 장치(데이터 3법)
4. 데이터 활용의 유의점
제2장 비정형 데이터 분석의 도구
1. 비정형 데이터의 분석
2. 분석 도구의 구현
3. 주요 프로그래밍 언어의 이해
4. 프로그래밍 언어의 선택
제3장 텍스트 데이터 불러오기
1. 비정형 데이터의 현황
2. 텍스트 데이터의 이해
3. 텍스트 데이터의 수집 방법
4. 텍스트 데이터 수집 사례
5. 유용한 R 패키지
제4장 텍스트 데이터의 전처리
1. 텍스트 데이터와 수치형 데이터의 표현 방식의 차이
2. 텍스트 데이터의 통계 분석을 위한 기본 가설
3. 토큰화
4. 대소문자 변환과 문장부호 삭제
5. 어간추출과 원형복원
6. 불용어 삭제
7. 실제 텍스트 데이터의 전처리
제5장 텍스트 데이터에 대한 탐색적 자료분석
1. 텍스트 데이터에 대한 탐색적 자료분석의 필요성
2. 텍스트 데이터의 요약
3. 단어의 출현 위치 탐색
4. 두 문서의 단어 출현 빈도 비교
5. 산점도를 이용한 두 문서의 비교
제6장 벡터공간모형을 이용한 텍스트 데이터 표현
1. 벡터공간모형
2. 문서-단어 행렬
3. 단어빈도-역문서빈도
4. 문서-단어 행렬의 특징
5. 단어 의미의 유사성
6. 워드 임베딩
제7장 텍스트 데이터의 통계적 분석
1. 텍스트 마이닝
2. 코사인 유사도를 이용한 문서의 분류
3. 텍스트 데이터에 대한 군집분석
4. 텍스트 데이터에 대한 분류분석
제8장 텍스트 데이터 분석 사례
1. 분석 대상 텍스트 데이터
2. 텍스트 데이터의 전처리
3. 텍스트 데이터의 탐색적 자료분석
4. 문서-단어 행렬과 코사인 유사도
5. 군집분석
6. 분류분석
■ 찾아보기