책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 자바
· ISBN : 9788970509037
· 쪽수 : 268쪽
책 소개
목차
PART 01 시작하기
CHAPTER 01 비정형 데이터
1. 비정형 데이터 분석
1.1 비정형 데이터의 이해
1.2 비정형 데이터 분석과 마이닝
1.3 비정형 데이터 분석의 중요성
2. 텍스트 마이닝
2.1 텍스트 마이닝의 이해
2.2 텍스트 마이닝의 처리 과정
2.3 텍스트 마이닝의 기법
3. 소셜 데이터 마이닝
3.1 소셜 데이터 마이닝의 이해
3.2 소셜 데이터 마이닝의 활용
CHAPTER 02 R 시작하기
1. R 설치 및 실행
2. R스튜디오(RStudio)
2.1 R스튜디오 설치 방법
2.2 R스튜디오 기본 설정
3. JAVA 설치 및 환경 변수 설정
3.1 JAVA 설치 방법
3.2 JAVA 환경 변수 설정 방법
PART 02 JAVA를 활용하여 크롤링하기
CHAPTER 03 이클립스와 Jsoup 설치하기
1. 이클립스(eclips) 설치하기
2. Jsoup 설치하기
CHAPTER 04 네이버 뉴스 크롤링하기
1. URL 정리하기
2. URL 연결하기
3. 네이버 뉴스 기사 본문 크롤링
4. text로 글 정제하기
5. 본문 외의 크롤링
6. Fiddler
6.1 Fiddler 설치
6.2 Fiddler로 헤더 값 확인
6.3 Fiddler로 확인한 헤더정보 입력
6.4 Fiddler (결과창)
7. Attr 함수
8. 지금까지 결과(한 페이지 크롤링)
10. While문
11. 지금까지 한 결과(여러 페이지 크롤링)
CHAPTER 05 네이버 블로그 크롤링하기
1. 블로그 한 페이지 크롤링
2. 파싱할 사이트의 URL 입력
2.1 숨어 있는 진짜 URL 입력
2.2 숨어 있는 진짜 URL 결과 확인
2.3 URL 완성
3. 블로그 페이지 번호
3.1 블로그 페이지 번호(소스 입력)
3.2 블로그 페이지 번호
3.3 블로그 페이지 번호
4. 블로그 본문 크롤링
4.1 블로그 본문 크롤링
5. 파싱할 사이트의 URL 입력
6. Fiddler로 확인한 헤더정보 입력
7. 링크 주소 확인
7.1 링크 주소 입력
8. For문
9. If문
10. 지금까지 결과
11. While문(여러 페이지)
11.1 While문 시작
11.2 While문 닫기
PART 03 R을 활용하여 크롤링하기
CHAPTER 06 다음(Daum) 영화 네티즌 리뷰
CHAPTER 07 네이버(Naver) 영화 네티즌 리뷰
CHAPTER 08 트위터 크롤링
CHAPTER 09 네이버 뉴스 크롤링
PART 04 데이터 분석 및 시각화
CHAPTER 10 데이터 분석(정제)
CHAPTER 11 텍스트마이닝(R 패키지 활용)
1. 실습데이터 및 패키지 준비
2. 한글 사전 설정
3. 단어 추출하기
4. 단어 추출 조건 지정하기
5. 단어 추출 정제하기
6. 워드클라우드
7. 시각화
8. 연관어 분석
9. 단어 추출 및 트랜잭션 생성
10. 단어 간 연관 규칙 산출
11. 시각화
12. 단어 근접 중심성 파악
CHAPTER 12 시각화
1. Tagxdo
2. Worditout
3. Pajek
3.1 설치하기
3.2 Pajek 간단한 네트워크 만들기
3.3 Pajek 메르스 감염경로 확인해 보기 260