logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

R과 Java로 크롤링하자

R과 Java로 크롤링하자

노규성, 김진화, 박성택, 김근원, 김도연 (지은이)
  |  
생능
2017-02-17
  |  
20,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

R과 Java로 크롤링하자

책 정보

· 제목 : R과 Java로 크롤링하자 
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 자바
· ISBN : 9788970509037
· 쪽수 : 268쪽

책 소개

초보자들도 쉽게 따라 할 수 있는 R과 JAVA를 활용하여 실습하면서 크롤링에 대한 이해와 실전 능력을 향상하도록 집필된 교재

목차

PART 01 시작하기
CHAPTER 01 비정형 데이터

1. 비정형 데이터 분석
1.1 비정형 데이터의 이해
1.2 비정형 데이터 분석과 마이닝
1.3 비정형 데이터 분석의 중요성
2. 텍스트 마이닝
2.1 텍스트 마이닝의 이해
2.2 텍스트 마이닝의 처리 과정
2.3 텍스트 마이닝의 기법
3. 소셜 데이터 마이닝
3.1 소셜 데이터 마이닝의 이해
3.2 소셜 데이터 마이닝의 활용

CHAPTER 02 R 시작하기
1. R 설치 및 실행
2. R스튜디오(RStudio)
2.1 R스튜디오 설치 방법
2.2 R스튜디오 기본 설정
3. JAVA 설치 및 환경 변수 설정
3.1 JAVA 설치 방법
3.2 JAVA 환경 변수 설정 방법


PART 02 JAVA를 활용하여 크롤링하기
CHAPTER 03 이클립스와 Jsoup 설치하기

1. 이클립스(eclips) 설치하기
2. Jsoup 설치하기

CHAPTER 04 네이버 뉴스 크롤링하기
1. URL 정리하기
2. URL 연결하기
3. 네이버 뉴스 기사 본문 크롤링
4. text로 글 정제하기
5. 본문 외의 크롤링
6. Fiddler
6.1 Fiddler 설치
6.2 Fiddler로 헤더 값 확인
6.3 Fiddler로 확인한 헤더정보 입력
6.4 Fiddler (결과창)
7. Attr 함수
8. 지금까지 결과(한 페이지 크롤링)
10. While문
11. 지금까지 한 결과(여러 페이지 크롤링)

CHAPTER 05 네이버 블로그 크롤링하기
1. 블로그 한 페이지 크롤링
2. 파싱할 사이트의 URL 입력
2.1 숨어 있는 진짜 URL 입력
2.2 숨어 있는 진짜 URL 결과 확인
2.3 URL 완성
3. 블로그 페이지 번호
3.1 블로그 페이지 번호(소스 입력)
3.2 블로그 페이지 번호
3.3 블로그 페이지 번호
4. 블로그 본문 크롤링
4.1 블로그 본문 크롤링
5. 파싱할 사이트의 URL 입력
6. Fiddler로 확인한 헤더정보 입력
7. 링크 주소 확인
7.1 링크 주소 입력
8. For문
9. If문
10. 지금까지 결과
11. While문(여러 페이지)
11.1 While문 시작
11.2 While문 닫기

PART 03 R을 활용하여 크롤링하기
CHAPTER 06 다음(Daum) 영화 네티즌 리뷰


CHAPTER 07 네이버(Naver) 영화 네티즌 리뷰

CHAPTER 08 트위터 크롤링

CHAPTER 09 네이버 뉴스 크롤링


PART 04 데이터 분석 및 시각화
CHAPTER 10 데이터 분석(정제)

CHAPTER 11 텍스트마이닝(R 패키지 활용)

1. 실습데이터 및 패키지 준비
2. 한글 사전 설정
3. 단어 추출하기
4. 단어 추출 조건 지정하기
5. 단어 추출 정제하기
6. 워드클라우드
7. 시각화
8. 연관어 분석
9. 단어 추출 및 트랜잭션 생성
10. 단어 간 연관 규칙 산출
11. 시각화
12. 단어 근접 중심성 파악

CHAPTER 12 시각화
1. Tagxdo
2. Worditout
3. Pajek
3.1 설치하기
3.2 Pajek 간단한 네트워크 만들기
3.3 Pajek 메르스 감염경로 확인해 보기 260

저자소개

노규성 (지은이)    정보 더보기
한국소프트웨어기술인협회 회장이다. 현재 생성형AI연구회 회장, ≪전자신문≫ 부설 디지털융합연구원 원장으로 활동하고 있다. 한국외대 경영학부를 졸업하고 동 대학원에서 경영정보학 석사와 박사학위를 받았다. 선문대 경영학과 교수, 제16대 대통령직인수위원회 경제제2분과 자문위원, 국정기획자문위원회 전문위원, 대통령직속 4차산업혁명위원회 위원, 한국생산성본부 회장, APO(Asian Productivity Organization) 이사, 한국디지털정책학회 회장 등으로 활동했다. 한국e-비즈니스대상(산업자원부장관 표창), 대통령 표창장(정부혁신 기여), 근정포장(정부업무 발전 기여), 동탑산업훈장(국가 정보통신 정책 수립 공헌)을 수상했다. 저역서로 『생성형 AI 프롬프트 디자인』(2023), 『빅데이터 개론』(2023), 『디지털 비즈니스 디자인』(번역, 2022), 『디지털 대전환 시대의 전략경영 혁신』(2022) 등이 있다. “뉴노멀 시대의 디지털 기반 전략경영에 관한 연구”, “디지털 트랜스포메이션의 경쟁전략과의 적합성에 관한 연구” 등 다수의 연구 논문과 보고서가 있다.
펼치기
김근원 (지은이)    정보 더보기
현) 한국소프트웨어기술인협회 빅데이터 연구원 서강대학교 대학원 경영학과 석사과정
펼치기
김도연 (지은이)    정보 더보기
현) 한국환경정책평가연구원 빅데이터연구팀 연구원 충북대학교 대학원 정보보호경영학과 석사 한국직업능력개발원 위촉연구원
펼치기

추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책