logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

빅데이터 분석방법론

빅데이터 분석방법론

(인문사회과학을 위한)

이석민 (지은이)
윤성사
26,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
24,700원 -5% 0원
1,300원
23,400원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

빅데이터 분석방법론
eBook 미리보기

책 정보

· 제목 : 빅데이터 분석방법론 (인문사회과학을 위한)
· 분류 : 국내도서 > 사회과학 > 사회학 > 사회학 일반
· ISBN : 9791188836284
· 쪽수 : 432쪽
· 출판일 : 2019-06-30

책 소개

인문사회과학분야에 관심이 있는 독자들에게 좀 더 편안한 빅데이터 분석 개념에의 접근과 방법을 활용할 수 있도록 하는데 목적을 두고 집필된 책이다. 설명은 최대한 직관적으로 하려 했고, 실생활에서 얻을 수 있는 자료들을 주로 사용해서 이해를 돕고자 하였다.

목차

1부
1장 4차 산업혁명과 인문사회과학 15
1절. 자연과학과 인문사회과학 15
2절. 4차 산업혁명과 인공지능 기술 17
3절. 지능정보기술로 인한 파급 효과 23
1. 산업경제적 측면 23
2. 고용구조적 측면 25
3. 사회문화적 측면 27
4절. 4차 산업혁명과 인문사회과학 29
5절. 데이터 과학과 빅데이터 분석 32
1. 데이터 과학 32
2. 데이터 과학자 35
3. 빅데이터 분석 36
2장R 설치와 기초 문법 41
1절. R의 특징 41
2절. R과 RStudio 설치 45
1. R 설치 45
2. RStudio 설치 53
3. RStudio 설정 55
4. RStudio 실행 57
3절 데이터 불러오기와 저장하기 63
1. 함수와 객체 63
2. 작업공간 확인 64
3. 패키지 설치와 불러오기 65
4. 데이터 불러오기 67
5. 데이터 저장하기 69
6. 분석 결과물 저장하기 71
7. 스크립트 파일 가져오기\저장하기와 그래픽 저장하기 71
3장 데이터 구조와 전처리 72
1절. R의 데이터 구조 72
2절. 데이터 프레임 편집 77
1. cbind( )와 rbind( ) 77
2. merge( ) 78
3. 결측값(NA) 80
4. subset( ) 80
5. colnames( ) 81
6. 인덱싱(indexing) 82
3절. apply 함수 83
1. apply 함수
2. lapply 함수 84
3. sapply 함수 85
4. tapply 함수 85
4절. dplyr 활용 86
1. filter 함수 87
2. select 함수 88
3. arrange 함수 89
4. mutate 함수 89
5. summarise 함수 90

2부
4장 기초 통계분석 95
1절. 자료 정제 95
1. 원자료 살펴보기 95
2. 자료 불러오기 96
3. 자료 변환과 탐색 98
4. 결측값 확인 및 처리 104
5. 이상값 탐색 및 제거 106
6. 회귀분석 109
5장 시각화 113
1절. 기본 산점도: plot( ) 함수 114
1. 데이터 내보내기와 불러오기 114
2. 산점도 115
2절. ggplot2 118
1. 필수 함수 - ggplot( ) 119
2. geom_그래프 계열 120
3. 기타 126
3절. 모자이크 함수 129
6장 군집분석 133
1절. 군집분석의 종류와 단계 134
1. 군집분석의 의의와 종류 134
2. 군집분석의 단계 135
2절. 분할적 군집분석: K 평균(K-means) 138
1. 개념 138
2. 사례: 폭력범죄 비율 140
3절. 계층적 군집 방법 149
1. 개념 149
2. 사례: 단백질 음식 소비 151
4절. 시장 세분화(Market Segments) 157
1. 전처리 158
2. 분석 166
7장 분류분석
1절. 의사결정나무 183
1. 개요 183
2. 사례 1(연속형 종속 변수): 온도 결정 184
3. 사례 2(범주형 종속 변수): 타이타닉 생존 결정 186
2절. 랜덤 포레스트 189
1. 개요 189
2. 사례 1(범주형 종속변수) : 신체 움직임 유형 190
3. 사례 2(연속형 종속변수) : 주택가격 192
4. 비교 사례: 타이타닉 호 194
3절. 로지스틱 회귀분석 196
1. 개요 196
2. 사례 1(이항 로지스틱) : 학내 취업 프로그램 198
3. 사례 2(다항 로지스틱) : 신체 움직임 유형 200
4. 비교 사례: 타이타닉 호 201
8장 연관분석 205
1절. 기본 개념 205
2절. 연관규칙 평가척도 206
1. 지지도 207
2. 신뢰도 207
3. 향상도 208
3절. 파일 형식 209
4절. 사례분석 1: 마켓 거래 품목 210
1. 자료 탐색 210
2. 연관분석 214
5절. 사례분석 2: 도서관 대출 219
1. 자료 탐색 219
2. 연관분석 224

3부
9장 텍스트 분석 : 기초 233
1절. 리스트 233
2절. 함수의 구조 236
1. 조건문과 반복문 236
2. 함수 237
3절. 텍스트 분석과 자연어 처리 238
1. 자연어 처리의 개념 239
2. 텍스트 데이터 전처리 241
3. 텍스트 분석 기법들 243
4절. 텍스트 전처리와 DTM 생성 244
1. 형태소 분석과 전처리 245
2. DTM 문서 생성 251
5절. 데이터 탐색 및 분석: 박근혜 vs 문재인 연설문 비교 253
1. 데이터 탐색 253
2. 워드 클라우드 255
3. 비교 분석 257
4. TF-IDF 261
5. 상관관계 262
10장 크롤링과 텍스트 분석 265
1절. 크롤링의 기본 개념 266
2절. 뉴스 기사 크롤링과 논쟁 비교 분석 267
3절. 영화 댓글 크롤링과 흥행 예측분석: <완벽한 타인> 275
4절. 뉴스 기사 댓글 크롤링과 연관 네트워크 분석 291
5절. 상품평 크롤링(1): 네이버 홈쇼핑 303
6절. 상품평 크롤링(2): 11번가 홈쇼핑 307
11장 토픽모형 312
1절. 잠재적 디리클레 할당 모형(LDA): 기술적 연구 312
1. 생성적 확률모형 312
2. 위계적 베이지안 모형 316
3. LDA 추정 319
4. LDA 분석: 4차 산업혁명과 정부의 역할(1) 322
2절. 구조 토픽모형(STM): 변수에 의한 설명적 연구 336
1. STM의 개념 336
2. STM 분석: 4차 산업혁명과 정부의 역할(2) 340
3. STM과 준실험설계 연구 358
12장 감성분석 361
1절. 개요 361
2절. 구글 클라우드 가입 364
3절. 뉴스 기사 감성분석: 소득 주도 성장 369
4절. 영화평 감성분석: <마약왕> 372
13장 딥 러닝 기법word2vec 383
1절. one-hot-encoding과 단어 임베딩 383
2절. word2vec 학습과 연산 387
1. Skip-Gram 모형 387
2. CBOW 모형 392
3. word2vec의 벡터 연산 394
3절. word2vec으로 문서 분류하기 396
4절. word2vec 분석 : 4차 산업혁명과 정부의 역할(3) 399
1. 연관 키워드 추출 399
2. 연관 네트워크 407
3. 문서 분류 409
참고 문헌 417
찾아보기 421

저자소개

이석민 (지은이)    정보 더보기
서울대학교에서 인류학(학부), 의회정치(석사), 과학기술정책(박사)을 수학했으며, 포닥 과정에서 통계학과 계량경제학을 연구했다. 인류학적 관찰에서 시작해 정치학과 정책학의 이론적 토대를 거쳐, 계량경제학과 통계학의 방법론적 엄밀성을 습득한 후, 최근에는 딥러닝과 생성형 AI를 정책 현장에 적용하는 연구를 수행하고 있다. 수원대학교 행정학과에서 빅데이터분석에 입문했으며, 현재 한신대학교 공공인재빅데이터융합학부에서 AI 기반 정책분석과 딥러닝 응용 연구를 진행하고 있다. 『AI를 활용한 시니어 정신건강 진단 앱』을 개발하고 특허출원했다. 저서로는 『R과 STATA를 활용한 정책평가방법론』, 『빅데이터분석방법론』, 『구조방정식: 준실험설계접근』 등이 있으며, 행정학 학술지와 정보처리학회지 등에 논문을 게재했다. 웹프로그래밍, 데이터베이스, MLOps, 딥러닝 자연어처리 및 영상처리, AI 에이전트, 정책분석평가, 분석기획론 등 인문사회과학과 AI·Software 기술을 융합하는 교육을 실천하고 있다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책