logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

데이터 과학자, 무엇을 배울 것인가

데이터 과학자, 무엇을 배울 것인가

(빅 데이터 시대의 데이터 과학자 양성 독본)

사토 히로유키, 하라다 히로우에, 시모다 노리히로, 기무라 슌야, 오나리 히로코, 오쿠노 아키히로, 나카가와 테이토, 하시모토 타케히로, 사토 요헤이, 와다 카즈야, 하야카와 아츠시, 쿠라하시 잇세이 (지은이), 정인식 (옮긴이)
제이펍
24,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 로딩중
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

데이터 과학자, 무엇을 배울 것인가
eBook 미리보기

책 정보

· 제목 : 데이터 과학자, 무엇을 배울 것인가 (빅 데이터 시대의 데이터 과학자 양성 독본)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9788994506975
· 쪽수 : 316쪽
· 출판일 : 2014-06-30

책 소개

R 언어를 이용한 데이터 파악, 시각화, 그리고 실제 마케팅 분석 사례를 통해 데이터 과학자의 업무를 소개하고 있다. 또한, 데이터 분석을 위한 Python(파이썬)의 기계 학습과 데이터 마이닝 및 여러 알고리즘에 대해서도 다루고 있다.

목차

권두 기획 | 데이터 과학자의 업무 기술: 스킬 세트, 데이터 분석 프로세스, 빅 데이터를 취급하는 방법 .. 1

Chapter 01 | 데이터 과학자에 필요한 스킬: 데이터에 스토리를 말하게 해볼까? 2
일본에서의 빅 데이터 원년 2
비즈니스 데이터 분석의 역사 5
고객도, 범인도 빠져나갈 수 없다 8
의사결정을 위한 움직임(활동) 11
필요로 하는 스킬들 14
미래의 데이터 과학자는 어디에 있을까? 17
정리 18

Chapter 02 | 데이터 과학자의 프로세스: 비즈니스 성과를 의식한 분석 방법 19
시작에 앞서 19
데이터 가공의 흐름 24
데이터 과학자가 성공하는 조건 27
데이터 과학 실패의 본질 29
정리 31

Chapter 03 | 데이터 핸들링을 위한 “빅 데이터 인프라” 입문 32
대량의 데이터를 고속으로 계산할 수 있는 시대 32
데이터베이스 33
데이터베이스의 종류 35
데이터베이스와의 접속 38
데이터 분석 기술 39
데이터베이스와 분석 40
데이터 과학 Loves 빅 데이터 43
정리 44

column | 스킬의 표준화와 캐리어 형성을 위한 데이터 과학자 협회의 활동 45
설립 배경 45
협회의 개요 46
협회의 활동 48
데이터 과학자 협회의 조직과 운영 48
데이터 과학자의 스킬 표준(DSSS)에 대하여 49

특집 1 | 데이터 분석 실천 입문: 데이터 과학자로의 첫걸음 .. 53

Chapter 01 | R 언어로 통계 분석을 시작하자: 데이터의 파악, 시각화와 다변량 분석 54
시작하며 54
R 언어의 도입 54
데이터 파악 56
다변량 분석: 예측 63
다변량 분석: 분류 72
기계 학습 79
정리 83

Chapter 02 | 데이터 과학자 필수 지식: 엔지니어에 필요한 데이터 분석 지식 84
시작하며 84
데이터 분석 소프트웨어 84
데이터의 취득 86
데이터의 클린징 93
데이터 분석 99
정리 112

Chapter 03 | RStudio로 간편하게 데이터 분석하기: R 언어를 좀 더 편리하게 사용할 수 있는 통합 개발환경 113
시작하며 113
RStudio를 사용해 보자 114
Reproducible Research의 추천 123
한 발짝 앞선 RStudio 활용법 130
RStudio Server를 사용해 보자 132
정리 136

Chapter 04 | Python을 이용한 기계 학습: 풍부한 라이브러리를 활용한 데이터 분석 137
시작하며 137
정리 163
Chapter 05 | C4.5/k-means/서포트 벡터 머신/아프리오리/ EM 등
데이터 마이닝에 필요한 10가지 알고리즘 164
시작하며 164
정리 173

특집 2 | 스킬 업을 위한 마케팅 분석 본격 입문 .. 175

Chapter 01 | R 언어를 이용한 마케팅 분석: 데이터 과학을 적용한 광고 전략과 사이트 개선 176
시작하며 176
포지셔닝 전략 세우기 176
광고 전략 세우기 186
웹 사이트를 개선하여 매출 높이기 193

Chapter 02 | 믹시의 대규모 데이터 마이닝 사례: 타기팅 광고 리플레이스의 포인트 공개 203
시작하며 203
구 인터레스트 타기팅 206
신 인터레스트 타기팅 211
정리 221

Chapter 03 | 마케팅에 유용한 소셜 미디어 네트워크 분석 222
시작하며 소셜 네트워크 분석이란? 222
기본 개념에 대한 정의 223
소셜 네트워크의 특징량 계산 227
소셜 네트워크 분석을 마케팅에 활용해 보자 230
정리 235

특별 기사 | Fluentd 입문: 실시간 로그 수집으로 로그 해석을 스마트하게 236
Fluentd란? 236
사용법 244
Fluentd 활용 방법 248
사례 소개 253
정리 262

특별 기획 | 데이터 분석을 위한 필수 기초 지식 .. 263

Chapter 01 | SQL 입문: 관계형 데이터베이스 조작에 필요한 언어 264
기초편 264
실전편 269
정리 281

Chapter 02 | 웹 스크래핑 입문: 웹 사이트로부터 정보를 수집하는 기술 282
시작하며 282
웹 스크래핑을 시작하기 전에 282
웹 스크래핑에 이용할 수 있는 모듈 283
urllib2에 의한 리소스 데이터의 취득 284
BeautifulSoup에 의한 리소스 데이터의 검색과 취득 288
lxml에 의한 xPath 대응 요소의 취득 293
정리 295

찾아보기 296

저자소개

사토 히로유키 (지은이)    정보 더보기
펼치기
하라다 히로우에 (지은이)    정보 더보기
펼치기
시모다 노리히로 (지은이)    정보 더보기
펼치기
기무라 슌야 (지은이)    정보 더보기
펼치기
오나리 히로코 (지은이)    정보 더보기
펼치기
오쿠노 아키히로 (지은이)    정보 더보기
펼치기
나카가와 테이토 (지은이)    정보 더보기
펼치기
하시모토 타케히로 (지은이)    정보 더보기
펼치기
사토 요헤이 (지은이)    정보 더보기
주식회사 드리컴 데이터분석그룹 소속. 특기는 R 언어를 활용한 데이터분석. Tokyo.R 주최자. 前) 추천 로직, 주식예측모델 구축이나 데이터마이닝, 마케팅 분석 업무를 담당했다. 現) 드리컴에서 데이터 분석환경 구축, 데이터 분석 업무를 담당한다. 아름다운 통계이론을 조금이라도 비즈니스에서 활용할 수 있도록 열심히 노력 중이다. 저서로는 『데이터 사이언티스트 양성독본』(기술평론사), 『R 패키지 가이드북』(도쿄 서적) 등이 있다.
펼치기
와다 카즈야 (지은이)    정보 더보기
펼치기
하야카와 아츠시 (지은이)    정보 더보기
펼치기
쿠라하시 잇세이 (지은이)    정보 더보기
펼치기
정인식 (옮긴이)    정보 더보기
숭실대학교에서 전자계산학을 전공하고 현대정보기술 eBiz 기술팀에서 웹 애플리케이션 개발 및 B2B 마켓플레이스 설루션을 연구했다. 그 후 이동통신 단말기 분야로 옮겨 휴대폰 부가서비스 개발 업무를 담당했으며, 일본에서 키스코 모바일사업부 팀장으로 교세라의 북미향 휴대폰 개발에 참여했다. 퇴직 후 현재는 일본 주식회사 WiseJIn의 대표이사 겸 엔지니어로, 일본의 주요 통신사와 공공 서비스 분야에서 업무 프로세스 개선을 위한 IT 컨설팅을 펼치며 데이터 분석 관련 툴과 웹 서비스 개발을 하고 있다. 《네트워크 이해 및 설계 가이드(개정판)》(제이펍, 2022), 《배워서 바로 쓰는 스프링 부트 2》(한빛미디어, 2020), 《알파고를 분석하며 배우는 인공지능》(제이펍, 2019) 등 20권 이상의 책을 번역했다.
펼치기

책속에서

본 권두 기획에서는 데이터 과학자가 필요하게 된 시대적 배경부터 데이터 분석의 역사, 필요한 스킬들을 기초 지식으로서 소개한다. 그리고서 데이터 분석 프로세스에서 항상 염두에 둬야 할 비즈니스 성과와 빅 데이터를 지탱하는 인프라의 기초에 대해 설명하겠다. 이 기획을 통해 서 우선 무엇부터 배우면 좋은지, 그리고 어떠한 마음가짐을 가져야 하는지 파악해 보자.


지금까지 데이터 과학의 프로세스에 대해 설명하였다. 데이터 과학의 대략적인 흐름을 알았다고 생각한다. 계속해서 데이터 과학의 프로세스 중에서도 특히 많은 시간이 할애되는 데이터 가공에 주목하여 데이터의 종류와 데이터 값의 정의에 대해 설명하겠다.


데이터 분석이라는 한마디 말로 말하기에는 다양한 툴이 넘쳐나고 있다. 일단, 데이터 분석에서 주로 사용하는 R 언어로 통계 해설의 지식을 설명하고, 이와 더불어 구체적인 데이터를 사용하여 분석의 흐름을 소개하겠다. 또한, R 언어의 개발을 도와주는 RStudio의 설명과 함께, 데이터 분석 프로젝트의 유지보수 방법을 소개하겠다. 이와 더불어 데이터 분석 라이브러리가 풍부한 Python(파이썬)으로 기계 학습, 데이터 분석에 필요한 알고리즘도 설명하겠다. 여기에서 설명하는 데이터는 일부밖에 없지만, 실제 데이터 분석을 할 때 유용한 것들을 배울 수 있을 것이다.


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책