logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

일간
|
주간
|
월간

실시간 검색어

검색가능 서점

도서목록 제공

파이썬으로 배우는 데이터 과학

파이썬으로 배우는 데이터 과학

(데이터 전처리부터 탐색적 분석, 데이터 시각화, 추론 및 예측까지)

샘 라우, 조셉 곤잘레스, 데보라 놀란 (지은이), 권정민 (옮긴이)
영진.com(영진닷컴)
36,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
32,400원 -10% 0원
1,800원
30,600원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

파이썬으로 배우는 데이터 과학
eBook 미리보기

책 정보

· 제목 : 파이썬으로 배우는 데이터 과학 (데이터 전처리부터 탐색적 분석, 데이터 시각화, 추론 및 예측까지)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9788931481488
· 쪽수 : 696쪽
· 출판일 : 2025-12-10

책 소개

데이터 과학이 무엇인지 알려준다. 잠깐 생겼다가 사라지는 기술이 아닌 데이터 과학의 기본 구성 요소를 제공한다. 데이터 과학의 한 부분만을 다루는 것이 아닌 데이터를 어떻게 해석하고 전체 주기를 따르면서 데이터 분석의 처음과 끝을 다룰 수 있게 도와주고 있다.

목차

1부 데이터 과학 주기
1장 데이터 과학 주기

1.1 데이터 과학 주기의 단계
1.2 데이터 과학 주기를 보여주는 예제
1.3 정리

2장 질문과 데이터 범위
2.1 빅데이터와 새로운 기회
2.2 대상 집단, 접근 프레임, 표본
2.3 수단 및 프로토콜
2.4 자연현상 측정
2.5 정확도
2.6 정리

3장 시뮬레이션과 데이터 설계
3.1 항아리 모델
3.2 예제: 선거 여론조사의 편향과 변동 시뮬레이션
3.3 예제: 백신 무작위 임상시험 시뮬레이션
3.4 예시: 대기질 측정
3.5 정리

4장 요약 통계량 모델링
4.1 상수 모델
4.2 손실 최소화
4.3 정리

5장 예제: 왜 내가 타는 버스는 맨날 늦을까?
5.1 질문과 범위
5.2 데이터 전처리
5.3 버스 시간 탐색
5.4 대기 시간 모델링
5.5 정리

2부 테이블 데이터
6장 Pandas를 사용한 데이터 프레임 다루기

6.1 나누기
6.2 집계
6.3 조인
6.4 변환
6.5 데이터 프레임은 다른 데이터 표현형과 어떻게 다를까?
6.6 정리

7장 SQL을 사용해서 관계형 데이터 다루기
7.1 나누기
7.2 집계
7.3 조인
7.4 변환과 공통 테이블 표현식(CTE)
7.5 정리

3부 데이터 이해
8장 파일 처리
8.1 데이터 예제
8.2 파일 형식
8.3 파일 인코딩
8.4 파일 크기
8.5 쉘과 명령어
8.6 테이블의 형태 및 구분 방식
8.7 정리

9장 데이터 프레임 전처리
9.1 예제: 마우나 로아 관측소에서의 CO_2 측정치 전처리
9.2 품질 확인
9.3 결측치와 기록
9.4 데이터 변환과 타임스탬프
9.5 구조 변경
9.6 예제: 식당 안전성 위반 사항 전처리
9.7 정리

10장 탐색적 데이터 분석
10.1 특성 유형
10.2 분포를 확인할 때
10.3 관계를 확인할 때
10.4 다변량 경우의 비교
10.5 탐색 시의 지침 사항
10.6 예제: 주택 거래가
10.7 정리

11장 데이터 시각화
11.1 구조 파악을 위한 축의 범위 선택
11.2 데이터 평활법과 집계
11.3 의미 있는 비교 유도하기
11.4 데이터 설계 통합
11.5 맥락 추가하기
11.6 plotly를 사용해서 그래프 그리기
11.7 그 외 시각화 도구
11.8 정리

12장 예제: 대기질 측정 내용은 얼마나 정확할까요?
12.1 질문, 설계, 범위
12.2 근처에 배치된 센서 찾기
12.3 AQS 센서 데이터 전처리
12.4 퍼플에어 센서 데이터 전처리
12.5 퍼플에어와 AQS 측정치 탐색
12.6 퍼플에어 측정치 보정을 위한 모델 생성
12.7 정리

4부 다른 유형의 데이터
13장 텍스트 다루기

13.1 텍스트와 처리 작업 예제
13.2 문자열 조작
13.3 정규표현식
13.4 텍스트 분석
13.5 정리

14장 데이터 교환
14.1 NetCDF 데이터
14.2 JSON 데이터
14.3 HTTP
14.4 REST
14.5 XML, HTML 및 XPath
14.6 정리

5부 선형 모델링
15장 선형 모델링

15.1 단순 선형 모델
15.2 예제: 대기질 측정을 위한 단순 선형 모델
15.3 단순 선형 모델 적합화
15.4 다중 선형 모델
15.5 다중 선형 모델 적합화
15.6 예제: 어디에 기회의 땅이 있습니까?
15.7 수치 측정치를 위한 특성 공학
15.8 범주형 측정치를 위한 특성 공학
15.9 정리

16장 모델 선택
16.1 과적합
16.2 훈련-테스트 분할
16.3 교차 검증
16.4 정규화
16.5 모델 편향 및 분산
16.6 정리

17장 추론 및 예측 이론
17.1 분포: 모집단, 경험치, 표본 추출
17.2 가설검정의 기본 사항
17.3 추론을 위한 부트스트랩
17.4 신뢰 구간의 기본 사항
17.5 예측 구간의 기본 사항
17.6 추론 및 예측을 위한 확률
17.7 정리

18장 예제: 당나귀의 체중을 재는 법
18.1 당나귀 연구의 질문 및 범위
18.2 전처리 및 변환
18.3 탐색
18.4 당나귀의 체중 모델링
18.5 정리

6부 분류
19장 분류

19.1 예제: 바람에 피해를 입은 나무
19.2 모델링 및 분류
19.3 비율(및 확률) 모델링
19.4 로지스틱 모델의 손실 함수
19.5 확률에서 분류로
19.6 정리

20장 수치 최적화
20.1 경사 하강법의 기본 사항
20.2 후버 손실 최소화하기(Minimizing Huber Loss)
20.3 볼록하고 미분 가능한 손실 함수
20.4 경사 하강법의 변형
20.5 정리

21장 예제: 가짜 뉴스 탐지
21.1 질문과 범위
21.2 데이터 수집 및 전처리
21.3 데이터 탐색
21.4 모델링
21.5 정리

부록 1 추가 자료
부록 2 데이터 원본

저자소개

데보라 놀란 (지은이)    정보 더보기
캘리포니아 버클리 대학교의 컴퓨터, 데이터 과학 및 사회 대학 (College of Computing, Data Science, and Society)의 통계학 명예 교수이자 학부 부학장으로, 재임 중 학부 교육학 관련 자파로니 가문 석좌교수 (Zaffaroni Family Chair)를 역임했습니다. 연구 분야는 경험적 과정, 고차원 모델링, 그리고 최근에는 교육 및 재현 가능한 연구 기술입니다. 데보라의 교육학적 접근 방식은 연구, 실습, 교육을 아우릅니다.
펼치기
조셉 곤잘레스 (지은이)    정보 더보기
캘리포니아 버클리 대학교(University of California, Berkeley)의 전자컴퓨터공학과 부교수이며 UC 버클리 RISE 연구실의 창립 멤버입니다. 연구 관심 분야는 기계 학습과 데이터 시스템이 교차하는 지점으로, 세부적으로는 전이 학습을 위한 동적 심층 신경망, 고해상도 컴퓨터 비전을 위한 가속화된 딥 러닝, 자율 주행 차량용 소프트웨어 플랫폼 등이 있습니다.
펼치기
샘 라우 (지은이)    정보 더보기
캘리포니아 대학교 샌디에이고(University of California, San Diego)의 할리시올루 데이터 과학 연구소(Halicio?lu Data Science Institute) 조교수입니다. 10년간의 교육 경험을 바탕으로 UC 버클리와 UC 샌디에이고에서 대표적인 데이터 과학 과정을 설계하고 가르치는 데 기여해 왔습니다.
펼치기
권정민 (옮긴이)    정보 더보기
세상은 데이터로 이루어져 있다고 생각하며, 이를 잘 활용하고자 목표를 가지고 다양한 데이터 분석 및 활용 방안을 만들고 연구하고 있습니다. 카이스트 및 포항공과대학교에서 산업공학과 전산학을 전공했으며, 다양한 산업군에서 데이터 분석을 해오고 있으며, AI GDE로도 활동하고 있습니다. 저서로는 『데이터 분석가의 숫자유감』, 『데이터 과학자 원칙』 (골든래빗), 『데이터를 엮는 사람들, 데이터 과학자』 (비제이퍼블릭),이 있고, 역서로는 『파이썬을 활용한 베이지안 통계』 , 『딥러닝과 바둑』 (한빛미디어), 『빅데이터 분석 도구 R 프로그래밍』 (에이콘출판사) 등이 있으며 『실전 데이터 분석 35』 (책만), 『딥러닝 레볼루션』 (한국경제신문사) 등을 감수했습니다.
펼치기

책속에서



이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책