logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

Pandas Cookbook 2/e

Pandas Cookbook 2/e

(파이썬 데이터 과학 기초)

매트 해리슨, 시어도어 페트로우 (지은이), (주)크라스랩 (옮긴이)
  |  
에이콘출판
2020-12-29
  |  
45,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 40,500원 -10% 0원 2,250원 38,250원 >
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

Pandas Cookbook 2/e

책 정보

· 제목 : Pandas Cookbook 2/e (파이썬 데이터 과학 기초)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791161754840
· 쪽수 : 768쪽

책 소개

pandas의 모든 기능을 친절한 예제와 설명, 실제 파이썬 코드를 통한 실습과 함께 설명한다. pandas의 핵심 DataFrame과 Series를 주축으로 함수, 메서드, 속성을 설명하고 장단점은 물론 메모리 사용량과 처리 시간도 비교한다.

목차

1장. pandas 기초

__pandas 임포트
__소개
__pandas DataFrame
__DataFrame 속성
__데이터 형식 이해
__열 선택
__Series 메서드 호출
__Series 연산
__Series 메서드 체인
__열 이름 변경
__열의 생성과 삭제

2장. 기본 DataFrame 연산

__소개
__여러 DataFrame 열 선택
__메서드를 사용해 열 선택
__열 이름 정렬
__DataFrame 요약
__DataFrame 메서드 체인
__DataFrame 연산
__결측치 비교
__DataFrame 연산 방향 전환
__대학 인종 다양성 지수 결정

3장. DataFrame 생성과 유지

__소개
__스크래치에서 DataFrame 생성
__CSV 작성
__대형 CSV 파일 읽기
__엑셀 파일 사용
__ZIP 파일로 작업
__데이터베이스와 작업
__JSON 파일 읽기
__HTML 테이블 읽기

4장. 데이터 분석 시작

__소개
__데이터 분석 루틴 개발
__데이터 딕셔너리
__데이터 형식 변경으로 메모리 절약
__최대 중에 최소 선택
__정렬해 각 그룹에서 가장 큰 항목 선택
__sort_values를 사용해 nlargest 복제
__추적 지정가 주문 가격 계산

5장. 탐색적 데이터 분석

__소개
__요약 통계량
__열 형식
__예제 구현
__범주형 데이터
__연속 데이터
__범주 간의 연속 값 비교
__두 개의 연속 열 비교
__범주 값과 범주 값 비교
__pandas 프로파일링 라이브러리 사용

6장. 데이터의 부분집합 선택

__소개
__Series 데이터 선택
__DataFrame 행 선택
__DataFrame 행과 열을 동시에 선택
__정수와 레이블 모두로 데이터 선택
__사전식으로 슬라이싱

7장. 행 필터링

__소개
__불리언 통계량 계산
__다중 불리언 조건 구성
__불리언 배열을 사용한 필터링
__행 필터링과 인덱스 필터링 비교
__유일하고 정렬된 인덱스를 사용한 선택
__SQL WHERE 절 해석
__쿼리 메서드를 사용한 불리언 인덱싱의 가독성 향상
__.where 메서드를 사용해 Series 크기 유지
__DataFrame 행 마스킹
__불리언, 정수 위치, 레이블을 사용해 선택

8장. 인덱스 정렬

__소개
__인덱스 객체 검사
__데카르트 곱 생성
__인덱스 폭발
__동일하지 않은 인덱스로 값 채우기
__다른 DataFrame의 열 더하기
__각 열의 최댓값 강조
__메서드 체인으로 idxmax 복제
__열에서 최대 공통 최댓값 찾기

9장. 그룹화를 위한 집계, 여과, 변환

__소개
__집계 정의
__복수 열과 함수를 사용한 그룹화와 집계
__그룹화 후 다중 인덱스 제거
__사용자 정의 집계 함수를 사용한 그룹화
__*args와 **kwargs를 사용한 집계 함수 사용자 정의
__groupby 객체 검사
__소수 인종이 과반인 주를 필터링
__체중 감량 내기를 통한 변신
__apply를 사용해 주별 가중 평균 SAT 점수 계산
__연속 변수를 기준으로 그룹화
__도시 간 총 비행 횟수 계산
__가장 긴 연속 정시 비행 찾기

10장. 정돈된 형식으로 데이터 재구성

__소개
__스택을 사용해 변수 값을 열 이름으로 정돈
__melt를 사용해 변수 값을 열 이름으로 정돈
__여러 변수의 그룹을 동시에 스택
__스택된 데이터 되돌리기
__groupby 집계 후 언스택
__groupby 집계로 pivot_table 복제
__손쉬운 재구성을 위한 축 레벨 이름 변경
__여러 변수가 열 이름으로 저장될 때의 정돈
__여러 변수가 단일 열로 저장될 때 정돈
__둘 이상의 값이 동일 셀에 저장될 때의 정돈
__변수가 열 이름과 값으로 저장됐을 때의 데이터 정돈

11장. pandas 객체 병합

__소개
__DataFrame에 새 행 추가
__여러 DataFrame을 함께 연결
__concat, join, merge의 차이점 이해
__SQL 데이터베이스에 연결

12장. 시계열 분석

__소개
__파이썬과 pandas 날짜 도구의 차이점 이해
__시계열을 지능적으로 슬라이스
__시간 데이터로 열 필터링
__DatetimeIndex에서만 작동하는 메서드 사용
__주간 범죄 수 계산
__주간 범죄와 교통사고를 별도로 집계
__주별, 연도별 범죄 측정
__timeIndex를 사용해 익명 함수로 그룹화
__Timestamp와 다른 열을 기준으로 그룹화

13장. matplotlib, pandas, seaborn을 이용한 시각화

__소개
__matplotlib로 시작
__matplotlib에 대한 객체지향 가이드
__matplotlib로 데이터 시각화
__pandas를 사용한 기본 도식화
__flights 데이터셋 시각화
__새로운 경향을 발견하기 위한 누적 영역 차트
__seaborn과 pandas의 차이점
__seaborn 그리드를 사용한 다변량 분석
__seaborn으로 diamonds 데이터셋의 심슨 역설 발견

14장. pandas 디버깅과 테스트

__데이터를 변환하는 코드
__Apply 성능
__Dask, Pandarell, Swifter 등으로 apply 성능 향상
__코드 검사
__Jupyter에서의 디버깅
__Great Expectations를 이용한 데이터 무결성 관리
__pandas와 함께 pytest 사용
__Hypothesis를 사용해 테스트 생성

저자소개

시어도어 페트로우 (지은이)    정보 더보기
데이터 과학자이자 탐색적 데이터 분석에 중점을 두고 있는 교육 회사 던더 데이터(Dunder Data)의 설립자다. 밋업(meetup) 그룹인 휴스턴 데이터 과학(Houston Data Science)을 이끌고 있는데, 그룹에는 2,000여명의 멤버가 있고 같은 공간에서 데이터 과학을 학습하기 위한 공동체를 형성하는 것을 주목적으로 한다. 던더 데이터를 설립하기 전에는 대규모 정유회사인 슐룸베르거(Schlumberger)에서 데이터 과학자로 근무했는데, 데이터 분석 업무에 대부분의 시간을 보냈다. 수행한 프로젝트에는 엔지니어 텍스트에서 부품 고장의 근본 원인을 파악하는 타깃화된 감정 분석, 맞춤형 대시보드 응용, 판매 상품 가격 산정 에러를 막기 위한 실시간 웹 서비스 등이 있다. 라이스대학교(Rice University)에서 통계학으로 석사 학위를 받았고, 데이터 과학자가 되기 전에는 분석 기술을 이용해 직업 포커 게임을 하기도 했으며 수학을 가르치기도 했다. 실습을 통한 학습을 강조하며 스택 오버플로에서 pandas 관련해 자주 답변하곤 한다.
펼치기
(주)크라스랩 (옮긴이)    정보 더보기
(주)크라스랩은 머신러닝을 기반으로 다양한 연구를 수행하고 있으며, 특히 머신러닝 기반의 금융분석과 핀테크에 중점을 두고 있다. KAIST 전산학과 계산이론 연구실 출신의 이병욱 대표가 이끌고 있으며, 그의 저서 『블록체인 해설서』(에이콘, 2019)는 대한민국학술원에 의해 2019년도 교육부 우수학술도서로 선정됐다.
펼치기
이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책