책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9788989383086
· 쪽수 : 512쪽
· 출판일 : 2023-02-15
책 소개
목차
Part 1 Why - 빅데이터 분석과 머신러닝
CHAPTER 1 빅데이터 분석과 머신러닝
1.1 빅데이터 분석의 이해
(1) 빅데이터 분석의 정의
(2) 빅데이터 분석의 필요성
1.2 빅데이터 분석 처리 과정
(1) 문제 해결의 목적 정의
(2) 데이터 수집
(3) 데이터 전처리와 정형화(탐색적 분석)
(4) 머신러닝 모델 적용
(5) 학습 모델 평가
1.3 빅데이터 분석과 머신러닝과의 관계
(1) 지도학습
(2) 비지도학습
(3) 강화 학습
(4) 기타
연습 문제
Part 2 What - 빅데이터 분석에 필요한 파이썬 문법과 라이브러리
CHAPTER 2 파이썬 핵심 문법
2.1 코랩 환경
(1) 코랩 기본 사용법
2.2 변수
(1) 변수의 개념
(2) 변수의 특징
(3) 변수 생성 및 규칙
2.3 연산자
(1) 산술 연산자
(2) 대입 연산자
(3) 비교 연산자
(4) 논리 연산자
(5) 문자열 연산자
2.4 표준 입·출력
(1) 표준 입력
(2) 표준 출력
2.5 컬렉션 자료형
(1) 컬렉션 자료형 개념과 필요성
(2) 리스트(list)
(3) 튜플(tuple)
(4) 딕셔너리(dictionary)
(5) 세트(set)
2.6 리스트 내포
(1) 리스트 내포 처리 과정
2.7 선택문
(1) 파이썬 선택문의 개요
(2) 조건식
(3) if / if~else
(4) if~elif / if~elif~else
2.8 반복문과 기타 제어문
(1) 파이썬 반복문 개요
(2) for 문
(3) while 문
(4) 기타 제어문
2.9 함수
(1) 함수란?
(2) 내장 함수
(3) 사용자 정의 함수
(4) 람다(lambda) 함수
연습 문제
CHAPTER 3 판다스 라이브러리의 개요
3.1 판다스 데이터의 구조 이해
(1) 시리즈
(2) 데이터프레임
3.2 데이터프레임 객체 생성하기
(1) 데이터프레임 직접 생성하기
(2) 외부 데이터 이용하기
3.3 데이터 확인하기
(1) 데이터프레임 만들기
(2) 변수 속성 파악하기
(3) 데이터 앞부분/뒷부분 확인하기
(4) 데이터 요약 통계량 출력하기
(5) 데이터 행/열 크기 확인하기
(6) 데이터 인덱스/칼럼 명 확인하기
(7) 데이터 타입 확인하기
(8) 데이터 정렬하기
(9) 데이터 빈도수 구하기
(10) 데이터 고윳값 구하기
3.4 데이터 선택하기
(1) 칼럼(열) 선택하기
(2) 레이블이나 조건 표현으로 선택하는 방법: loc[]
(3) 불 인덱싱
3.5 데이터 가공 및 그룹핑
(1) 칼럼 삭제
(2) 칼럼 이름 변경
(3) 칼럼 생성
(4) 데이터 그룹핑
3.6 결측 데이터 처리하기
(1) 결측 데이터 확인
(2) 결측 데이터 삭제하기
(3) 결측 데이터 최빈값으로 대체하기
(4) 결측 데이터 평균값으로 대체하기
연습 문제
CHAPTER 4 시각화 라이브러리 Ⅰ
4.1 데이터 시각화의 이해
(1) 데이터 시각화의 장점
(2) 데이터 시각화의 활용 사례
(3) 파이썬으로 하는 데이터 시각화
4.2 맷플롯립 라이브러리
(1) 시각화 옵션
(2) 선 그래프
(3) 막대 그래프
(4) 산점도 그래프
(5) 히스토그램
(6) 상자수염(Box Plot) 그래프
연습 문제
CHAPTER 5 시각화 라이브러리 Ⅱ
5.1 시본 라이브러리의 개요
5.2 시본 라이브러리
(1) 데이터 시각화 준비하기
(2) 시본 막대 그래프
(3) 시본 산점도 그래프
(4) 시본 히스토그램
(5) 시본 상자수염(Box Plot) 그래프
(6) 카운트 플롯(Count Plot) 그래프
(7) 바이올린 플롯(Violin Plot) 그래프
(8) 시본 히트맵(Heat Map) 그래프
(9) 다중 플롯 그리드 그래프
연습 문제
CHAPTER 6 빅데이터 분석 관련 라이브러리 종합 실습
6.1 한국 드라마 TOP 100 데이터 분석하기
(1) 데이터 확인하기
(2) 데이터 선택하기
(3) 데이터 가공 및 그룹핑
(4) 데이터 시각화
연습 문제
Part 3 how - 머신러닝을 이용한 빅데이터 분석 실습
CHAPTER 7 데이터 다듬기
7.1 머신러닝 단계
7.2 탐색적 데이터 분석
(1) 원본 데이터 관찰
(2) 요약통계값 확인
(3) 시각화
7.3 전처리 방법
(1) 데이터 타입의 변환
(2) 결측치 처리
(3) 이상치 처리
7.4 제로콜라와 기온 속성 간에는 관련이 있을까?
(1) 문제 정의
(2) 데이터 속성 설명
(3) 원본 데이터 관찰하기
(4) 요약 통계값 확인하기
(5) 전처리하기
(6) 시각화로 표현
(7) 상관관계 확인하기
7.5 데이터 탐색과 전처리 실습
(1) 문제 정의
(2) 데이터 속성 설명
(3) 원본 데이터 관찰하기
(4) 요약 통계값 확인
(5) 시각화로 표현
연습 문제
CHAPTER 8 행복지수 데이터 관계성 찾기
8.1 [상관분석] 행복지수 데이터 분석하기
(1) 데이터 확인과 가공하기
(2) 데이터 분석과 시각화
8.2 [연관분석] 장바구니 분석하기
(1) 연관분석의 개념 이해
(2) 연관분석의 필요성
(3) 연관분석의 예제
연습 문제
CHAPTER 9 날씨 데이터 예측하기
9.1 회귀분석의 개념
(1) 회귀분석의 개념 이해
(2) 기업의 회귀분석 활용 사례
(3) 단순선형회귀와 다중선형회귀
9.2 [회귀분석] 날씨 데이터 분석하기
(1) 데이터셋 정보
(2) 데이터필드의 이해
(3) 데이터 확인과 가공하기
(4) 회귀분석 예제
연습 문제
CHAPTER 10 클러스터링을 활용한 쇼핑몰 회원 관리
10.1 클러스터링
(1) K-Means
(2) Hierarchical clustering
10.2 클러스터링을 활용한 쇼핑몰 회원 세분화
(1) 데이터 읽기
(2) 데이터 탐색
(3) K-means를 이용한 군집화
(4) Hierarchical clustering을 이용한 군집화
연습 문제
CHAPTER 11 드라마 분류하기
11.1 K-최근접 이웃
(1) K-최근접 이웃의 원리
(2) class sklearn.cluster.KNeighborsClassifier 모델 사용 방법
(3) k의 수
(4) 표준화 작업
11.2 K-NN을 이용한 인기 영화 분류하기
(1) 데이터 읽기
(2) 데이터 탐색
(3) 훈련 데이터와 테스트 데이터 나누기
(4) K-NN을 이용한 분류
11.3 K-NN을 이용한 농구 선수 분류하기
(1) 데이터 읽기
(2) 데이터 탐색
(3) 경력별 선수의 특징
(4) 훈련 데이터와 테스트 데이터 나누기
(5) K-NN을 이용한 분류
연습 문제
CHAPTER 12 텍스트로 읽는 세상
12.1 자연어 처리
(1) 토큰화
(2) 토큰화 실습
12.2 워드클라우드
(1) 라이브러리 설치하기
(2) 한글 글꼴 설치
(3) 텍스트 가져오기
(4) 품사 태깅하기
(5) 동일한 단어의 빈도수 구하기
(6) wordcloud 생성
(7) matplotlib으로 시각화하기
12.3 자연어 처리 실습
(1) 뉴스기사로 워드클라우드 만들기
연습 문제