logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

으뜸 데이터 분석과 머신러닝

으뜸 데이터 분석과 머신러닝

(개정판)

박동규, 강영민, 김병욱 (지은이)
생능
32,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
32,000원 -0% 0원
0원
32,000원 >
32,000원 -0% 0원
카드할인 10%
3,200원
28,800원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

으뜸 데이터 분석과 머신러닝
eBook 미리보기

책 정보

· 제목 : 으뜸 데이터 분석과 머신러닝 (개정판)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 자료구조/알고리즘
· ISBN : 9791192932934
· 쪽수 : 508쪽
· 출판일 : 2024-12-16

책 소개

아나콘다라는 주요 개발 도구의 설치와 주피터 노트북의 세부 메뉴를 하나하나 소개하며 시작한다. 또한 데이터 분석을 위하여 널리 사용되는 넘파이와 판다스, 맷플롯립 등의 인기 있는 도구를 쉽게 이해할 수 있도록 간결한 예제 코드와 그 결과를 보여주고 있다.

목차

Chapter 01 빅데이터와 데이터 분석의 중요성
1.1 빅데이터와 데이터 분석
1.2 점점 더 중요해지고 있는 데이터의 가치
1.3 데이터에서 콜레라 퇴치의 길을 찾다
1.4 디지털 데이터를 알아보자
1.5 디지털 데이터와 디지털 전환
1.6 디지털 데이터의 표현 방법
1.7 인류 최대의 도전 - 블랙홀 관측과 데이터 분석
1.8 새로운 과학의 패러다임을 알아보자
1.9 이 책에서 배울 데이터 분석을 위한 도구
연습문제

Chapter 02 데이터 분석을 위한 개발도구
2.1 데이터 분석과 머신러닝을 위한 강력한 프로그래밍 언어: 파이썬
2.2 모듈의 개념과 활용
2.3 모듈의 활용과 패키지 설치하기
2.4 파이썬의 강력한 패키지들
2.5 아나콘다 개발도구를 설치하고 사용해 보자
2.6 주피터 노트북의 여러 가지 기능들
2.7 주피터 노트북의 셀과 코드 입력
2.8 주피터 노트북의 작동 방식
2.9 IPython을 사용해보자
2.10 IPython에서 제공하는 매직 명령어
2.11 데이터 과학자들의 의사소통을 도와주는 마크다운
2.12 알아두면 편리한 고급 마크다운 기능과 명령 모드
2.13 클라우드 환경의 개발은 코랩으로 편리하게
2.14 코랩은 구글 리눅스 가상머신에서 동작한다
2.15 코랩 디스크 마운트하고 파일 올리기
2.16 코랩 디스크의 내용 확인하기
연습문제
심화문제

Chapter 03 파이썬 최고의 라이브러리: 넘파이
3.1 파이썬 리스트와 넘파이
3.2 파이썬 리스트 vs 넘파이 다차원 배열
3.3 다차원 배열의 속성들
3.4 다차원 배열과 브로드캐스팅
3.5 연속적인 값을 가지는 다차원 배열의 생성
3.6 다차원 배열의 축과 삽입
3.7 넘파이 배열의 인덱싱과 슬라이싱
3.8 넘파이 스타일의 슬라이싱과 논리 인덱싱
3.9 다차원 배열의 최대값, 최소값, 평균값 구하기와 정렬
3.10 다차원 배열을 위한 append() 함수와 행렬 곱셈
3.11 과학자들이 사랑하는 수: 난수
3.12 다양한 난수 만들기 함수를 살펴보자
3.13 평균, 분산, 표준 편차를 알아보자
심화: 넘파이는 왜 성공했나
3.14 벡터화 연산의 성능을 측정해 보자
3.15 리덕션: 배열을 더 강력하게 만드는 기능
3.16 배열의 결합 concatenate, vstack, hstack
3.17 배열을 결합하는 r_, c_ 클래스와 column_stack() 함수
연습문제
심화문제

Chapter 04 데이터 시각화 도구 맷플롯립
4.1 데이터 과학과 효과적인 시각화의 필요성
4.2 데이터 과학을 위한 시각화 도구 matplotlib
4.3 plot() 함수의 선 그리기 기능들을 알아보자
4.4 복잡한 선을 그리고 이미지로 저장하자
4.5 제목과 레이블, 스타일에 대해 알아보자
4.6 Figure, axes에 대하여 살펴보자
4.7 subplot()의 고급 기능
4.8 자료값의 분포를 나타내는 산점도와 막대 그래프
4.9 파이 차트와 히트맵 표현
4.10 히스토그램 그리기
4.11 히스토그램을 이용한 정규 분포 함수와 확률 밀도 함수 그리기
4.12 정규 분포 함수와 확률 밀도 함수
4.13 상자 수염 그리기
4.14 그래프의 크기와 그리드 그리기
연습문제
심화문제

Chapter 05 통계 데이터와 시본 라이브러리
5.1 데이터 사이의 관련성을 알아보자
5.2 데이터 사이의 상관관계와 인과관계
5.3 상관계수를 구하고 시각화를 하도록 하자
5.4 특성 간의 관련성을 알려주는 상관계수와 쌍 그래프
5.5 시본 라이브러리 시작하기
5.6 tips 데이터와 여러 가지 시각화 방법
5.7 산점도 그래프로 관계를 상세하게 나타내보자
5.8 변수 사이의 관계를 알아보기에 편리한 쌍 그래프
5.9 Anscombe’s quartet 데이터 셋을 알아보자
5.10 비선형 함수를 사용하여 데이터를 설명하자
5.11 시본의 또 다른 데이터 셋: flights 데이터 셋
연습문제
심화문제

Chapter 06 엑셀보다 판다스
6.1 엑셀보다 빠르고 강력한 판다스
6.2 시리즈와 자료형과 결손값
6.3 판다스의 기본 구조인 시리즈와 데이터프레임
6.4 csv 데이터를 읽고 확인하기
6.5 데이터프레임의 구조
6.6 새로운 열을 생성하자
6.7 inplace로 데이터프레임 갱신하기
6.8 데이터프레임 시각화
6.9 편리하고 강력한 시각화
6.10 편리한 데이터 다루기 - 슬라이싱과 인덱싱
6.11 loc, iloc 인덱서
6.12 판다스를 이용한 기상 데이터 분석
6.13 데이터 정제와 결손값의 처리
6.14 시계열 자료 분석을 위한 DatetimeIndex
6.15 특정한 값에 기반하여 데이터를 묶어보자: 그룹핑
6.16 그룹핑과 필터링
6.17 데이터 구조를 변경하는 pivot()
6.18 두 개의 데이터프레임을 하나로 합치는 concat()
6.19 테이블 데이터의 결합: concat()과 merge()
연습문제
심화문제

Chapter 07 머신러닝 기초: 사이킷런과 선형 회귀
7.1 경험을 통해서 학습하는 인간을 통해 지능을 정의해 보자
7.2 머신러닝의 정의와 종류를 알아보자
7.3 회귀 분석과 독립변수, 종속변수
7.4 사이킷런을 이용한 선형 회귀
7.5 선형 회귀 모델의 계수와 절편
7.6 간단한 선형 회귀를 수행해 보자
7.7 데이터를 시각화하고 차원을 증가시키자
7.8 회귀 모델의 오차 함수와 결정계수
7.9 오차 함수의 구현과 파라미터 공간의 최적값
7.10 미분과 경사 하강법
7.11 경사 하강법과 학습의 원리
7.12 경사 하강법과 학습률
LAB 7-1 머신러닝 최적화에 숨어있는 수학적 원리를 알아보자
연습문제
심화문제

Chapter 08 다중 회귀와 규제
8.1 변수가 여러 개인 공간에서의 회귀 분석
8.2 캐글 데이터를 이용해서 분석해 보자
8.3 기대수명 데이터 둘러보기
8.4 기대수명과 상관관계가 높은 데이터는 무엇인가
8.5 쌍 그래프로 특성 분석하기
8.6 훈련 데이터, 테스트 데이터 그리고 특성
LAB 8-1 상관도를 시각화하여 중요 특성을 분석하자
8.7 데이터의 분포가 직선이 아니라면? 다항 회귀 모델을 사용하자
8.8 다항 회귀 모델을 사용하자
LAB 8-2 3차 방정식을 만들고 다항 회귀 모델을 이용하여 예측하기
8.9 과대 적합에 주의하자
8.10 과소 적합, 과대 적합, 그리고 규제
8.11 최적화와 규제항을 적용한 릿지 회귀
8.12 릿지 회귀와 alpha 값
연습문제
심화문제

Chapter 09 분류와 군집 나누기
9.1 분류와 군집화를 알아보자
9.2 로지스틱 회귀 모델과 시그모이드 함수
9.3 시그모이드 함수와 지수의 관계
9.4 결정 경계와 교차 엔트로피
9.5 로지스틱 회귀 모델을 위한 데이터 만들기
9.6 로지스틱 회귀 모델 구현하기
9.7 가까운 이웃으로 분류하는 k-NN 분류기
9.8 k-NN 활용 예제 - 붓꽃 데이터 준비하기
9.9 k-NN 활용 예제 - 붓꽃 데이터로 학습하기
9.10 새로운 꽃에 대해서 모델을 적용하고 분류해 보자
9.11 게임을 하는 고객의 군집을 만들어보자
9.12 데이터 전처리의 필요성
9.13 데이터 정규화 방법을 이용하자
9.14 다양한 스케일러 살펴보기
9.15 스케일러 사용시의 주의 사항
9.16 스케일러 사용 실전 사례: 유방암 데이터 셋
9.17 붓꽃 데이터 집합을 k-평균 군집화 기법으로 분류하자
9.18 붓꽃 데이터 집합의 군집 중심을 알아보자
심화: Logit의 개념과 선형 로지스틱 회귀
연습문제
심화문제

Chapter 10 다양한 머신러닝 기법 - SVM, 결정 트리, 차원 축소
10.1 서포트 벡터 머신의 소개
10.2 서포트 벡터 머신의 구현 방법
10.3 분류 오류와 마진 오류 최소화 사이의 트레이드오프
10.4 서포트 벡터 머신을 파이프라인을 사용하여 구현해 보기
10.5 많은 데이터에 대하여 서포트 벡터 머신으로 분류하기
10.6 커널 함수를 이용한 서포트 벡터 머신
10.7 여러 서포트 벡터 머신 분류 결과를 시각화하자
10.8 결정 트리와 분류
10.9 엔트로피를 계산해보자
10.10 엔트로피 곡면과 정보 이득
10.11 불순도를 이용한 의사결정 트리 - CART 알고리즘
10.12 결정 트리 구현해 보기
10.13 앙상블 기법
10.14 앙상블 모델의 성능 비교
10.15 차원의 저주
10.16 차원 축소
10.17 3차원 공간의 데이터에서 주성분 찾기
10.18 4차원 공간에 존재하는 붓꽃 데이터를 2차원에서 분류해 보자
연습문제
심화문제

Chapter 11 하이퍼파라미터 튜닝과 성능평가 - 교차검증, 성능평가, 가상 데이터
11.1 좋은 모델 선택을 위한 노력: K-겹 교차검증
11.2 교차검증의 구현
11.3 교차검증의 결과를 살펴보자
11.4 모델의 성능평가 방법과 데이터 편향의 문제
11.5 데이터 편향 문제를 극복하자: 데이터 증강
11.6 분류 모델의 성능평가 지표들
11.7 모델의 성능평가 방법에 대한 직관적 이해
11.8 모델의 성능평가 방법들
11.9 합성 데이터 셋을 만들자: make_blob() 함수
11.10 군집 데이터 셋 시각화
11.11 고급 군집화 기능
11.12 가장 좋은 군집의 수는 어떻게 찾을 수 있을까
연습문제
심화문제

Chapter 12 신경망과 퍼셉트론
12.1 인간 뇌의 비밀
12.2 단순한 퍼셉트론의 구조를 살펴보자
12.3 신경망을 만들기 위한 간단한 행렬 표현법
12.4 AND와 OR 회로를 퍼셉트론으로 만들자
12.5 퍼셉트론을 학습시키자
12.6 퍼셉트론을 학습시키는 알고리즘을 구현하자
12.7 인공지능의 겨울: 퍼셉트론의 한계와 XOR 문제
12.8 다층 퍼셉트론으로 XOR 연산을 하자
12.9 오차 역전파를 개략적으로 살펴보자
12.10 왜 여러 가지 활성화 함수가 필요할까
12.11 다층 퍼셉트론의 학습 원리
연습문제
심화문제

Chapter 13 텐서플로로 따라하는 딥러닝
13.1 가장 인기 있는 머신러닝, 딥러닝 플랫폼: 텐서플로
13.2 텐서플로 알아보기
13.3 MNIST 데이터 가져오기
13.4 MNIST 데이터 그리기
13.5 심층 신경망 모델을 만들고 하이퍼파라미터를 튜닝하자
13.6 인공 신경망을 학습시켜 보자
13.7 인공 신경망의 성능을 개선해 보자
13.8 새 이미지를 잘 학습하는가 알아보자
13.9 부드러운 최대값을 출력하는 소프트맥스 함수
13.10 직접 만든 이미지를 업로드하고 테스트하자
13.11 이미지 데이터의 전처리 기법
13.12 붓꽃 데이터의 분류에 도전하자
13.13 분류 정확도를 높이기 위한 층을 추가하자
13.14 학습한 모델을 저장하고 불러오자
13.15 수치값을 예측하는 딥러닝 모델
연습문제
심화문제

저자소개

박동규 (지은이)    정보 더보기
「널널한 교수의 코딩 클래스」 유튜브 채널을 운영 중이며 파이썬, C, 자바, Swift 등의 프로그래밍 언어와 자료구조, 알고리즘, 머신러닝, 딥러닝 관련 강좌를 400개 이상 업로드하였다. 저서로는 『으뜸 파이썬』, 『따라하며 배우는 파이썬과 데이터 과학』, 『으뜸 머신러닝』, 『으뜸 데이터 분석과 머신러닝』, 『자바 3D 프로그래밍』, 『누구나 쉽게 배우는 인공지능 스타트』, 『누구나 쉽게 배우는 딥러닝 스타트』 등이 있다. 『으뜸 파이썬』(2020), 『누구나 쉽게 배우는 인공지능 스타트』(2023), 『누구나 쉽게 배우는 딥러닝 스타트』(2024)는 한국출판문화산업진흥원의 세종도서 학술부문도서로 선정되었다. • 1993年 부산대학교 전자계산학과 이학사 • 1996年 부산대학교 전자계산학과 이학석사 • 1999年 부산대학교 전자계산학과 이학박사 • 2002年~현재 창원대학교 정보통신공학과 교수 • 2021年 부산대학교 컴퓨터 및 정보통신연구소 객원교수 • 2007年 미국 카네기멜론대학교 방문교수 • 2012年 미국 텍사스A&M대학교 방문교수 • 창원대학교 정보전산원장, 창원시 스마트모바일 앱센터장 역임
펼치기
강영민 (지은이)    정보 더보기
1996年 부산대학교 전자계산학과 이학사 1999年 부산대학교 전자계산학과 이학석사 2002年 스위스 제네바대학 미라랩 Virtual Clothing 프로젝트 참여 2003年 부산대학교 전자계산학과 이학박사 2003年~2005年 한국전자통신연구원 디지털콘텐츠연구단 2005年~현재 동명대학교 게임학부 교수 / 게임그래픽학과장 동명대학교 산학협력단장, 정보전산센터장, ACE 사업 단장, 기획처장 등 역임 2020年 한국전자통신연구원 인공지능연구소 스마트데이터연구실 파견연구원
펼치기
김병욱 (지은이)    정보 더보기
2005年 부산대학교 전자전기정보컴퓨터공학부 공학사 2007年 한국과학기술원 전기및전자공학과 공학석사 2012年 한국과학기술원 전기및전자공학과 공학박사 2012年~2013年 한국전기연구원 선임기술원 2013年~2016年 경일대학교 전기철도공학부 조교수 2016年~2019年 호서대학교 자동차ICT공학과 조교수 2019年~현재 국립창원대학교 정보통신공학과 부교수 2024年 미국 센트럴플로리다대학교(UCF) 방문교수
펼치기

추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책