logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

파이썬으로 시작하는 캐글

파이썬으로 시작하는 캐글

(입문에서 컴피티션까지)

이시하라 쇼타로, 무라타 히데키 (지은이), 윤인성 (옮긴이)
  |  
제이펍
2021-04-19
  |  
18,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
알라딘 16,200원 -10% 0원 900원 15,300원 >
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

파이썬으로 시작하는 캐글

책 정보

· 제목 : 파이썬으로 시작하는 캐글 (입문에서 컴피티션까지)
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 파이썬
· ISBN : 9791190665841
· 쪽수 : 184쪽

책 소개

튜토리얼 형태의 캐글 & 머신러닝 입문서. 파이썬 언어를 사용해서 '캐글(Kaggle)'이라는 머신러닝 대회에 참여할 수 있도록 해준다. 'Titanic: Machine Learning from Disaster'라는 초보자 튜토리얼을 주제로 캐글의 기초를 다룬다.

목차

제1장 캐글 개요 1
1.1 캐글이란? 2
1.2 캐글에서 사용하는 머신러닝 5
1.3 캐글 계정 만들기 8
1.4 Competitions 페이지 개요 10
1.5 환경 구축을 따로 하지 않아도 되는 'Notebooks'의 사용 방법 14
1.6 1장 정리 19

제2장 Titanic 문제 23
2.1 일단 submit해 보기! 25
2.2 전체적인 흐름 파악하기: submit까지의 처리 흐름 살펴보기 33
2.3 탐색적 데이터 분석해 보기 40
2.4 가설을 기반으로 새로운 특징량 만들기 56
2.5 다양한 머신러닝 알고리즘 사용해 보기 61
2.6 하이퍼파라미터 조정하기 68
2.7 'Cross Validation'의 중요성 74
2.8 앙상블 학습해 보기 85
2.9 2장 정리 91

제3장 Titanic에서 더 나아가기 93
3.1 여러 테이블 다루기 94
3.2 이미지 데이터 다루기 99
3.3 텍스트 데이터 다루기 108
3.4 3장 정리 116

제4장 더 공부하려면 117
4.1 참가할 Competition을 선택하는 방법 118
4.2 초보자를 위한 도전 방법 121
4.3 분석 환경 선택 방법 127
4.4 4장 정리 130

부록 샘플 코드에 대한 자세한 설명 133
A.1 2장 Titanic 문제 134
A.2 3장 Titanic에서 더 나아가자 152
마지막으로 162

저자소개

이시하라 쇼타로 (지은이)    정보 더보기
- 동경대 공학부 시스템 창성학과 졸업 - 캐글 마스터(https://kaggle.com/sishihara) - 2019년 3월에 공개한 Qiita의 캐글 입문 글에 1,600개 이상의 '좋아요' 달성 - 2019년 4월에 'PetFinder.my Adoption Prediction' Competition에서 우승 - 2019년 12월에 'Kaggle Days Tokyo'에서 Competition 개최 - 현재 일본경제신문사에서 데이터 분석가로 근무 중
펼치기
무라타 히데키 (지은이)    정보 더보기
- 홋카이도대학 이학부 교학과 졸업 - 캐글 마스터(https://kaggle.com/currypurin) - 2019년 6월에 'LANL Earthquake Prediction' Competition에서 3위 수상 - 2018년 8월에 'Santander Value Prediction Challenge' Competition에서 솔로 금메달 획득(8위) - 캐글 입문자를 위한 동인지 《캐글 튜토리얼》이 2,500부 이상 판매됨 - 현재 전업 캐글러로 활약 중
펼치기
윤인성 (지은이)    정보 더보기
어쩌다가 책을 집필/번역하기 시작해서, 지금까지 계속해서 집필/번역하고 있다. 현재 직업 특성상 집에서 나갈 이유가 별로 없다는 것에 굉장히 만족하고 있다. 오전에는 커피, 오후에는 홍차를 마신다. 요리, 피아노, 기타, 작곡, 그림, 스컬핑 등의 취미를 갖고 있다. 《HTML5 웹 프로그래밍 입문》 《혼자 공부하는 파이썬》 《모던 웹을 위한 HTML5+CSS3 바이블》 등을 저술했으며 《나의 첫 블렌더》 《프로 일러스트레이터가 알려주는 캐릭터 채색 테크닉 [결정판]》 《러닝스쿨! 한 권으로 끝내는 HTML+CSS 웹 디자인 입문》 《최신 표준 HTML+CSS 디자인》 《파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문》 《파이썬을 이용한 웹 크롤링과 스크레이핑》 《문제 해결을 위한 알고리즘 with 수학》 등을 번역했다.
펼치기

책속에서

Competition 참가자는 데이터를 스스로 준비할 필요가 없으며, 상위권으로 입상하면 상금을 받을 수 있습니다(하위권이라고 손해를 보는 일은 따로 없습니다). submit을 했을 때 곧바로 채점되고, 순위를 확인할 수 있어서 컴퓨터 게임처럼 순위를 높이려는 동기 부여가 되므로 머신러닝을 재미있게 배울 수 있습니다.


그건 그런 것 같습니다. 캐글러들과 이야기할 때 '이것저것 다 해본다'라는 말을 많이 하는데요. 머신러닝 알고리즘이 효과가 있는지는 Dataset와 문제의 설정에 따라서 달라집니다. 그래서 머리로 '이것이 더 좋을 것이다'라고 생각하는 것보다는 일단 코드를 작성해서 실행해 보는 것이 중요한 것 같습니다. 만약 다른 사람의 해답을 보게 되더라도, 일단 손을 움직여서 한번 정도는 직접 submit해 보는 것이 좋다고 생각합니다. 이렇게 데이터의 사양, Competition의 특징을 파악하고 나서 해답을 보면 훨씬 잘 이해됩니다.


이번 절에서는 탐색적 데이터 분석으로 데이터의 개요를 확인해서, 특징량들과 목적 변수의 관계를 확인했습니다. 구체적인 예로 시각화를 통해 'Parch와 SibSp 모두를 더한 '가족 인원 수'라는 특징량을 새로 만들어서, 예측 성능을 높일 수도 있다'라는 가설을 만들었습니다.


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책