책 이미지

책 정보
· 분류 : 국내도서 > 대학교재/전문서적 > 경상계열 > 통계
· ISBN : 9791198061928
· 쪽수 : 403쪽
· 출판일 : 2023-02-25
목차
제1장 다변량 데이터와 빅데이터
제2장 다변량 데이터에 대한 기초 통계량
제3장 주성분 분석
제4장 판별분석
제5장 서포트벡터 머신
제6장 K-최근접 이웃 분류 방법
제7장 군집분석
제8장 연관성분석
제9장 의사결정나무
제10장 신경망을 이용한 머신러닝
제11장 텍스트 마이닝
제12장 앙상블
제13장 데이터 분석 보고서 작성
저자소개
책속에서
머리말
21세기 현대는 여러 분야에서 다변량 데이터 빅데이터가 넘쳐나는 시대입니다. 이들 데이터
의 추출 변환, 그리고 통계적 분석을 통하여 필요한 정보를 얻어내는 데이터 사이언스 과정과 컴퓨터가 이들 데이터로부터 패턴과 상관관계를 찾아 의사결정과 미래를 예측하게 하는 기계
학습은 이 시대 기술의 중요한 키워드입니다. 여러 종류 및 여러 개 변수를 가지는 다변량데이터 분석은 데이터 사이언스와 기계학습에서 활용도가 매우 높습니다.
이 책은 덕성여대 정보통계학과에서 캡스톤디자인 과목을 진행하면서 쓰였던 내용을 정리한 것으로 통계학 전공자 데이터 분석자 통계 비전공자나 사회의 실무자들도 다변량과 빅데이터 분석에 쉽게 접근할 수 있도록 구성하였습니다. 2장에서의 다변량 기초 수학과 데이터 탐색에 관한 기본과 함께 주성분분석, 판별분석과 군집분석을 포함한 고전적 다변량 기법, K 근접 이 웃 분류, 연관성 분석 등을 포함한 데이터 마이닝에서 많이 활용되는 기법, 서포트 벡터 머신 기법, 의사결정나무, 신경망 앙상블 등의 머신러닝 기법 텍스트 분석을 위한 텍스트 마이닝 등을 모두 함께 다루어 관심 있는 기법을 선택하여 공부할 수 있도록 하였습니다.
각 장마다 간단한 이론과 예제를 통해 R을 이용한 통계 프로그램을 보여주어 분석 방법을 체계적으로 공부하고 사례를 참고할 수 있도록 하였습니다. 다양한 방법을 익히고 분석 사례를 통해 응용력을 키워 기본 데이터마이닝부터 다양한 통계분석까지 활용할 수 있도록 구성하였습니다.