logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

엑셀로 통계 따라잡기

엑셀로 통계 따라잡기

나명환, 서성채 (지은이)
  |  
전남대학교출판부
2016-02-25
  |  
18,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

엑셀로 통계 따라잡기

책 정보

· 제목 : 엑셀로 통계 따라잡기 
· 분류 : 국내도서 > 대학교재/전문서적 > 경상계열 > 통계
· ISBN : 9788968492891
· 쪽수 : 294쪽

책 소개

통계학은 사회과학, 인문학, 자연과학, 공학뿐만 아니라 모든 학문에서 공통적으로 사용되는 데이터 처리 및 분석에 사용된다. 이 책에서는 여러 종류의 독자를 위하여 다양한 형태의 내용을 수록하였다.

목차

머리말 / 3
제1장 통계학이란? / 7
제2장 데이터 입력과 관리 / 16
제3장 데이터 계산과 함수 / 56
제4장 범주형 자료 시각화 / 105
제5장 연속형 데이터 시각화 / 144
제6장 연속형 데이터 요약 / 157
제7장 확률변수 / 180
제8장 여러 가지 확률 분포 / 189
제9장 통계적 추론 / 209
제10장 두 모형균의 차에 대한 검정 / 236
제11장 분산분석 / 251
제12장 상관분석과 회귀분석 / 270

저자소개

나명환 (지은이)    정보 더보기
서울대학교 통계학과 이학박사 / 품질관리기술사 ㈜빅데이터인사이트 대표이사 / 농업빅데이터연구회 회장 광주전남과총 기초과학분과 위원장 한국품질경영학회 부회장/한국신뢰성학회 운영이사/한국통계학회 평의원 (현) 전남대학교 통계학과 교수
펼치기
서성채 (지은이)    정보 더보기
소프트웨어 공학(Software Engineering)으로 박사학위를 받았으며, 전남대학교, 목포대학교 등에서 소프트웨어 공학, 프로그래밍 언어(Python, C, Java, Web, 등), 등을 강의하고 있다. 관심 있는 연구 분야는 소프트웨어 개발 관점에서 프로그래밍 언어, 소프트웨어 분석, 소프트웨어 공학, 인공지능 소프트웨어 개발 등이다. ‘실무 중심 소프트웨어 공학(전남대, 2009)’ 등의 책을 집필하였다.
펼치기
서성채의 다른 책 >

책속에서

[머리말]

통계는 엑셀을 다루는 것과 같다.
통계학은 사회과학, 인문학, 자연과학, 공학뿐만 아니라 모든 학문에서 공통적으로 사용되는 데이터 처리 및 분석에 사용된다. 그러나 통계학에 관심이 있으신 많은 학생들, 통계 관련 교육을 받으시는 분들이 일률적으로 하시는 말씀이 “통계학은 어렵다”는 것이다. 오랜 기간 동안 통계학을 가르치는 사람으로서 이러한 문제를 어떻게 해결해야 하나 많은 고심을 하면서 통계를 배울 때 수식적인 부담이 없이 학습할 수 있고 쉽게 접할 수 있는 통계학 교재를 만들어 많은 사람들이 통계를 엑셀에서 데이터 다루듯이 다루면 좋겠다고 생각을 해 왔다. 그러다 많은 사람들이 엑셀을 활용하여 데이터 분석과 계산을 수행하고 있어, 엑셀의 함수, 차트, 피벗 테이블을 이용하여 기초 통계학을 습득하면 보다 쉽게 통계학을 접할 수 있음을 인식하고 이를 기초 통계학 교재로 결실을 맺은 것 같다.
이 책에서는 여러 종류의 독자를 위하여 다양한 형태의 내용을 수록하였다. 먼저 1장에서 5장까지는 일반적인 엑셀교재에서 다루는 내용을 통계적 관점에서 집필하였으며, 6장부터는 기초통계학을 수식, 함수, 피벗테이블을 이용하여 다루었다. 통계를 처음 접하는 독자들은 처음에 통계 수식을 습득하기가 부담스러우니 가급적 수식을 무리하게 익히려구 너무 노력하지 말고 ‘아 이런 게 있는 거구나! 그러나, 지금은 모르더라도 엑셀의 통계 관련 함수를 통하여 계산할 수 있으니 일단은 엑셀에서 제공하는 분석결과를 해석하는 관점에서 먼저 익혀두자’라고 생각을 하면 될 것이다. 통계 수식은 점차 통계적 내공이 쌓인 후에 익혀도 충분하다. 하지만 주어진 데이터에 맞는 분석법은 무엇인지는 꼭 익혀 두어야 한다. 거기에다 분석결과를 해석하는 법도 같이 익히 두는 게 이 책의 기본 목표라고 생각을 하면 된다.
이 조그마한 결실이 이루어지도록 많은 도움을 주신 분들에게 감사를 드린다. 특히, 전남대학교출판부 직원분들께 감사의 마음을 전한다.

2016년 1월 저자 일동


제1장 통계학이란?

1.1. 통계학 개요
여러분은 최근 각종 Mass Media에서 여러 가지 정보나 분석 결과를 제공하면서 듣는 말 중의 하나로 빅데이터(big data)를 이용한 분석이라는 말일 것이다. 여기서 빅데이터는 데이터 양이 많으면서 정형과 비정형 데이터로 구성되어 있으며 실시간으로 분석을 필요로 하며 처리한 데이터가 가치가 있어야하는 데이터를 의미한다. 빅 데이터를 다루기 위해서는 대량의 데이터를 효율적으로 처리·분석 할 수 있는 기술이 필요하다. 데이터 분석의 기초가 되는 것이 바로 통계(statistic)이다.
우리는 ICT시대에 정보의 중요성을 느끼면서 이러한 정보를 창출하는 통계의 중요성을 과거 어느 때보다 중요하게 여기기 시작했다. 사회과학에서는 대통령 선거나 국회의원 선거전에 여론조사를 이용하여 선거 결과의 당선자를 미리 알아보기도 한다. 또한 의사는 여러 가지 검사 데이터를 이용하여 질병에 대한 진단, 처방과 예후를 판단한다. 국가와 기업에서는 여러 가지 정책을 입안하는 데 의사결정자의 경험이나 직감보다는 데이터 근거 중심의 기반을 둔 정책을 수립한다. 국가와 기업에 대한 각종 진단 및 정책수립은 바로 통계가 기본 역할을 담당한다. 올바른 정책의 수립과 미래에 대한 제대로 된 준비를 하기 위해서는 정확한 통계가 매우 필수적이다.
통계는 사회 현상 또는 자연 현상과 같은 여러 가지 현상을 파악하고 규명하기 위하여 필요한 데이터를 어떻게 수집할 것인지의 방법과 그렇게 수집된 여러 형태의 데이터를 시각화하는 방법인 그래프나 도표를 이용하고 또한 요약된 숫자 등으로 표현하고 적절한 수리산술적 방법을 이용하여 정보로 가공한다. 통계를 이용하여 생성된 정보를 이용하여 여러 가지 분야(공학, 사회학, 심리학, 의학, 영문학 등)에서 그 분야에서 요구하는 여러 가지 의사결정과 정책을 수립하게 하는 방법을 제공한다.
요약을 하면 통계는 적절한 데이터를 수집하고 수집된 데이터를 효과적으로 시각화하고 또 요약하여 해석하여 합리적인 의사결정을 도출하는 총체적인 과정에 대한 학문이라고 할 수 있다. 먼저 적절한 데이터를 수집하는 과정은 통계의 근간이 되는 매우 중요한 과정으로서 샘플링(표본추출, Sampling)이라고 부르며, 표본추출법은 본 교재에서는 다루고 있지는 않지만 그 중요성은 아무리 강조해도 지나치지 않을 것이다.
통계학(statistics)은 국가에 관한 학문이란 의미로 국가 산술학(state arithmetics)이란 뜻에서 유래하였다. 통계는 국가에서 세금을 거둘 목적으로 인구수를 조사하거나 영토의 크기를 산출하는 것으로부터 시작되었다. 17세기와 18세기의 물리학이나 천문학 등의 학문적 이론의 발전과 함께 여러 가지 물리적 양 예로, 무게나 거리 등 대한 측정의 정확성이 중요하게 되면서 여러 가지 통계적 방법론을 연구하는 학문적 체계로 발전하기 시작하였다. 이 당시에 천문학자와 측량기술자들은 동일한 대상을 여러 번 측정할 때 측정값이 일정하지 않는다는 사실 즉, 측정값의 변동성을 인식하게 되었고 이를 해결하기 위해 여러 가지 통계적인 방법들이 개발되었다.
통계학은 시대와 사용분야에 따라 그 정의가 다양하겠지만 현재의 지식정보화시대에 적절한 정의는 다음과 같다. 통계학은 자연과학이나 사회과학 등에서 일어나는 현상의 불확실성을 규명하기 위해 다양한 데이터를 수집하고 분류하여 유용한 정보를 생산하고, 이것을 바탕으로 미래에 일어나는 불확실한 사건들에 대한 과학적인 판단과 예측을 할 수 있게 도와주는 의사결정방법을 연구하는 학문이다. 즉, 통계란 여러 사회현상의 원인과 결과를 규명하기 위해 관측된 다양한 자료에서 일차적인 분석이나 요약을 통하여 얻어지는 수량적인 정보이다. 그리고 이 정보에 대한 보다 깊이 있는 해석과 분석을 위해서 요구되는 과학적 방법을 통계적 방법이라 하며 그 방법론에 대한 학문적 체계를 통계학이라고 할 수 있다.
통계와 통계학은 그림이나 도표 등을 그리는 단순한 방법에서부터 평균이나 분산 등 여러 가지 통계량을 계산하는 방법 그리고 복잡하게 연관되어 있는 현상을 명료하게 정리해주는 고급 통계적 추론방법들이 있다.
오늘날의 통계학은 컴퓨터와 결합하여 다양한 S/W가 개발되어 학생 또는 일반인들이 널리 쉽게 이용하게 하고 있다. 즉, 통계학에서 다루고 있는 복잡한 수식을 쓰지 않고 S/W에서 제공하는 함수를 통하여 마우스로 몇 번 클릭하면 데이터 분석의 결과를 제공하여 주고 있다. 또한 통계학은 공중 보건 문제 (의학 통계학, 생물 통계학 등), 품질 및 신뢰성, 경제 및 사회적 목적 (실업률, 계량경제학), 농업 연구에서 정확한 의사결정수단으로 이용됨으로서 보다 수준 높은 방법들의 개발이 새롭게 요구되고 있다. 뿐만 아니라 통계학은 그 기원을 넘어 개인 및 조직 데이터를 이해하고 자연과 사회 과학, 의학, 비즈니스 및 기타 분야에 걸쳐 결정을 내릴 수 있는 방법을 제공하는데 까지 확대되고 있다.
최근에는 통계학이 사회적 관심을 불러일으키고 있는 빅데이터 처리와 분석에도 이용되고 있다. 이것은 날마다 축척되고 있는 방대한 대용량의 데이터 세트(set)으로부터 이들이 가지고 있는 보석같은 정보를 추출하고 결과를 분석하는 기술로 다양한 기법을 적용하여 빅 데이터가 갖고 있는 특정한 특성을 찾아내는 것이다.
본 교재는 데이터를 효과적으로 시각화하고 요약하며 해석하는 방법과 이를 토대로 합리적인 의사결정을 도출하는 매우 기본적인 이론을 습득하고 이를 엑셀을 이용하여 데이터 분석하는 방법을 살펴본다.

1.2. 통계학의 분류
통계학은 크게 [그림 1-1]과 같이 기술통계학(descriptive statistics)과 추측통계학(inferential statistics)이다. 기술통계학은 주로 데이터로부터 도표나 그래프를 작성하고, 대표값이나 산포도, 왜도나 첨도 등 다양한 기술통계량을 통하여 주어진 자료를 요약하는 통계학 분야를 말한다. 추측통계학은 기술적 기법을 사용하여 자료에서 얻은 정보를 바탕으로 미래 현상을 예측하거나 새롭게 밝혀진 정보의 진위여부를 확인할 수 있는 추정과 가설검정 등에 관련된 통계적 추론방법을 다루는 통계학 분야이다.
기술통계학을 예를 통해 알아보자. 한 기업이나 대형마트에서 매출액의 증가를 위해 우수 고객의 다양한 정보 즉, 소득, 직업, 나이, 성별, 주소 등이 필요하다고 하자. 이때 기업이나 대형마트 경영부서에서는 자사의 제품을 구매한 모든 고객들에 대하여 이들의 성별이나 연령 그리고 직업들은 어떻게 되고 또한 이들이 주로 구매하는 상품은 어떤 것인가를 알아야 한다. 따라서 지금까지 축척된 방대한 자료로부터 이들의 성격을 파악하기 위하여 사용되는 그래프나 도표 그리고 적절한 통계량들을 계산하는 모든 기술적인 방법들을 연구하는 분야가 기술통계학이다.
추측통계학을 예를 통해 알아보자. 어느 휴대폰 제조회사에서는 자사가 생산한 제품에 대한 평균수명이 얼마나 되는가를 알려고 한다. 이때 한번 검사를 받은 제품은 다시 사용할 수 없으므로 생산된 제품 가운데 일부분만을 선택하여 수명을 측정하고 이를 기초로 전체 제품에 대한 평균수명을 추측할 수 있는 방법이 요구된다. 여기서 생산된 전체 제품 중에서 일부분을 어떻게 선택할 것인가와 선택된 개체들의 성격을 분석하여 전체 제품에 대한 수명을 어떻게 추측할 것인가 등에 관련된 추론방법을 연구하는 분야가 추측통계학이다.

1.3 엑셀(Excell)
데이터를 분석, 시각화, 요약, 의사결정을 위해서 통계 소프트웨어(Software:이하 SW)를 이용한다. 대표적인 통계 SW로는 SAS, SPSS, R, 엑셀 등을 이용하여 통계처리 작업을 하게 된다. 통계 SW인 SAS, SPSS, R로 통계처리를 하려면 많은 처리 방법과 가시화 방법을 익혀야한다.
데이터 분석을 위해 많은 사람들이 스프레트시트(spreadsheet) 즉 엑셀, OpenOffice.org Calc, 쿼트로 프로 등을 사용하고 있다. 본서에서는 엑셀을 사용하여 통계분석을 하고자 한다. 엑셀에서는 통계 SW에서만 가능한 통계 분석을 사용자가 쉽게 접근할 수 있도록 도구로 제공하고 있다. 특히 엑셀은 수치계산 업무, 차트, 데이터베이스 관리 등의 폭넓은 작업을 관리해 줌으로 인해 통계처리의 효율성을 증진시킬 수 있다.
엑셀에서 데이터 분석을 위해서는 데이터 처리를 위한 효율적인 환경 구축, 구축된 환경을 이용하여 데이터를 처리할 수 있는 함수 사용 방법, 데이터베이스 및 피벗테이블 작성, 통계분석 도구의 설치 및 활용이 필요하다. 이 절에서는 엑셀 2013을 이용하여 통계처리를 위한 효율적인 환경 구축과 통계분석 도구 설치에 대해서 알아본다. 그리고 각 장에서 통계 분석도구의 활용과 통계함수의 사용에 대해 알아본다.

1.3.1. 엑셀이란?
엑셀은 스프레드시트의 MicroSoft사의 상표 이름으로 이 책에서는 엑셀 2013버전을 사용할 것이다. 엑셀은 표를 이용하여 계산 및 즉각적인 데이터 분석과 빠른 데이터 열 채우기, 데이터에 적합한 차트 만들기, 데이터에 적합한 피벗 테이블 만들기, 엑셀 추가 기능을 통한 통계 분석 등 다양한 일을 수행할 수 있다.
엑셀은 행과 열로 구성된 셀들로 구성된 커다란 표(sheet)를 다룬다. 보통 작업하고 있는 창의 sheet 이름을 워크시트(worksheet)라고 한다. 엑셀 2013에서 다루는 sheet 수는 가용메모리 자원에 제한을 받지만, 일상적인 데이터 처리는 기본적으로 처리할 수 있다. 한 개의 sheet는 셀로 구성되어 있는데, 엑셀화면에서 네모칸에 해당되는 것으로 작업창이라고도 부른다. 한 시트에 입력할 수 있는 행의 수는 버전별로 다르며, 엑셀 2013 버전은 최대 1,048,576행이며, 열의 수는 16,384이다. 한 셀에는 32,767자의 문자를 입력할 수 있고, 셀 열의 크기는 255자까지 가능하다.

1.3.2. 엑셀의 화면 구성
엑셀 시작과 엑셀의 화면구성에 대해 알아본다.

엑셀 시작
엑셀을 시작하면 [그림 1-2]와 같은 화면이 나온다. 사용자는 새 통합문서를 눌러 엑셀을 시작한다.

엑셀 화면 구성
엑셀을 시작 한 후 보이는 화면은 [그림 1-3]과 같다. 통계 데이터를 분석하기 위해서는 화면 구성요소의 이름을 숙지하고 활용하여야 한다. 엑셀 사용 시 숙지해야할 구성요소는 아래와 같다.
① 빠른 실행도구 : 현재 표시되는 리본 메뉴의 탭에 독립적인 명령 집합이 포함된 사용자 지정 가능한 도구 모음입니다.
② 리본메뉴 : 작업을 완료하는 데 필요한 명령을 신속하게 찾을 수 있도록 디자인되었습니다. 명령은 탭 아래에 논리 그룹으로 분류되며, 각 탭은 쓰기 또는 페이지 레이아웃 지정과 같이 작업 유형과 관련되어 있습니다.
③ 이름상자 : 셀의 고유한 이름이다. 이름의 명명 규칙은 보통 ‘열번호’, ‘행번호’ 순서대로 명명된다. 예제에서는 현재 셀 포인터가 A1 셀을 가리키고 있다.
④ 수식입력줄 : 셀 내에 수식(계산식, 함수, 통계 함수 등)을 입력한다. 셀에는 수식의 결과가 보이고 수식 입력줄에는 입력한 수식이 보이게 된다. 수식을 이용하기 위해서는 사용자는 ‘=’을 입력한 후 사용하여야 한다.
⑤ 셀 : 데이터를 입력하기 위한 칸이다. 한 셀에 최대 32,767자의 문자를 입력할 수 있다. 셀에 있는 데이터를 함수에서 사용하기 위해서는 셀이름을 이용한다. 셀이름은 마우스 포인터를 이용하여 셀을 클릭하면 이름상자에 셀이름이 나온다. 입력할 수 있는 데이터 형식은 다양하다.
⑥ 열번호 : 세로 방향으로 16,384 열을 가지고 있다.
⑦ 행번호 : 가로 방향으로 최대 1,048,576 행을 가질 수 있다.
⑧ 워크시트 : 행과 열로 되어 있는 표를 나타내는 것으로 셀들의 집합이라 할 수 있다. 한 개의 파일에는 메모리가 허용하는 범위까지 워크시트를 추가할 수 있다.

1.3.3. 통계분석 도구 설치하기
분석도구를 사용하면 복잡한 통계 또는 공학 분석을 하려는 경우 많은 시간과 단계를 절약할 수 있습니다. 각 분석에 데이터와 매개 변수를 제공하기만 하면 이 도구에서 통계 함수를 사용하여 결과를 계산하고 출력 결과를 표시합니다. 일부 도구에서는 출력 결과를 차트 형태로 만들어 주기도 합니다.

통계 분석 도구를 이용하여 할 수 있는 일
복잡한 통계 분석을 할 때 분석 도구를 사용하여 많은 시간과 단계를 절약할 수 있다. 통계 분석에 데이터와 매개 변수를 제공하면 통계 함수를 사용하여 결과를 계산하고 출력 결과를 표시한다. 데이터 분석 함수는 한 번에 한 워크시트에서만 사용할 수 있습니다. 다른 워크시트에서 데이터 분석을 수행하려면 워크시트마다 분석 도구를 다시 계산해야 합니다.
데이터분석을 위한 데이터 분석 함수는 아래와 같다.
① 분산분석: 일원 배치법
② 분산분석: 반복 있는 이원 배치법
③ 분산분석: 반복 없는 이원 배치법
④ 상관관계
⑤ 공분산
⑥ 기술통계법
⑦ 지수평활법
⑧ 분산에 대한 두 표본 F-검정
⑨ 푸리에분석
⑩ 히스토그램
⑪ 이동평균
⑫ 난수 생성
⑬ 순위와 백분위수
⑭ 회귀분석
⑮ 표본추출
? t-검정: 두 표본 쌍의 평균
? t-검정: 등분산 가정 두 표본
? t-검정: 이분산 가정 두 표본
? z-검정

이 분석 도구를 사용하기 위해서는 Excel의 추가기능을 이용하여 설치하여야 한다. 설치 순서는 다음과 같다.

파일 → 옵션 선택
통계 분석도구를 설치하기 위해서는 먼저 파일 탭을 선택하고 옵션을 선택한다[그림 1-4].

관리 상자에서 추가기능 선택 후 이동 선택
추가기능에서 관리 상자의 목록을 선택한 후 Excel 추가 기능을 선택 한 후 이동 버튼을 누른다. 그러면 추가기능 화면이 나오게 되는데 이때 통계 및 엔지니어링 분석용 데이터 분석도구인 분석도구를 선택한 후 확인을 누른다[그림 1-5].

통계 분석 도구 설치 확인
엑셀의 추가기능을 이용하여 설치한 분석도구의 설치를 확인하기 위해서는 메뉴에서 데이터를 선택하면 리본 안에 데이터 분석이라는 항목이 나오게 된다. 데이터 분석을 선택하면 [그림 1-6]과 같이 통계 데이터 분석이라는 창이 나오게 된다. 우리는 이 통계 데이터 분석 도구를 이용하여 데이터를 분석하고, 가시화하여 원하는 정보를 생성하게 될 것이다.


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책