책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791193707531
· 쪽수 : 280쪽
· 출판일 : 2024-08-14
책 소개
목차
1 기본 언어 R 그리고 작업도구 ggplot2 / 13
2 ggplot2 기본단위 데이터프레임 / 25
3 그림 그려나가는 일련의 과정으로서의 ggplot2 / 33
4 시간 흐름의 선도표 / 51
5 변수를 매핑mapping 그리고 어떤 값을 세팅setting / 61
6 면 분할 faceting / 75
7 산점도 그리기와 데이터프레임에서 $ 기호 / 85
8 유화 그리듯 덧칠해 나가는 ggplot2 문법 / 97
9 전체적 구도와 배경 바꾸는 theme 함수 / 111
10 겹침 해결하는 jitter alpha / 135
11 여성 기대수명과 일인당 국내총생산 실제자료의 실제처리 / 143
12 중위수 사분위수 상자도표 그리고 선택으로서 데이터시각화 / 151
13 막대도표와 히스토그램은 다르다 / 169
14 남녀 분포와 같이 아주 간단한 것만 원도표 만들어야 / 183
15 팔꿈치로 살짝 밀기 nudge / 201
16 축 범위 조절과 시간 날짜 / 207
17 행마다의 이름 rownames / 217
18 요인factor / 223
19 누적 막대도표 / 231
20 ggplot2 쓸 때 실제로 필요해지는 요인factor / 243
21 결측값 NA / 257
22 색깔은 꼭 필요한 곳에만 / 267
■본문에 인용되어 있고 또 읽어볼만한 책 / 276
■찾아보기 / 277
저자소개
책속에서
1 기본 언어 R 그리고 작업도구 ggplot2
1.1 R 설치, ggplot2 설치, ggplot2 불러오기
ggplot2 사용하려면 먼저 R 설치해야 한다.
그냥 검색창에 R 입력해서 검색한다. 구글 네이버 다음 등등 어디에서나 가능하다.
R 홈페이지 바로 가는 방법도 있다. httpss://www.r-project.org/ 이다.
R 내려받기 의미하는 화면 제일 밑줄에 보이는 download R 누른다.
그리고는 그냥 컴퓨터가 시키는대로 그대로 진행한다.
시키는대로 진행하는 이유가 있다. 시키는대로 하면 내가 무엇을 바꾸지 않게 된다. R에서는 설치 경로나 저장하는 파일에 한글을 넣지 않아야 한다. 하라는 대로 하면 다 영어로 진행된다.
이 책 R 코딩 과정에서도 한글은 아예 쓰지 않는다. 입력도 오래 걸리고 오류도 나기 쉽다.
이런 식으로 R 설치하는 과정에서 base 표현이 나온다. 기본 R 의미이다. base R 이라고 부른다.
base R 하고는 다른 것이 있다. 패키지package 이다. 추가적 작업도구이다. ggplot2 역시 패키지이다.
비유를 들어보자. R base 다운받는 것은 자동차를 가지는 것이다.
R 패키지 경우는, 자동차에 추가적으로 장착하는 무엇이다. 자동차가 잘하지 못하는 것을 할 수 있게 해주는 무언가이다. 암벽등반을 위한 장비일 수도 있고, 강을 건널 수 있는 작은 배일 수도 있다.
설치를 해야 하고, 또 쓸 때마다 꺼내야 한다. 먼저 ggplot2 패키지 설치부터 시작한다.
패키지들 패키지(들) 설치하기... 한다.
어디서 다운받을지를 묻는 화면이다. 기본사양 0-Cloud [httpss] 그대로 선택한다.
빨리 내려받을 수 있도록, 알아서 가까운 곳을 찾아준다.
설치를 해도 달라지는 것은 없다.
그리고 하나 늘 생각해야 하는 것이 있다. 얘기한 것처럼 패키지는 쓸 때마다 불러와야 하다. 작업도구이니까 꺼내야 한다.
ggplot2 불러온다.
패키지들 패키지 불러오기... 누른다.
마찬가지로 달라지는 것은 없다. 하지만 이제 ggplot2 사용 가능하다.
1.2 하나 단위 규칙적 숫자 만들기 :
R 설치하면 콘솔 창이 뜬다. 그림에서처럼 왼쪽 윗부분에 R Console 이라고 되어 있다.
영화에서 80년대 해커가 명령문 입력하는 장면을 연상시키는, 그런 창이다.
이번에는 : 라는 기호를 써서 무언가 작업을 실행해본다. 입력하고 엔터를 눌러주어야 한다. 기호이지만 규칙적으로 벡터의 구성요소를 묶어주기 때문에 입력된 무엇을 정해진대로 작업해서 출력하는 함수와 비슷하다.
: 기호는 1 단위의 규칙적 숫자로 벡터를 만든다. 꼭 정수이거나 숫자가 늘어나야 하는 건 아니다.
h 벡터는 19.5:0.5 방식으로 지정된다. 19.5에서 0.5까지 하나씩 줄어드는 숫자로 구성된다.
[] 기호를 써서 벡터의 몇 번째 구성요소를 불러올 수도 있다.
h[3] 입력하고 엔터 누르면, 세 번째 구성요소인 17.5 나온다.
> h <- 19.5:0.5
> h
[1] 19.5 18.5 17.5 16.5 15.5 14.5 13.5 12.5 11.5 10.5 9.5 8.5 7.5 6.5 5.5
[16] 4.5 3.5 2.5 1.5 0.5
> h[3]
[1] 17.5
앞서 한 실습에서 : 기호 이후 숫자를 생략하고 엔터를 눌러본다.
+ 기호가 나타난다. R이 보았을 때 무언가 작업을 덜 끝낸 것 같으니 더 계속하라는 의미이다.
> h <- 19.5:
+
당연히 더 계속하면 된다. 쭉 계속 입력하여 완성시키고 엔터 누르면 된다.
> h <- 19.5:
+ 0.5
> h
[1] 19.5 18.5 17.5 16.5 15.5 14.5 13.5 12.5 11.5 10.5 9.5 8.5 7.5 6.5 5.5
[16] 4.5 3.5 2.5 1.5 0.5
아니면 그 상태에서 Esc 눌러서 빠져나와도 된다. 명령문을 입력할 준비가 되어 있다는 신호가 다시 나타난다.
프롬트prompt 기호인 > 이다.
1.3 벡터의 몇 번째 구성요소라는 의미 []
앞서 [] 기호를 잠시 언급한 바 있다.
다음 그림을 보자. 두 번째 줄에서 f 입력 하고나면 다음 줄에 [1] 이라는 표시가 나온다. 이는 묶음 형태 데이터인 벡터의 첫 번째 구성요소라는 의미이다.
다음 출력에서 [18] 의미는 g라는 이름의 벡터 37은 18번째 구성요소라는 의미이다.
앞서 h 벡터를 다시 만든다. 19.5:0.5 방식으로 지정된다. 19.5에서 0.5까지 하나씩 줄어드는 숫자로 구성된다.
[] 기호를 써서 벡터의 몇 번째 구성요소를 불러올 수도 있다.
h[3] 입력하고 엔터 누르면, 세 번째 구성요소인 17.5 나온다.
> h <- 19.5:0.5
> h
[1] 19.5 18.5 17.5 16.5 15.5 14.5 13.5 12.5 11.5 10.5 9.5 8.5 7.5 6.5 5.5
[16] 4.5 3.5 2.5 1.5 0.5
> h[3]
[1] 17.5