책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791194716228
· 쪽수 : 236쪽
· 출판일 : 2025-09-10
책 소개
목차
01 묶음의 벡터vector / 13
02 묶음에 대한 함수와 기호 / 23
03 논리값과 묶음 / 29
04 논리값과 묶음 더 살펴보기 / 39
05 할인매장 비유에서 신선식품 혹은 가공식품 정하기 as 함수와 R의 개입 / 51
06 벡터 c 함수 데이터프레임data.frame 함수 리스트list 함수 / 57
07 base R 사용해서 문자 다루기 / 63
08 문자를 가져오고 또 가져와서 바꾸는 함수 / 73
09 창고형 할인매장에서 물건 묶음을 맞추어 팔기 paste 함수 / 83
10 문자 묶음을 strsplit 함수로 쪼개면 / 91
11 날짜벡터 문자벡터 / 99
12 요인factor / 111
13 들쭉날쭉한 텍스트 파일 가져오기 / 123
14 R로 파일 가져오는 다양한 방법들 / 133
15 텍스트마이닝 패키지 tm 설치와 corpus / 146
16 문자 정제text cleaning / 155
17 단어구름wordcloud / 166
18 단어구름 손질하기 / 179
19 정규식에서 패턴pattern 매치match 시키기 / 191
20 메타문자 . 기호 아무거나 가능하지만 반드시 한 칸만 차지한다 / 195
21 마침표 . 찾으려면 \. / 199
22 R에서 정규식 실습하기 / 203
23 메타문자 그리고 해제문자로서 \ / 211
24 앞서 제기된 질문을 푸는 단서 / 221
이 책에 인용되어 있고 또 볼만한 책들 / 225
저자소개
책속에서
01 묶음의 벡터vector
1.1 하라는 대로 따라 하는 base R 설치
먼저 R 설치해야 한다. 그냥 검색창에 R 입력해서 검색한다. 구글 네이버 다음 등등 어디에서나 가능하다.
R 홈페이지 바로 가는 방법도 있다. httpss://www.r-project.org/ 이다.
화면 제일 밑줄에 보이는 download R 누른다.
그리고는 그냥 컴퓨터가 시키는 대로 그대로 진행한다.
시키는 대로 진행하는 이유가 있다. 시키는 대로 하면 내가 무엇을 바꾸지 않게 된다. R에서는 설치 경로나 저장하는 파일에 한글을 넣지 않아야 한다. 하라는 대로 하면 다 영어로 진행된다.
이 책 R 코딩 과정에서도 한글은 아예 쓰지 않는다. 입력도 오래 걸리고 오류도 나기 쉽다.
어디서 다운받을지를 묻는 이런 화면이 나올 수도 있다. 마찬가지로 기본사양 0-Cloud [httpss] 그대로 선택한다.
빨리 내려 받을 수 있도록, 알아서 가까운 곳을 찾아준다.
이제 화면에 다음과 같은 아이콘이 생겨나 있을 것이다. 이제부터 Base R 사용 가능하다.
아이콘 더블클릭하면 명령문 입력하고 실행하는 화면인 콘솔console 화면이 나온다.
1.2 R 종료할 때 작업공간 이미지 저장하지 말아야
이 책을 보면서 작업을 하다가 R 화면을 닫으면 다음과 같은 창이 나온다.
이런 경우 아니요 선택한다. 이렇게 해야 하는 이유는 다음 책 78쪽부터 시작하는 ‘37. 만들고 실행한 결과물인 작업공간 저장하지는 말자’ 부분을 읽어보면 된다.
김준우. 2023. 즐거운 R 코딩, 풀리는 R Commander 확률 통계.
이 책의 코딩은 짧고 간단해서 그냥 다시 입력해도 큰 문제는 없다.
그래도 반복이 싫은 경우에는 입력한 내용을 복사해서 메모장이나 아래아 한글 파일로 저장하면 된다.
처음 시작하는 프롬트 > 제외하고 나머지 부분을 한 줄씩 복사해서 R에 붙여서 실행시키면 된다.
1.3 base R 최소단위는 벡터vector 그리고 여기서 나오는 R 언어의 개입
R 언어의 최소단위는 벡터vector 이다. 최소단위가 하나의 숫자나 문자가 아니다.
숫자나 문자의 묶음인 벡터vector 최소단위로 작동하는 것이 R 언어이다. 가게로 비유해보자! 코스트코 롯데맥스 같은 창고형 할인점을 생각하면 되겠다. 묶음 단위이다.
다른 교재를 보니까 이런게 있던데, 그러면 최소단위가 하나의 숫자나 문자 아닌가요? 이런 질문이 있을 수 있다.
<- 기호로는 지정을 한다. 영어로 assign 이다. 무엇 무엇이라고 정한다 라고 이해하면 되겠다.
화살표를 받는 쪽이 당하는 객체object 된다. 객체는 예술 이론에서 많이 나온다. 바뀌어지는 쪽이다.
하여튼 여기에서 이렇게 잘못 생각할 수도 있다. u 라고 정해진 것이 1이다. h 라고 정해진 것이 car 이다. 문자를 다룰 경우에는 따옴표를 이렇게 쓴다. 하여튼 이러니까 하나의 숫자 하나의 단어가 기초 단위 아닌가?
사실 이렇게 되어야 한다. 여러 개 묶음이 보통이라서 상품마다 묶어주는 것이 있어야 한다. 묶는다는 combine 의미의 c 함수가 들어간다.
함수는 이것을 넣으면 저런 과정을 거쳐서 나온다는 걸 정해둔 것이다. 공장의 기계로 치면 여러 개를 하나로 묶는 기계에 해당한다. c 다음의 괄호 안에 있는 것이 투입물이다. 산출물은 이렇게 정해진 벡터 이름을 입력하고 엔터를 누르면 나오는 묶음이다.
하나의 구성요소만 있는 벡터는 굳이 묶지 않아도 되니까 c함수 없이 표기해도 작동할 뿐이었던 것이다.
당연히 보통은 구성요소가 여러 개이다. 그리고 여기서 우리는 중요한 두 가지를 한꺼번에 알아본다. 첫째 동일한 이름의 벡터를 지정하면 이전의 내용을 겹쳐 써버린다. 이전의 내용은 없어진다는 것이다.
두 번째는 R 언어는 직접적으로 개입하기도 한다. 벡터 구성요소 숫자가 맞지 않으면 그렇다. 그 순간에 강력하게 개입한다.
여기서 재미있는 점이 있다. 그러고는 또 최대한 원래 상태를 그대로 유지시킨다.
이러한 개입은 묶음을 단위로 한다는 사실에서부터 나온다. 묶음이 단위가 아니라면, 이러한 개입의 여지 자체가 없다.
창고형 할인점에서 이 묶음 저 묶음을 또 합쳐서 같이 물건을 팔아야 하는 경우를 생각해보자! 물론 비유이다.