logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

일간
|
주간
|
월간

실시간 검색어

검색가능 서점

도서목록 제공

R 코딩과 문자

R 코딩과 문자

김준우 (지은이)
전남대학교출판부
16,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
15,200원 -5% 0원
800원
14,400원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
로딩중

책 이미지

R 코딩과 문자
eBook 미리보기

책 정보

· 제목 : R 코딩과 문자 
· 분류 : 국내도서 > 컴퓨터/모바일 > 프로그래밍 언어 > 프로그래밍 언어 기타
· ISBN : 9791194716228
· 쪽수 : 236쪽
· 출판일 : 2025-09-10

책 소개

숫자의 통계분석을 위해 만들어진 R 언어는 문자의 분석에도 유용하게 쓰이고 있다. R 기반 tm 패키지는 현재 찾아볼 수 있는 가장 쓸모가 있는 시각화 도구 가운데 하나이다. R 언어의 기본 원리부터 시작해서 관련된 패키지로 넘어갈 수 있도록 구성된 교재다.
이 책은 R 언어를 가지고 해보는 노력의 일환이다. 숫자의 통계분석을 위해 만들어진 이 언어는 문자의 분석에도 유용하게 쓰이고 있다. 사실 데이터 의미를 보여주는 데에도 이 언어는 유용한다. R 기반 tm 패키지는 현재 찾아볼 수 있는 가장 쓸모가 있는 몇 개의 시각화 도구 가운데 하나이다. 많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터 문자를 처리하는 것은 실용적 중요성도 동시에 가지게 된다. 이러한 새로움에 적응해나가는 것이 개인이나 조직에게 실존적 의미를 던지는 경우도 나타나기 시작한다. R 언어의 기본 원리부터 시작해서 관련된 패키지로 넘어간다. tm 패키지를 사용하여 단어구름(word cloud) 만드는 방법을 다루고는, 문자를 조금 더 효율적으로 추출해내고 다루는 방법인 정규식(regular expression) 소개로 책이 마무리된다. 다른 책에서는 찾기 어려운 이 책만의 뚜렷한 세 가지 장점이 있다. 첫 번째로 R 원리를 중심으로 전개된다. 대표적인 것이 R 언어 최소단위 벡터이다. 예시를 들어가면서 원리를 깊이 있고 자세하게 설명한다. 그리고 이를 계속 응용해 나간다. 이 책은 쉽게 풀어서 원리를 제공하면서도 나중에 다루어도 될 주제는 생략하는 방식으로 진도를 쭉 나가고 있다. 두 번째로 R 코딩 원리와 문자 처리 실무를 같이 배울 수 있다. 기존 방식은 R 기초 과정이 끝난 다음에 더 수준 높은 과정으로서 문자열을 다룬다. 모든 컴퓨터 언어가 숫자뿐 아니라 문자 역시 자연히 다루게 되는 걸 생각해보면, 이러한 학습 방식은 인위적이다. 그래서 비효율적이다. 따라서 독자 입장에서는 문자 처리라는 실무를 R 코딩 원리 이해와 연결시킬 수 있다. 인문과학 사회과학 학술 분석뿐 아니라 일반 실무 작업을 수행할 때, 원리를 제대로 알고 분석을 해나갈 수 있게 된다. 세 번째로 이 책의 진행은 퀴즈를 푸는 듯한 느낌을 가질 수 있다. 근원적 R 코딩 원리와 관련된 부분은 질문을 먼저 던진다. 그리고 제일 마지막 장에는 열쇠에 해당하는 지식을 제공한다. 수업 시간에서 학생들과 같이 성장하는 과정이, 책에 반영되기 때문에 가능한 형식이다.

목차

01 묶음의 벡터vector / 13
02 묶음에 대한 함수와 기호 / 23
03 논리값과 묶음 / 29
04 논리값과 묶음 더 살펴보기 / 39
05 할인매장 비유에서 신선식품 혹은 가공식품 정하기 as 함수와 R의 개입 / 51
06 벡터 c 함수 데이터프레임data.frame 함수 리스트list 함수 / 57
07 base R 사용해서 문자 다루기 / 63
08 문자를 가져오고 또 가져와서 바꾸는 함수 / 73
09 창고형 할인매장에서 물건 묶음을 맞추어 팔기 paste 함수 / 83
10 문자 묶음을 strsplit 함수로 쪼개면 / 91
11 날짜벡터 문자벡터 / 99
12 요인factor / 111
13 들쭉날쭉한 텍스트 파일 가져오기 / 123
14 R로 파일 가져오는 다양한 방법들 / 133
15 텍스트마이닝 패키지 tm 설치와 corpus / 146
16 문자 정제text cleaning / 155
17 단어구름wordcloud / 166
18 단어구름 손질하기 / 179
19 정규식에서 패턴pattern 매치match 시키기 / 191
20 메타문자 . 기호 아무거나 가능하지만 반드시 한 칸만 차지한다 / 195
21 마침표 . 찾으려면 \. / 199
22 R에서 정규식 실습하기 / 203
23 메타문자 그리고 해제문자로서 \ / 211
24 앞서 제기된 질문을 푸는 단서 / 221
이 책에 인용되어 있고 또 볼만한 책들 / 225

저자소개

김준우 (지은이)    정보 더보기
고려대학교 문과대학 사회학과 졸업 Michigan State University 사회학-도시학 박사 Singapore National University 박사후 과정 부산발전연구원 부연구위원 현재 전남대학교 사회학과 교수 저역서 『사회과학의 현대통계학』 (김영채 공저) 박영사 『즐거운 SPSS, 풀리는 통계학』 박영사 『국가와 도시』 전남대학교출판문화원 2008년 문화체육관광부 선정 우수학술도서 『선집으로 읽는 한국의 도시와 지역』 (안영진 공편) 박영사 『공간이론과 한국도시의 현실』 전남대학교출판문화원 『황금도시: 장소의 정치경제학』 전남대학교출판문화원 John R. Logan & Harvey L. Molotch(2007), Urban Fortunes: The Political Economy of Place, The University of California. 『새로운 지역격차와 새로운 처방: 철근/콘크리트에서 지역발전유발 지식서비스로』 (안영진 공저) 박영사 『서울권의 등장과 나머지의 쇠퇴』 전남대학교출판문화원 『미국이라는 공간: 부동산 투기·노예제·인종 차별·인디언 제거·뺏기는 삶의 터전』 박영사 『어원+어원=영단어』 박영사 『어원과 동사』 전남대학교출판문화원 『20세기 공간이론』 전남대학교출판문화원 『즐거운 R 코딩, 풀리는 R Commander 확률 통계』 박영사 『ggplot2 데이터시각화 그리고 R 코딩』 전남대학교출판문화원 『이념과 공간』 (안영진 공저) 전남대학교출판문화원 2024년 세종도서 학술부문 선정
펼치기

책속에서

01 묶음의 벡터vector
1.1 하라는 대로 따라 하는 base R 설치
먼저 R 설치해야 한다. 그냥 검색창에 R 입력해서 검색한다. 구글 네이버 다음 등등 어디에서나 가능하다.
R 홈페이지 바로 가는 방법도 있다. httpss://www.r-project.org/ 이다.
화면 제일 밑줄에 보이는 download R 누른다.
그리고는 그냥 컴퓨터가 시키는 대로 그대로 진행한다.
시키는 대로 진행하는 이유가 있다. 시키는 대로 하면 내가 무엇을 바꾸지 않게 된다. R에서는 설치 경로나 저장하는 파일에 한글을 넣지 않아야 한다. 하라는 대로 하면 다 영어로 진행된다.
이 책 R 코딩 과정에서도 한글은 아예 쓰지 않는다. 입력도 오래 걸리고 오류도 나기 쉽다.
어디서 다운받을지를 묻는 이런 화면이 나올 수도 있다. 마찬가지로 기본사양 0-Cloud [httpss] 그대로 선택한다.
빨리 내려 받을 수 있도록, 알아서 가까운 곳을 찾아준다.
이제 화면에 다음과 같은 아이콘이 생겨나 있을 것이다. 이제부터 Base R 사용 가능하다.
아이콘 더블클릭하면 명령문 입력하고 실행하는 화면인 콘솔console 화면이 나온다.
1.2 R 종료할 때 작업공간 이미지 저장하지 말아야
이 책을 보면서 작업을 하다가 R 화면을 닫으면 다음과 같은 창이 나온다.
이런 경우 아니요 선택한다. 이렇게 해야 하는 이유는 다음 책 78쪽부터 시작하는 ‘37. 만들고 실행한 결과물인 작업공간 저장하지는 말자’ 부분을 읽어보면 된다.
김준우. 2023. 즐거운 R 코딩, 풀리는 R Commander 확률 통계.
이 책의 코딩은 짧고 간단해서 그냥 다시 입력해도 큰 문제는 없다.
그래도 반복이 싫은 경우에는 입력한 내용을 복사해서 메모장이나 아래아 한글 파일로 저장하면 된다.
처음 시작하는 프롬트 > 제외하고 나머지 부분을 한 줄씩 복사해서 R에 붙여서 실행시키면 된다.
1.3 base R 최소단위는 벡터vector 그리고 여기서 나오는 R 언어의 개입
R 언어의 최소단위는 벡터vector 이다. 최소단위가 하나의 숫자나 문자가 아니다.
숫자나 문자의 묶음인 벡터vector 최소단위로 작동하는 것이 R 언어이다. 가게로 비유해보자! 코스트코 롯데맥스 같은 창고형 할인점을 생각하면 되겠다. 묶음 단위이다.
다른 교재를 보니까 이런게 있던데, 그러면 최소단위가 하나의 숫자나 문자 아닌가요? 이런 질문이 있을 수 있다.
<- 기호로는 지정을 한다. 영어로 assign 이다. 무엇 무엇이라고 정한다 라고 이해하면 되겠다.
화살표를 받는 쪽이 당하는 객체object 된다. 객체는 예술 이론에서 많이 나온다. 바뀌어지는 쪽이다.
하여튼 여기에서 이렇게 잘못 생각할 수도 있다. u 라고 정해진 것이 1이다. h 라고 정해진 것이 car 이다. 문자를 다룰 경우에는 따옴표를 이렇게 쓴다. 하여튼 이러니까 하나의 숫자 하나의 단어가 기초 단위 아닌가?
사실 이렇게 되어야 한다. 여러 개 묶음이 보통이라서 상품마다 묶어주는 것이 있어야 한다. 묶는다는 combine 의미의 c 함수가 들어간다.
함수는 이것을 넣으면 저런 과정을 거쳐서 나온다는 걸 정해둔 것이다. 공장의 기계로 치면 여러 개를 하나로 묶는 기계에 해당한다. c 다음의 괄호 안에 있는 것이 투입물이다. 산출물은 이렇게 정해진 벡터 이름을 입력하고 엔터를 누르면 나오는 묶음이다.
하나의 구성요소만 있는 벡터는 굳이 묶지 않아도 되니까 c함수 없이 표기해도 작동할 뿐이었던 것이다.
당연히 보통은 구성요소가 여러 개이다. 그리고 여기서 우리는 중요한 두 가지를 한꺼번에 알아본다. 첫째 동일한 이름의 벡터를 지정하면 이전의 내용을 겹쳐 써버린다. 이전의 내용은 없어진다는 것이다.
두 번째는 R 언어는 직접적으로 개입하기도 한다. 벡터 구성요소 숫자가 맞지 않으면 그렇다. 그 순간에 강력하게 개입한다.
여기서 재미있는 점이 있다. 그러고는 또 최대한 원래 상태를 그대로 유지시킨다.
이러한 개입은 묶음을 단위로 한다는 사실에서부터 나온다. 묶음이 단위가 아니라면, 이러한 개입의 여지 자체가 없다.
창고형 할인점에서 이 묶음 저 묶음을 또 합쳐서 같이 물건을 팔아야 하는 경우를 생각해보자! 물론 비유이다.


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책