logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

빅데이터 시대의 언어 연구

빅데이터 시대의 언어 연구

(내 손안의 검색엔진)

이민행 (지은이)
21세기북스
29,800원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
26,820원 -10% 0원
1,490원
25,330원 >
26,820원 -10% 0원
카드할인 10%
2,682원
24,138원 >
yes24 로딩중
교보문고 로딩중
11st 로딩중
영풍문고 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
G마켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
서점 유형 등록개수 최저가 구매하기
로딩중

eBook

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 23,840원 -10% 1190원 20,260원 >

책 이미지

빅데이터 시대의 언어 연구
eBook 미리보기

책 정보

· 제목 : 빅데이터 시대의 언어 연구 (내 손안의 검색엔진)
· 분류 : 국내도서 > 인문학 > 기호학/언어학 > 언어학/언어사
· ISBN : 9788950960902
· 쪽수 : 492쪽
· 출판일 : 2015-08-17

책 소개

코퍼스를 기반으로 하는 언어 연구에서 필수적인 검색 엔진을 구축하고 활용할 수 있는 상세한 방법론과 함께 다양한 사례를 제시한 책. 연구나 교육에 필요한 다양한 데이터 및 용례를 효율적으로 추출하는 데 유용한 지식을 제공해줄 것이다.

목차

책머리에

1 서론

2 CWB 기반 코퍼스의 구축 방법: 단일어 코퍼스, 통합 코퍼스, 병렬 코퍼스
2.1 단일어 코퍼스의 구축 방법
2.2 통합 코퍼스 MILCA의 구축 방법
2.3 병렬 코퍼스 FA-EN/FA-KO의 구축 방법

3 CQP 검색언어의 이해
3.1 기본 검색식의 활용
3.2 정규 표현식의 활용
3.3 고급 검색식의 이해

4 영어 분석
4.1 어휘 층위의 통계적 분석
4.2 파생어 연구
4.3 연어관계 연구
4.4 구문과 어휘의 상관관계

5 한국어 분석
5.1 어휘 층위의 통계적 분석
5.2 파생어 연구
5.3 연어관계 연구
5.4 구문과 어휘의 상관관계

6 독일어 분석
6.1 어휘 층위의 통계적 분석
6.2 파생어 연구
6.3 연어관계 연구
6.4 구문과 어휘의 상관관계
6.5 텍스트의 핵심도와 문서유사도

7 다중언어 코퍼스 MILCA의 활용
7.1 프랑스어 분석
7.2 스페인어 분석
7.3 인도네시아어 분석

8 종합

참고문헌
부록
찾아보기

저자소개

이민행 (지은이)    정보 더보기
독일 뮌헨대학교 대학원에서 이론언어학으로 박사학위를 취득했다. 현재 연세대 독어독문과 교수로 재직하고 있다. 2002년-2003년에 미국 Harvard대의 초청을 받아 옌칭 연구소의 방문학자로 연구를 수행한 바 있다. 2018년에 대한민국 학술원상(인문학부문)을 수상하고 2021년 1월부터 한국언어학회 회장직을 맡고 있다. 저서로 『독일어 전산 구문문법 연구』(2012), 『빅데이터 시대의 언어연구』(2015), 『정보기반 독어학 연구』(2017)와 『독일어 전산 의존문법 연구』(2021) 등 말뭉치 언어학 4부작을 출간했다.
펼치기

책속에서

CWB 기반 코퍼스는 몇 가지 장점을 가지고 있다. 그중의 하나는 대용량 데이터를 처리할 수 있는 효율적인 검색 시스템 CQP를 내장하고 있다는 점이다. 이 검색 시스템은 2GB까지 처리 가능하다. 두 번째 장점은 유니코드를 지원하기 때문에 여러 언어의 코퍼스 구축을 가능하게 하여 언어 보편적으로 활용된다는 것이다. 세 번째 장점은 원천 텍스트의 포맷을 폭넓게 수용하기 때문에 부가되는 언어적 정보에 있어 차이가 있는 자료들도 하나의 코퍼스로 통합할 수 있다는 데서 찾을 수 있다. 넷째는 검색 시에 정규 표현식을 지원한다는 장점을 갖는다. 이러한 여러 가지 장점 때문에 많은 언어들이 이미 CWB 기반 코퍼스로 구축되어 웹을 통해 서비스되고 있다. 예를 들어 BNCweb이라는 이름으로 웹상에서 서비스되고 있는 영어 코퍼스 BNC는 바로 CWB 기반 코퍼스이다.


위의 예에서 확인할 수 있듯이 존재를 표현하는 ‘there’와 함께 한 문장 내에 나타나는 동사들 가운데 출현빈도가 높은 것은 ‘seem’, ‘appear’, ‘remain’이다. 이 통계를 뒷받침하는 용례들 가운데 일부는 앞서 50에 제시된 바 있다. 위의 검색식 60에 쓰인 준거점(target) 바로 뒤에는 ‘hw’가 나타나 있는데, ‘hw’ 대신에 ‘word’나 ‘pos’ 등 위치속성이 쓰일 수도 있다. 이와 관련한 선택은 검색을 통해 달성하고자 하는 검색의 목적과 결부되어 있다.


이 표에 따르면 소통동사(vc4), 심리동사(vc9) 및 사회관계동사(vc13) 부류가 into 사역구문과 공연하는 정도가 매우 높은 것으로 나타난다. 이 부류의 동사들은 워드넷 내에서의 평균값과 비교하여 2∼3배 정도 자주 이 구문에 출현한다. 선구적으로 이 구문에 대한 연구를 시작했던 Huston·Francis (2000)에서도 frighten, scare 및 terrify 등 부정적인 심리동사들이 이 구문을 매우 선호한다는 점을 지적한 바 있다. 이들은 이외에도 coax나 charm 등 비이성적인 설득을 시도하는 소통동사와 force나 coerce 등 강요를 의미하는 동사들도 이 구문에 빈번히 나타난다는 사실을 밝혀낸 바 있다.


이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 커미션을 지급 받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책
9788950961152