음성과 언어 처리 (기계는 어떻게 사람의 말을 이해할까?)
댄 주래프스키, 제임스 H. 마틴 | 에이콘출판
67,500원 | 20230324 | 9791161757315
이 책은 단어와 구성 요소들로 시작해서, 단어의 시퀀스 속성과 단어들이 어떻게 말하고 이해되는지를 다룬다. 그리고 언어 간 질의 응답, 대화, 번역의 기초가 되는 단어들이 서로 어울리는 방식(구문론), 의미를 형성하는 방식(의미론)을 설명한다. 또한 기술의 관점에서 정규 표현, 정보 검색, 문맥 자유 문법, 통일, 일차 술어 해석, 은닉 마르코프와 다른 확률론적 모델, 수사학적 구조 이론 등을 다루고 있다. 이 책을 따라 가면 음성 및 언어 처리의 핵심적인 알고리듬을 거의 다 경험해 볼 수 있다.
언어학은 과학 분야에서 100년의 역사를 가지고 있고, 컴퓨터 언어학은 컴퓨터 공학의 일부로서 50년의 역사를 가지고 있다. 그러나 언어 이해 기술이 인터넷에서 정보 검색과 기계 번역을 이용할 수 있고, 데스크톱 컴퓨터에서 음성 인식이 인기를 끌면서 수백만 명에게 알려진 산업으로 부상한 것은 불과 10여 년 전의 일이다. 이 산업은 언어 정보의 표현과 처리의 이론적 진보에 의해 가능해졌다.
『음성과 언어 처리 2/e』은 모든 수준에서 모든 현대 기술과 함께 철저히 다루는 최초의 책이다. 심층 언어 분석과 견고한 통계 방법을 결합하며, 레벨의 관점에서 보면 단어와 그 구성 요소들로 시작해 단어의 시퀀스 속성과 단어들이 어떻게 말하고 이해되는지 다룬 뒤, 단어들이 서로 어울리는 방식(구문), 의미를 형성하는 방식(의미론), 언어 간 질의응답, 대화, 번역의 기초를 살펴본다. 기술의 관점에서 보면 정규 표현, 정보 검색, 문맥 자유 문법, 통일, 일차 술어 해석, 은닉 마르코프와 다른 확률론적 모델, 수사학적 구조 이론 등을 다루고 있다. 이전에는 이런 종류의 적용 범위를 얻으려면 두세 권의 책이 필요했을 것이다. 이 책은 한 권으로 이 모든 범위를 다루고 있다. 하지만 무엇보다 각각의 기술이 어떻게 가장 잘 사용되고, 어떻게 함께 사용될 수 있는지에 대한 감각을 제공하고 있다는 점이 더 중요하다. 독자의 관심을 유지하고 철저하지만 무미건조하지 않은 방식으로 기술적 세부 사항에 동기를 부여하는 매력적인 스타일로 이 모든 과정을 수행한다. 여러분이 과학적이거나 산업적인 관점에서 본 분야에 관심이 있든지 간에 이 책은 이 매혹적인 분야의 향후 연구에 이상적인 소개와 안내 역할을 해줄 수 있을 것이다.
2000년에 출간된 이 책의 초판 이후 음성 및 언어 처리 분야는 여러 면에서 발전했다. 널리 사용되는 언어 기술에는 더 많은 애플리케이션이 있다. 많은 언어 데이터 모음(쓰기 및 말하기)을 사용할 수 있게 되면서, 통계 머신러닝에 훨씬 더 의존하게 됐다. 이 개정판은 이론과 실제 관점에서 새로운 혁신을 다루며, 학습할 부분을 더 쉽게 선택할 수 있게 해준다(부와 장 간의 종속성이 더 적다).
언어 처리 분야는 초판이 출간된 이후에도 몇 가지 뛰어난 설명문이 있었지만, 이 책은 어떤 책보다도 언어 처리 분야 전반을 가장 훌륭히 설명하고 있다.
◈ 이 책의 대상 독자 ◈
주로 대학원이나 고급 학부 과정에 사용하기 위한 것이다. 포괄적인 적용 범위와 알고리듬의 수가 많기 때문에 음성 및 언어 처리 분야의 학생과 전문가들에게 참고 자료로 유용하다.