[큰글씨책] 언어지능

책 이미지

eBook 미리보기

책 정보

· 제목 : [큰글씨책] 언어지능
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791128805387
· 쪽수 : 128쪽
· 출판일 : 2017-07-25

책 소개

데이터 사이언스 총서. 인간의 지적 능력 중 대부분이 언어와 연관된 언어지능과 관련되어 있다. 현재 일상적 언어 데이터 분석은 매우 중요한 빅데이터 분석의 대상이다. 이 책은 현재 데이터사이언스와 직접적으로 연관된 지능 관련 주제를 다룬다.

저자소개

김동성 (지은이) 정보 더보기

이화여자대학교 컴퓨터공학과 특임교수다. 뉴욕대학교에서 언어학으로 석사 학위를, 고려대학교에서 전산언어학으로 박사 학위를 받았다. 이화여자대학교 인문대학 인문테크놀로지 특임교수(2016~2022), 고려대학교 언어정보연구소 연구교수(2007~2016), 한국외국어대학교 연구원(2007~2009)으로 활동했다. 고려대, 한국외국어대학교, 연세대학교에서 강의했다. 주요 저서로는 『언어지능』(2022), 『인문테크놀로지 입문』(2019), 『언어 자료 분석을 위한 통계학』(2010), 『언어 자료 처리를 위한 Perl』(2008) 등이 있다. 음성인식 음성 사용자 인터페이스 및 시스템개발, 인공지능 시스템 개발 등 관련 업계에서 종사했다. 주요 관심 및 연구 분야는 인공지능, 자연어처리, 온톨로지 및 지식시스템, 컴퓨터를 활용한 언어교육, 음성처리, 대화 시스템 등이다.

펼치기

책속에서

현재 인공지능, 빅데이터 등 최첨단 정보처리 기술과 맞물려 언어를 이해하는 기술은 크게 인간?기계 인터페이스와 연관된 부문, 언어 데이터 및 여러 정보를 처리하는 부문, 인간의 교육과 연관된 부문, 인간의 지적 능력을 해결하는 부문 등으로 나뉜다. 인간-기계 인터페이스와 연관돼 인간 언어의 물리적 소리를 이해하고 인간과 대화하는 기술들인 음성처리, 자동대화시스템이 주요하게 작동한다. 언어 데이터 처리 능력은 언어 빅데이터인 코퍼스, 정보검색, 자동번역, 문서자동요약, 사전·온톨로지 등에서 활용된다. 인간의 지적 능력과 연관된 부문은 기계학습, 컴퓨터를 활용한 언어학습, 추론시스템이다. 이 모든 언어지능의 가장 기본은 언어 빅데이터인 코퍼스, 사전·온톨로지다.
“지능의 출발” 중에서

언어지능의 첫 번째 단계는 데이터인 코퍼스를 수집하는 것이다. 데이터에서 발견되는 ‘확률’은 언어에 대한 지식으로 언어지능의 시작이다. 구어·문어, 논문·소설·신문기사와 같이 여러 다양한 방식으로 데이터를 모을 수 있지만, 시어는 축약이나 함축성으로 인해 적합하지 않다. 여러 다양한 유형으로 균형 잡힌 데이터 수집이 데이터를 모으면서 가장 중요한 원칙이 된다. 모인 데이터에 언어 정보를 포함시키는 가공도 가능하다. ‘빈도’라는 언어지식은 언어지능의 시작이 된다.
“언어 빅데이터 코퍼스” 중에서