책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791128805387
· 쪽수 : 128쪽
· 출판일 : 2017-07-25
책 소개
목차
01 언어 빅데이터 코퍼스
02 음성처리
03 정보검색
04 자동번역
05 문서자동요약
06 사전, 온톨로지
07 자동대화시스템
08 컴퓨터를 활용한 언어학습
09 기계학습과 언어습득
10 추론 시스템
저자소개
책속에서
현재 인공지능, 빅데이터 등 최첨단 정보처리 기술과 맞물려 언어를 이해하는 기술은 크게 인간?기계 인터페이스와 연관된 부문, 언어 데이터 및 여러 정보를 처리하는 부문, 인간의 교육과 연관된 부문, 인간의 지적 능력을 해결하는 부문 등으로 나뉜다. 인간-기계 인터페이스와 연관돼 인간 언어의 물리적 소리를 이해하고 인간과 대화하는 기술들인 음성처리, 자동대화시스템이 주요하게 작동한다. 언어 데이터 처리 능력은 언어 빅데이터인 코퍼스, 정보검색, 자동번역, 문서자동요약, 사전·온톨로지 등에서 활용된다. 인간의 지적 능력과 연관된 부문은 기계학습, 컴퓨터를 활용한 언어학습, 추론시스템이다. 이 모든 언어지능의 가장 기본은 언어 빅데이터인 코퍼스, 사전·온톨로지다.
“지능의 출발” 중에서
언어지능의 첫 번째 단계는 데이터인 코퍼스를 수집하는 것이다. 데이터에서 발견되는 ‘확률’은 언어에 대한 지식으로 언어지능의 시작이다. 구어·문어, 논문·소설·신문기사와 같이 여러 다양한 방식으로 데이터를 모을 수 있지만, 시어는 축약이나 함축성으로 인해 적합하지 않다. 여러 다양한 유형으로 균형 잡힌 데이터 수집이 데이터를 모으면서 가장 중요한 원칙이 된다. 모인 데이터에 언어 정보를 포함시키는 가공도 가능하다. ‘빈도’라는 언어지식은 언어지능의 시작이 된다.
“언어 빅데이터 코퍼스” 중에서



















