책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 인공지능
· ISBN : 9791143010032
· 쪽수 : 112쪽
· 출판일 : 2025-09-30
책 소개
목차
AI와 데이터는 바늘과 실
01 AI와 데이터
02 데이터 중심 AI
03 AI 학습용 데이터
04 AI 학습 데이터 품질 관리
05 생성형 AI 데이터 품질 관리
06 생성형 AI 데이터 보안
07 AI와 합성 데이터
08 AI 데이터 센터
09 AI 국가 전략과 데이터
10 「AI 기본법」과 데이터
저자소개
책속에서
2016년 이세돌 9단과 바둑 대결에서 4승 1패로 완승한 알파고가 머신 러닝을 통해 16만 개에 달하는 기보를 공부했다는 사실에 사람들은 인공지능의 학습 능력에 놀랐고, 인공지능의 성능을 좌우하는 양질의 데이터(기보)의 중요성에 주목했다. 인공지능이 특정 분야에서 능력을 발휘하려면 해당 분야에 대한 지식을 학습하는 것이 필요하며, 얼마나 많은 양의 지식을 학습했는지가 인공지능의 성능을 좌우하는 중요한 요소가 되었다. 아이가 태어나면 시각과 청각, 촉각을 이용해 사물을 인식하고, 책 등을 통해 학습하며 지적 능력을 키워 가듯 인공지능 역시 다양한 방식으로 수집된 데이터와 정보를 이용해 성능을 향상하기 때문이다.
-01_“AI와 데이터” 중에서
공공 기관이 보유·관리하는 데이터에 대한 국민의 이용권을 보장하고, 공공 데이터의 민간 활용을 촉진하기 위한 목적으로 제정된 ?공공 데이터의 제공 및 이용 활성화에 관한 법률?에서는 공공 데이터를 “공공 기관이 관리하고 있는 행정 정보와 공공 기관이 생성한 정보, 전자 기록물 등”으로 정의하고 있다(제2조 정의). 여기서 공공 기관은 국가 기관, 지방 자치 단체를 비롯해 ?공공 기관의 운영에 관한 법률?에 따른 공공 기관, ?지방공기업법?에 따른 지방 공사 및 지방 공단, ?특별법?에 따라 설립된 특수 법인, ?초·중등교육법?, ?고등교육법? 및 그 밖의 다른 법률에 따라 설치된 각급 학교까지 모두 포함하고 있어 민간 영역을 제외한 전 분야라고 할 수 있다.
-03_“AI 학습용 데이터 ” 중에서
챗GPT 같은 생성형 AI 기술은 이미지, 비디오, 오디오, 텍스트 등 다양한 유형의 대규모 데이터를 학습하는 과정이 필수기 때문에 우수한 성능을 기대할 수 있지만 보안 측면에서 다양한 위험이 존재한다. 생성형 인공지능 기술 중 하나인 대규모 언어 모델(LLM)은 통상 수백억 개 이상의 파라미터를 포함하고, 학습에 사용되는 토큰 수도 수조 개에 달하기 때문에 질문의 의미를 파악하고 추론해 대답을 작성하기 위한 데이터 처리 과정이 매우 복잡하기 때문이다.
-06_“생성형 AI 데이터 보안” 중에서