책 이미지

책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 인공지능
· ISBN : 9791143005236
· 쪽수 : 125쪽
· 출판일 : 2025-07-11
책 소개
저자소개
책속에서
거대 언어 모델(large language model, LLM)인 파운데이션 모델(Foundation Model)은 대규모 데이터 세트를 기반으로 사전 학습된 AI 모델을 말한다. 최근 딥러닝 기술이 발전하면서 많은 데이터를 사용하여 사전 학습된 모델이 만들어졌는데, 이를 파운데이션 모델이라고 부른다. 파운데이션 모델은 다양한 분야에서 활용되며, 자연어 처리, 이미지 인식, 음성 인식 등 다양한 분야에서 뛰어난 성능을 보인다. 예를 들어, GPT-3는 자연어 생성 분야에서 세계적인 수준의 성능을 보이는 파운데이션 모델 중 하나다. 기본적으로 대규모의 데이터 세트를 사용하여 학습되기 때문에 다양한 데이터 분포와 패턴을 학습할 수 있다. 이를 통해 새로운 과업에 대해서도 일반화된 성능을 보이며, 파인 튜닝(fine-tuning) 과정을 통해 적은 데이터 세트로도 높은 성능을 보이는 경우가 많다. 최근에는 공개된 코드나 모델을 활용하여 간단하게 사용할 수 있어서 다양한 분야에서 활용될 수 있다.
-01_“생성형 AI” 중에서
기계 학습은 AI가 스스로 데이터를 분석하고 학습하는 방식이다. 학습에 사용되는 데이터는 AI가 자율적으로 선별할 수도 있고, 개발자 또는 서비스 제공자에 의해 지정될 수도 있다. 학습에 이용되는 데이터가 저작물일 경우 이는 곧 저작물을 이용하는 행위에 해당하게 된다. 이 과정에서 다양한 데이터가 시스템 메모리 등에 저장되며, 일시적 복제를 포함한 복제 행위가 발생한다. 일반적으로 일시적 복제는 일정 요건하에 면책이 가능하나, 원칙적으로는 복제권 침해 여부의 쟁점이 될 수 있다.
-03_“기계 학습” 중에서
저작물의 정의에 대해 대법원과 학설도 일관되게 ‘인간의’ 노력으로 한정하기 때문에 인간이 아닌 AI가 만들어 낸 결과물은 저작물성이 부인된다. 다만 ‘인간의’라는 의미를 인간이 직접적으로 제작한 것만이 아닌 인간과 직간접적으로 관련된 것으로 해석할 수 있다면, AI가 만들어 낸 결과물도 인간에 의해 창작되거나 제작된 AI에 의한 것이어서 인간의 사상과 감정이 표현됐다고 보지 못할 이유는 없다. 따라서 ‘인간의’에 대한 해석 여부에 따라 AI 생성물도 저작물성을 인정할 여지가 있다. 인간이 코딩한 소프트웨어이고 데이터 기반의 기계 학습도 인간에 의하여 이루어진 점 등 기술적으로 인간이 관여하여 만들어 낸 것이다. 또한 학습 데이터도 인간의 사상과 감정이 담긴 정보라는 점에서 인간의 사상과 감정의 표현이 아니라고 보기 어렵기 때문이다.
-06_“생성형 AI 창작과 저작자” 중에서