파이썬 AI 애플리케이션 개발

책 이미지

eBook 미리보기

책 정보

· 제목 : 파이썬 AI 애플리케이션 개발 (LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스)
· 분류 : 국내도서 > 컴퓨터/모바일 > 인공지능
· ISBN : 9791194409502
· 쪽수 : 396쪽
· 출판일 : 2025-12-26

책 소개

LLM API 연동 이후 실제 서비스에서 벌어지는 문제를 구조적으로 짚는다. MongoDB에서 AI와 벡터 검색을 직접 만들고 운영한 전문가 9명이 검증된 실전 노하우를 전하며, API 사용을 넘어 AI 애플리케이션을 구축하는 방법을 제시한다.

1장. GenAI 시작하기
기술적 요구 사항
용어 정의
GenAI 스택
____파이썬과 GenAI
____OpenAI API
____벡터 검색을 사용한 MongoDB
GenAI의 중요 기능
____왜 GenAI를 사용하는가?
____GenAI의 윤리와 위험
요약

2장. 지능형 애플리케이션의 블록 구축
기술적 요구 사항
지능형 애플리케이션 정의
____지능형 애플리케이션 블록 구축
LLM - 지능형 애플리케이션의 추론 엔진
____LLM 추론 엔진의 사용 사례
____LLM의 다양한 기능
____멀티모달 언어 모델
____AI 개발의 패러다임 이동
임베딩 모델과 벡터 데이터베이스 - RAG를 위한 외부 지식 저장소
____임베딩 모델
____벡터 데이터베이스
____모델 호스팅
사용자 지능형 애플리케이션
____샘플 애플리케이션 - RAG 챗봇
____소프트웨어 엔지니어링의 지능형 애플리케이션 관련 시사점
요약

1부. AI의 기초: LLM, 임베딩 모델, 벡터 데이터베이스, 애플리케이션 설계

3장. 대규모 언어 모델
기술적 요구 사항
확률적 프레임워크
____n-그램 언어 모델
언어 모델링의 머신러닝
____인공 신경망
____인공 신경망 훈련
자연어 처리의 ANN
____토큰화
____임베딩
____확률 분포 예측
순차적 데이터 처리
____순환 신경망
____트랜스포머 아키텍처
LLM의 모범 사례
____LLM의 진화 분야
____프롬프트, 미세 조정 및 RAG
요약

4장. 임베딩 모델
기술적 요구 사항
임베딩 모델이란?
____임베딩 모델은 LLM과 어떻게 다를까?
____임베딩 모델과 LLM을 사용해야 하는 경우
____임베딩 모델의 종류
임베딩 모델 선택하기
____작업 요구 사항
____데이터 세트 특성
____계산 리소스
____벡터 표현
____임베딩 모델 리더보드
____임베딩 모델 개요
____항상 임베딩 모델이 필요한가?
____LangChain에서 코드 실행
모범 사례
요약

5장. 벡터 데이터베이스
기술적 요구 사항
벡터 임베딩이란?
____벡터 유사도
____정확한 검색과 대략적인 검색 방법
____검색 측정
그래프 연결성
____작은 세계 탐색
____탐색이 가능한 작은 세계를 검색하는 방법
____계층적 탐색이 가능한 작은 세계
벡터 데이터베이스의 필요성
____벡터 검색이 AI 모델을 개선하는 방법
사례 연구 및 실제 적용 사례
____Okta - 자연어 액세스 요청(시맨틱 검색)
____One AI - 언어 기반 AI(비즈니스 데이터를 사용한 RAG)
____Novo Nordisk - 자동 임상 연구 생성(고급 RAG/RPA)
벡터 검색 모범 사례
____데이터 모델링
____적용
요약

6장. AI/ML 애플리케이션 설계
기술적 요구 사항
데이터 모델링
____임베딩을 사용한 데이터 보강
____검색 사용 예 고려하기
데이터 스토리지
____데이터베이스 클러스터의 유형 판별
____IOPS 결정
____RAM 결정
____최종 클러스터 구성
____성능과 가용성 대 비용
데이터 흐름
____정적 데이터 원본 처리
____벡터 임베딩으로 보강한 운영 데이터 저장하기
신규성과 유지
____실시간 업데이트
____데이터 수명주기
____새로운 임베딩 모델 채택
보안 및 RBAC
AI/ML 애플리케이션 설계를 위한 모범 사례
요약

2부. 사용자 파이썬 애플리케이션 만들기: 프레임워크, 라이브러리, API, 벡터 검색 엔진

7장. 유용한 프레임워크, 라이브러리, API
기술적 요구 사항
AI/ML 파이썬
AI/ML 프레임워크
____LangChain
____유사도 점수를 사용한 LangChain 시맨틱 검색
____사전 필터링을 사용한 시맨틱 검색
____LangChain으로 기본 RAG 솔루션 구현하기
____LangChain 프롬프트 템플릿과 체인
주요 파이썬 라이브러리
____pandas
____PyMongoArrow
____PyTorch
AI/ML API
____OpenAI API
____허깅 페이스
요약

8장. AI 애플리케이션에서 벡터 검색 구현하기
기술적 요구 사항
MongoDB 아틀라스 벡터 검색을 사용한 정보 검색
____파이썬의 벡터 검색 튜토리얼
____LangChain을 사용한 벡터 검색 튜토리얼
RAG 아키텍처 시스템 구축
____청크와 문서 분할 전략
____간단한 RAG
____고급 RAG
요약

3부. AI 애플리케이션의 최적화: 확장, 미세 조정, 문제 해결, 모니터링 및 분석

9장. LLM 출력 평가
기술적 요구 사항
LLM 평가란?
____LLM 구성 요소와 엔드 투 엔드 평가
모델 벤치마킹
____평가 데이터 세트
____기준선 정의
____사용자 피드백
____합성 데이터
평가 메트릭
____어설션 기반 메트릭
____통계 메트릭
____LLM 기반 평가
____RAG 메트릭
____인적 검토
____가드레일로서의 평가
요약

10장. 시맨틱 데이터 모델을 개선해 정확도 향상하기
기술적 요구 사항
임베딩
____다양한 임베딩 모델로 실험하기
____임베딩 모델 미세 조정
임베딩 메타데이터
____메타데이터 형식 지정
____정적 메타데이터 포함
____프로그래밍 방식의 메타데이터 추출
____LLM으로 메타데이터 생성
____쿼리 임베딩 및 수집 콘텐츠 임베딩에서 메타데이터 포함하기
검색 증강 생성 최적화
____쿼리 변형
____사전 필터링을 위한 쿼리 메타데이터 추출
____수집된 데이터 형식 지정
____고급 검색 시스템
요약

11장. GenAI의 일반적인 실패
기술적 요구 사항
환각
____환각의 원인
____환각의 의미
아첨
____아첨의 원인
____아첨의 의미
데이터 유출
____데이터 유출의 원인
____데이터 유출의 의미
비용
____비용 유형
____토큰
GenAI 애플리케이션의 성능 문제
____계산 부하
____모델 제공 전략
____높은 I/O 작업
요약

12장. GenAI 애플리케이션 수정 및 최적화
기술적 요구 사항
기준선
____훈련과 평가 데이터 세트
____퓨샷 프롬프팅
____검색과 순위 재지정
____늦은 상호작용 전략
____쿼리 재작성
테스트와 레드 팀 구성
____테스트
____레드 팀 구성
정보 후처리
다른 해결 방법
요약

저자소개

헨리 웰러 (지은이) 정보 더보기

아틀라스 벡터 검색(Atlas Vector Search)의 전담 제품 관리자로, 쿼리 기능과 서비스의 확장성을 담당하고 사용자를 위한 모범 사례를 개발하는 데 주력하고 있다. 아틀라스 벡터 검색을 2023년에 공개 평가판에서 일반 제품으로 전환해 출시하는 데 기여했고, 서비스의 핵심 기능 제공을 계속 주도하고 있다. 2022년 MongoDB에 합류했으며, 이전에는 데이터 엔지니어이자 백엔드 로보틱스 소프트웨어 엔지니어였다.

펼치기

벤 펄머터 (지은이) 정보 더보기

MongoDB 교육 AI 팀의 책임 엔지니어이며 LLM, 임베딩 모델, 벡터 데이터베이스 등의 AI 기술을 사용해 MongoDB 교육 경험을 개선했다. 그의 팀은 MongoDB AI 챗봇을 구축해 검색 증강 생성을 사용함으로써 매주 수천 명의 사용자가 MongoDB를 배울 수 있도록 지원한다. 이전에는 기술 중심 문서를 작성하는 데 특화된 테크니컬 라이터로 일했다.

펼치기

아쉬윈 강가다 (지은이) 정보 더보기

전자상거래, HR 분석, 재무에 관한 데이터 기반 솔루션 분야에서 10년 이상의 경험을 쌓아온 MongoDB의 책임 솔루션 아키텍트다. 제어와 신호 처리 석사 학위를 보유하고 있으며 검색 관련성, 컴퓨터 비전, NLP를 전문으로 한다. 또한 학습에 대한 지속적인 열정을 바탕으로 새로운 기술과 혁신 솔루션을 탐구하고 있다. 인도 벵갈루루에서 태어나고 자랐으며 여행, 요리를 통한 문화 탐구, 기타 연주를 즐긴다.

펼치기

라셸 파머 (지은이) 정보 더보기

MongoDB의 개발자 데이터베이스 경험(Developer Database Experience)과 개발자 교육(Developer Education) 부문의 제품 리더이며 드라이버 클라이언트 라이브러리, 문서, 프레임워크 통합, MongoDB 대학(MongoDB University)을 감독한다. 자바, PHP, Rust, 파이썬, Node.js, 루비(Ruby)로 MongoDB용 샘플 애플리케이션을 구축했다. 2013년 MongoDB에 합류했으며, 이전에는 기술 서비스 엔지니어링 팀의 이사로서 MongoDB 아틀라스(MongoDB Atlas)에 각종 지원과 클라우드 운영(CloudOps)을 제공하는 팀을 구성하고 관리했다.

펼치기

니콜라스 라루 (지은이) 정보 더보기

MongoDB의 교육 AI 팀에 몸담고 있는 책임 엔지니어다. MongoDB의 AI 챗봇과 챗봇 기 능을 강화하는 오픈소스 프레임워크를 개발하고 있으며 MongoDB의 콘텐츠 생성과 데이 터 세트 큐레이션 작업을 담당한다. AI와 관련해 일하기 전에는 문서를 작성하고 유지 관리 하는 일을 했으며, MongoDB 제품 개발자의 샘플 애플리케이션을 유지 보수했다.

펼치기

시그프리도 나르바에스 (지은이) 정보 더보기

MongoDB의 수석 솔루션 아키텍트로서 AI 프로젝트, 데이터베이스 마이그레이션, 애플리 케이션 현대화를 담당했다. 그의 고객은 엔터테인먼트, 게임, 금융 ㅋ등의 분야에서 미국과 라틴 아메리카 전역에 걸쳐 있다. 2015년 'MongoDB 마스터'로 선정된 바 있으며 GDC, QCon, re:Invent 콘퍼런스에서 MongoDB 아틀라스와 선도적인 AI 기술을 사용해 파이 썬과 다른 언어로 구축한 샘플 앱을 공유했다.

펼치기

토마스 뤼크슈티스 (지은이) 정보 더보기

MongoDB의 책임 과학자이자 머신러닝 연구 그룹 책임자다. 신경망과 강화 학습, 트랜스 포머, 정형 데이터 모델링(structured data modeling)을 전문으로 하는 머신러닝 박사 학위를 갖고 있다. 2012년 MongoDB에 입사했으며, 이전에는 MongoDB 컴파스(MongoDB Compass)와 아틀라스 차트(Atlas Charts)의 수석 엔지니어였다.

펼치기

리치먼드 알라케 (지은이) 정보 더보기

MongoDB의 AI/ML 개발자 애드버케이트(Developer Advocate)로, AI 애플리케이션 구축 개발자를 위한 기술 학습 콘텐츠를 제작했다. 머신러닝 아키텍처, 데이터 파이프라인 최적화, 딥러닝을 통한 모바일 경험 개발 등을 아우르는 기술적 배경 및 경험을 갖고 있다. GenAI와 컴퓨터 비전을 전문으로 하며, AI 도메인 전반에 걸친 실용적인 애플리케이션과 효율적인 구현에 중점을 둔다. 또한 개발자에게 AI 솔루션 모범 사례도 가이드하고 있다.

펼치기

슈밤 란잔 (지은이) 정보 더보기

MongoDB 파이썬 버전의 제품 관리자이자 MongoDB의 AI 이니셔티브에 기여하는 핵심 멤버다. 파이썬 개발자이며, 데이터 과학과 머신러닝에서 경쟁 프로그래밍에 이르기까지 다양한 주제를 다루는 700개 이상의 기술 문서를 게시했다. 2019년 MongoDB에 합류한 이후 소프트웨어 엔지니어를 거쳐 여러 제품의 제품 관리자로 승진하면서 여러 역할을 수행했다.

펼치기

테크 트랜스 그룹 T4 (옮긴이) 정보 더보기

최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경 에서 오픈소스를 활용한 프레임워크 구축에 관심이 많으며 알고리듬, 양자 컴퓨팅, OpenCV, 머신러닝 등의 기술에 주목하고 있다. 또한 다양한 오픈소스 기반 플랫폼의 개발 및 활용에 많은 관심을 갖고 있다. 역서로는 『그래프 알고리즘』(에이콘, 2021), 『OpenCV 4 마스터 3/e』(에이콘, 2020), 『양자 컴퓨팅 발전과 전망』(에이콘, 2020) 등이 있다.

펼치기