책 이미지

책 정보
· 분류 : 국내도서 > 대학교재/전문서적 > 공학계열 > 컴퓨터공학 > 컴퓨터공학/전산학 개론
· ISBN : 9791198786616
· 쪽수 : 448쪽
· 출판일 : 2024-10-10
책 소개
목차
1장. ChatGPT에 대해 알아보기
1.1 ChatGPT의 탄생 2
1.1.1 ChatGPT란? 2
1.1.2 ChatGPT의 역사 3
1.2 ChatGPT 작업 흐름 4
1.3 ChatGPT 사용 사례 5
1.3.1 일상 작업 5
1.3.2 코드 작성 8
1.3.3 텍스트 생성 11
1.3.4 사무 자동화 16
1.4 요약 18
2장. ChatGPT 동작원리 19
2.1 배경 지식 20
2.1.1 자연어 처리의 발전 과정 20
2.1.2 대규모 언어 모델의 발전 과정 24
2.2 ChatGPT 유사 제품 30
2.2.1 BlenderBot 3.0 30
2.2.2 LaMDA 33
2.2.3 Sparrow 36
2.3 ChatGPT 40
2.3.1 사전 학습 및 프롬프트 학습 단계 42
2.3.2 결과 평가 및 보상 모델링 단계 45
2.3.3 강화학습과 자율기 46
2.4 알고리즘 세부사항 47
2.4.1 데이터 레이블링 48
2.4.2 모델링 접근 방법 48
2.4.3 미해결 문제 49
2.5 ChatGPT에 대한 고찰 50
2.6 장 요약 52
3장. 사전 학습 언어모델 53
3.1 트랜스포머 구조 54
3.2 인코더 기반 모델 57
3.2.1 BERT 58
3.2.2 RoBERTa 61
3.2.3 ERNIE 62
3.2.4 SpanBERT 66
3.2.5 MacBERT 68
3.2.6 ALBERT 69
3.2.7 NeZha 70
3.2.8 UniLM 71
3.2.9 GLM 73
3.2.10 ELECTRA 75
3.3 디코더 기반 모델 77
3.3.1 GPT 77
3.3.2 PaLM 78
3.3.3 OPT 79
3.3.4 Bloom 81
3.3.5 LLaMA 81
3.4 인코더 디코더 구조 모델 83
3.4.1 MASS 84
3.4.2 BART 85
3.4.3 T5 86
3.5 대화 데이터를 활용한 UniLM 모델 실습 88
3.5.1 프로젝트 소개 88
3.5.2 데이터 전처리 모듈 89
3.5.3 UniLM 모델 모듈 95
3.5.4 모델 학습 모듈 98
3.5.5 모델 추론 모듈 108
3.6 요약 113
4장. 기초 강화 학습 115
4.1 머신 러닝의 분류 116
4.1.1 지도 학습 116
4.1.2 비지도 학습 117
4.1.3 강화 학습 117
4.2 OpenAI Gym 123
4.2.1 OpenAI Gym API 소개 124
4.2.2 환경 프로필 125
4.3 강화 학습 알고리즘 128
4.3.1 Q-러닝 알고리즘 128
4.3.2 SARSA 알고리즘 131
4.3.3 DQN 알고리즘 134
4.3.4 정책 그레이디언트 알고리즘 138
4.3.5 액터-크리틱 알고리즘 142
4.4 챕터 요약 145
5장. 프롬프트 학습과 대규모 언어 모델의 등장 147
5.1 프롬프트 학습 148
5.1.1 프롬프트 학습이란? 148
5.1.2 프롬프트 템플릿 디자인 149
5.1.3 답변 공간 매핑 디자인 152
5.1.4 학습 방법에 대한 추가 팁 154
5.2 문맥 학습 155
5.2.1 문맥 학습이란? 155
5.2.2 문맥 학습 능력 향상을 위한 사전 교육 단계 157
5.2.3 추론 단계로 문맥 학습 최적화 159
5.3 사고 사슬 162
5.4 실습용 단서 기반 텍스트 감정 분석 170
5.4.1 프로젝트 프로필 170
5.4.2 데이터 전처리 모듈 171
5.4.3 BERT 모델 모듈 173
5.4.4 모델 트레이닝 모듈 177
5.4.5 모델 추론 모듈 190
5.5 챕터 요약 194
6장. 대규모 언어 모델의 사전 학습 195
6.1 대규모 사전 학습 모델 소개 196
6.2 사전 학습된 모델의 토크나이저 196
6.2.1 BPE 197
6.2.2 워드피스 200
6.2.3 유니그램 202
6.2.4 SentencePiece 203
6.3 분산형 딥러닝 프레임워크 205
6.3.1 병렬 패러다임 소개 205
6.3.2 Megatron-LM 214
6.3.3 DeepSpeed 217
6.3.4 거대 인공지능(Colossal-AI) 220
6.3.5 FairScale 224
6.3.6 ParallelFormers 226
6.3.7 OneFlow 226
6.4 실제 대규모 언어 모델을 기반으로 한 사전 학습 228
6.4.1 프로젝트 프로필 229
6.4.2 데이터 전처리 모듈 230
6.4.3 모델 학습 수행 234
6.5 대규모 언어 모델에 기반한 실용적인 정보 추출 245
6.5.1 프로젝트 프로필 246
6.5.2 데이터 전처리 모듈 246
6.5.3 Freeze 파인 튜닝 모듈 251
6.5.4 LoRA 파인 튜닝 모듈 258
6.5.5 P-Tuning v2 파인 튜닝 모듈 265
6.6 챕터 요약 272
7장. GPT 시리즈 모델 분석 273
7.1 GPT-1 ~ GPT-4 시리즈 모델 분석 274
7.1.1 GPT-1 및 GPT-2 모델 274
7.1.2 GPT-3 모델 276
7.1.3 GPT-3의 파생 모델: Code-X 280
7.1.4 GPT-4 모델 282
7.2 InstructGPT 모델 분석 283
7.2.1 모델 소개 284
7.2.2 데이터 수집 285
7.2.3 모델링 원칙 291
7.2.4 모델링 토론 293
7.3 GPT-2 모델 기반 텍스트 요약의 실제 사례 293
7.3.1 프로젝트 프로필 293
7.3.2 데이터 전처리 모듈 294
7.3.3 GPT-2 모델 모듈 297
7.3.4 모델 학습 모듈 299
7.3.5 모델 추론 모듈 310
7.4 챕터 요약 318
8장. PPO 알고리즘과 RLHF 이론의 실제 적용 사례 319
8.1 PPO 알고리즘 소개 320
8.1.1 그레이디언트 정책 알고리즘 검토 320
8.1.2 PPO 알고리즘의 구조 322
8.1.3 PPO 알고리즘의 비교 및 평가 326
8.2 RLHF 프레임워크 소개 328
8.2.1 RLHF 내부 프로파일링 329
8.2.2 RLHF 가치 분석 331
8.2.3 RLHF 문제 분석 333
8.3 PPO 기반 긍정적 텍스트 생성 프로젝트 실행 334
8.3.1 프로젝트 개요 및 데이터 세트 분석 334
8.3.2 데이터 전처리 모듈 335
8.3.3 모델 훈련 모듈 338
8.3.4 모델 생성 모듈 341
8.3.5 모델 평가 모듈 342
8.4 질문과 성찰 344
8.5 챕터 요약 346
9장. 클래스 ChatGPT를 활용한 실전 예제 347
9.1 작업 설계 348
9.2 데이터 준비 349
9.3 문제 과제 생성을 위한 문서 기반 수업 ChatGPT 실습 350
9.3.1 SFT 단계 350
9.3.2 RM 단계 362
9.3.3 RL 단계 376
9.4 챕터 요약 393
10장. ChatGPT 트렌드 395
10.1 AI 제작 컨텐츠 동향 396
10.1.1 AI 클라우드 엣지 협업 396
10.1.2 AI 도구 애플리케이션 398
10.1.3 AI 생성 제어 399
10.1.3 AI 의사 결정 지원 401
10.2 ChatGPT 2C 애플리케이션 시나리오 403
10.2.1 개인 비서 403
10.2.2 지식 멘토 405
10.2.3 아이디어 마켓 408
10.2.4 감성적 도우미 412
10.3 ChatGPT 2 B 애플리케이션 시나리오 415
10.3.1 지능형 고객 서비스 415
10.3.2 오피스 도우미 417
10.3.3 소프트웨어 개발 420
10.3.4 의사 결정 지원 422
10.4 업계 참조 권장 사항 425
10.5 챕터 요약 426
찾아보기 427