머신러닝 엔지니어링 with 파이썬

책 이미지

eBook 미리보기

책 정보

· 제목 : 머신러닝 엔지니어링 with 파이썬 (AWS 클라우드에서 구현하는 MLOps 기반 머신러닝 모델 라이프사이클 관리)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 소프트웨어 공학
· ISBN : 9791158396046
· 쪽수 : 392쪽
· 출판일 : 2025-04-24

책 소개

ML옵스(MLOps) 엔지니어와 머신러닝(ML) 엔지니어가 실제 문제에 대한 해결책을 구축하는 것을 돕는 실용적인 안내서다. 빠르게 발전하는 이 분야에서 앞서 나가는 데 필요한 기술을 제공한다.

▣ 01장: 머신러닝 엔지니어링 소개
1.1 기술 요구 사항
1.2 데이터 관련 직무 분류
__1.2.1 데이터 과학자
__1.2.2 ML 엔지니어
__1.2.3 ML옵스 엔지니어
__1.2.4 데이터 엔지니어
1.3 효과적인 팀으로 일하기
1.4 실제 환경에서의 머신러닝 엔지니어링
1.5 머신러닝 솔루션은 어떤 모습인가?
__1.5.1 왜 파이썬인가?
1.6 고수준 머신러닝 시스템 설계
__1.6.1 예제 1: 배치 이상 탐지 서비스
__1.6.2 예제 2: 예측 API
__1.6.3 예제 3: 분류 파이프라인
1.7 요약

▣ 02장: 머신러닝 개발 프로세스
2.1 기술 요구 사항
2.2 도구 설정
__2.2.1 AWS 계정 설정
2.3 개념에서 솔루션까지의 4단계
__2.3.1 CRISP-DM과 비교
__2.3.2 발견
__2.3.3 플레이
__2.3.4 개발
__2.3.5 배포
2.4 요약

▣ 03장: 모델에서 모델 팩토리까지
3.1 기술적 요구사항
3.2 모델 팩토리 정의하기
3.3 학습이란 무엇인가
__3.3.1 목표 정의하기
__3.3.2 손실 최소화하기
__3.3.3 데이터 준비하기
3.4 머신러닝을 위한 특징 공학
__3.4.1 범주형 특징 처리하기
__3.4.2 수치형 특징 처리하기
3.5 훈련 시스템 설계하기
__3.5.1 훈련 시스템 설계 옵션
__3.5.2 훈련-실행
__3.5.3 훈련-보관
3.6 드리프트와 재훈련
__3.6.1 데이터 드리프트 감지
__3.6.2 개념 드리프트 탐지하기
__3.6.3 한계 설정하기
__3.6.4 드리프트를 진단하기
__3.6.5 드리프트 대응 방안
__3.6.6 모니터링을 위한 다른 도구
__3.6.7 훈련 자동화하기
__3.6.8 자동화의 계층
__3.6.9 하이퍼파라미터 최적화
3.6.10 오토ML
3.7 모델 영속화하기
3.8 파이프라인으로 모델 팩토리 구축하기
__3.8.1 사이킷런 파이프라인
__3.8.2 스파크 ML 파이프라인
3.9 요약

▣ 04장: 패키징
4.1 기술적 요구사항
4.2 좋은 파이썬 코드 작성하기
__4.2.1 파이썬 기초 다지기
__4.2.2 유용한 기법
__4.2.3 파이썬 코딩 관례
__4.2.4 PySpark 코딩 스타일
4.3 코딩 스타일 선택하기
__4.3.1 객체 지향 프로그래밍
__4.3.2 함수형 프로그래밍
4.4 코드 패키징하기
__4.4.1 패키지를 만드는 이유
__4.4.2 어떤 코드를 패키지로 만들까?
__4.4.3 패키지 설계하기
4.5 패키지 빌드하기
__4.5.1 Makefile로 환경 관리하기
__4.5.2 Poetry로 시작하기
4.6 테스팅, 로깅, 보안 및 오류 처리
__4.6.1 테스팅
__4.6.2 솔루션 보안
__4.6.3 코드의 보안 문제 분석하기
__4.6.4 의존성 패키지의 보안 점검
__4.6.5 로깅
__4.6.6 오류 처리
4.7 바퀴를 재발명하지 않기
4.8 요약

▣ 05장: 배포 패턴과 도구
5.1 기술적 요구사항
5.2 시스템 설계
__5.2.1 시스템 설계 원칙
5.3 대표적인 머신러닝 패턴
__5.3.1 데이터 레이크
__5.3.2 마이크로서비스
__5.3.3 이벤트 기반 설계
__5.3.4 일괄 처리
5.4 컨테이너화
5.5 AWS에서 자체 마이크로서비스 호스팅
__5.5.1 ECR로 푸시하기
__5.5.2 ECS에 배포하기
5.6 Airflow를 활용한 일반 파이프라인 구축
__5.6.1 Airflow
__5.6.2 MWAA
__5.6.3 Airflow를 위한 CI/CD 파이프라인 구축
5.7 고급 ML 파이프라인 구축
__5.7.1 ZenML
__5.7.2 Kubeflow
5.8 배포 전략 선택
5.9 요약

▣ 06장: 스케일링
6.1 기술적 요구사항
6.2 스파크로 확장하기
__6.2.1 스파크 팁과 트릭
__6.2.2 클라우드상의 스파크, AWS EMR
6.3 서버리스 인프라 구축
6.4 쿠버네티스로 대규모 컨테이너화하기
6.5 Ray로 확장하기
__6.5.1 ML을 위한 Ray 시작하기
__6.5.2 Ray의 컴퓨팅 확장
__6.5.3 Ray를 활용한 서빙 계층 확장
6.6 대규모 시스템 설계
6.7 요약

▣ 07장: 딥러닝, 생성형 AI, LLM옵스
7.1 딥러닝
__7.1.1 파이토치 기초
__7.1.2 딥러닝 확장과 프로덕션 적용
__7.1.3 미세 조정과 전이 학습
7.2 대규모 언어 모델
__7.2.1 LLM 기본 개념과 구조
__7.2.2 API를 통한 LLM 활용
__7.2.3 LLM으로 코딩하기
7.3 LLM 검증과 프롬프트 관리·운영
__7.3.1 LLM 검증하기
__7.3.2 프롬프트옵스(PromptOps)
7.4 요약

▣ 08장: 예제 ML 마이크로서비스 구축
8.1 기술 요구사항
8.2 예측 문제 이해
8.3 예측 서비스 설계
8.4 도구 선택
8.5 훈련 스케일링
8.6 FastAPI로 모델 서빙하기
__8.6.1 응답 및 요청 스키마
__8.6.2 마이크로서비스에서 모델 관리하기
__8.6.3 모든 구성 요소 통합하기
8.7 쿠버네티스를 활용한 컨테이너화와 배포
__8.7.1 애플리케이션 컨테이너화
__8.7.2 쿠버네티스로 확장하기
__8.7.3 배포 전략
8.8 요약

▣ 09장: ETML(추출, 변환, 머신러닝) 사례 연구
9.1 기술 요구사항
9.2 일괄 처리 문제 이해
9.3 ETML 솔루션 설계
9.4 도구 선택하기
__9.4.1 인터페이스와 저장소
__9.4.2 모델 확장
__9.4.3 ETML 파이프라인 스케줄링
9.5 빌드 실행
__9.5.1 고급 Airflow 기능을 사용한 ETML 파이프라인 구축
9.6 요약

저자소개

앤드루 피터 맥마흔 (지은이) 정보 더보기

다양한 산업 분야에서 영향력 있는 ML 제품을 구축한 경험이 있다. 현재 영국 냇웨스트 그룹(NatWest Group)의 ML옵스(MLOps) 책임자이며 임페리얼 칼리지에서 응집물질 이론물리학 박사 학위를 받았다. 활발한 블로거, 연설가, 팟캐스트 게스트이자 ML옵스 커뮤니티의 유명 인사로서, AI Right 팟캐스트의 공동 진행자이며, 2022년 British Data Awards에서 '올해의 라이징 스타'로, 2019년 Data Science Foundation에서 '올해의 데이터 과학자'로 선정됐다.

펼치기

최용 (옮긴이) 정보 더보기

한국방송통신대학교에서 컴퓨터과학을 전공하고, 응용 소프트웨어 개발자와 은행 전산실 운영자를 거쳐, 소프트웨어 컨설턴트로서 엔터프라이즈 IT 시스템 운영 자동화 솔루션 구축 및 기술 지원 업무를 수행했다. 현재는 IT 전문서의 저술·번역·교정 작업을 하며, 새로운 기술을 실무에 적용하는 방법을 탐구하고 인공지능을 활용해 지식 생산과 업무 환경을 효율화하는 데 관심을 두고 있다. 누구나 챗GPT를 활용해 자신의 이야기를 책으로 쓸 수 있게 도우려 개발한 'Book Creator Guide' GPT가 OpenAI의 추천을 받아 글쓰기 부문 상위권에 올랐으며, 대규모 언어 모델(LLM) API 활용법을 다룬 책 《OpenAI, 구글 Gemini, 업스테이지 Solar API를 활용한 실전 LLM 앱 개발》(2025, 위키북스)이 세종도서 학술부문에 선정됐다. 온라인 책 공유 플랫폼인 위키독스에 '전뇌해커'라는 필명으로 글을 게재하고 있으며, 서울사이버대학교 드론·로봇융합학과에서 마지막 학기를 보내고 있다.

펼치기

최용의 다른 책 >