logo
logo
x
바코드검색
BOOKPRICE.co.kr
책, 도서 가격비교 사이트
바코드검색

인기 검색어

실시간 검색어

검색가능 서점

도서목록 제공

강화학습 첫걸음

강화학습 첫걸음

(텐서플로로 살펴보는 Q 러닝, MDP, DQN, A3C 강화학습 알고리즘)

아서 줄리아니 (지은이), 송교석 (옮긴이)
  |  
한빛미디어
2017-12-22
  |  
18,000원

일반도서

검색중
서점 할인가 할인률 배송비 혜택/추가 실질최저가 구매하기
yes24 로딩중
교보문고 로딩중
영풍문고 로딩중
인터파크 로딩중
11st 로딩중
G마켓 로딩중
쿠팡 로딩중
쿠팡로켓 로딩중
notice_icon 검색 결과 내에 다른 책이 포함되어 있을 수 있습니다.

중고도서

검색중
로딩중

e-Book

검색중
서점 정가 할인가 마일리지 실질최저가 구매하기
aladin 14,400원 -10% 720원 12,240원 >

책 이미지

강화학습 첫걸음

책 정보

· 제목 : 강화학습 첫걸음 (텐서플로로 살펴보는 Q 러닝, MDP, DQN, A3C 강화학습 알고리즘)
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 데이터베이스 개론
· ISBN : 9791162240298
· 쪽수 : 180쪽

책 소개

알파고의 기반인 강화학습은 게임 AI나 자율주행 등 업계 활용성이 높아 인공지능의 미래로 단연 주목받고 있다. 이 책은 복잡한 이론을 두루뭉술하게 설명하는 대신, 예제 코드를 직접 돌려보며 강화학습 알고리즘을 익히게 도와준다.

목차

PART I 주요 알고리즘 및 구현

CHAPTER 1 강화학습 소개

CHAPTER 2 밴딧 문제
2.1 정책 경사
2.2 멀티암드 밴딧의 구현

CHAPTER 3 콘텍스트 밴딧
3.1 콘텍스트 밴딧 구현

CHAPTER 4 마르코프 결정 과정
4.1 기본적인 정책 경사 에이전트 구현

CHAPTER 5 Q 러닝
5.1 테이블 환경에 대한 테이블식 접근법
5.2 신경망을 통한 Q 러닝

CHAPTER 6 딥 Q 네트워크
6.1 개선 1: 합성곱 계층
6.2 개선 2: 경험 리플레이
6.3 개선 3: 별도의 타깃 네트워크
6.4 DQN을 넘어서
6.5 더블 DQN
6.6 듀얼링 DQN
6.7 모든 것을 조합하기
6.8 개선된 딥 Q 네트워크 구현

CHAPTER 7 부분관찰성과 순환 신경망
7.1 부분관찰성 문제
7.2 제한되고 변화하는 세계 이해하기
7.3 순환 신경망
7.4 텐서플로 구현을 위한 변경점
7.5 제한된 그리드 세계
7.6 DRQN 구현

CHAPTER 8 비동기적 어드밴티지 액터-크리틱
8.1 A3C의 세 가지 A
8.2 A3C 구현
8.3 <둠> 게임 플레이하기

PART II 심화 주제

CHAPTER 9 에이전트의 생각과 액션 시각화
9.1 컨트롤 센터의 인터페이스
9.2 에이전트의 머릿속 들여다보기
9.3 강화학습 컨트롤 센터 이용

CHAPTER 10 환경 모델 활용하기
10.1 모델 기반의 강화학습 구현

CHAPTER 11 탐험을 위한 액션 선택 전략
11.1 탐험은 왜 하는 것인가요?
11.2 그리디 접근법
11.3 랜덤 접근법
11.4 엡실론-그리디 접근법
11.5 볼츠만 접근법
11.6 베이지언 접근법(드롭아웃)
11.7 각 전략의 성능 비교 및 구현
11.8 고급 기법

CHAPTER 12 정책 학습을 위한 정책 학습
12.1 메타 에이전트 만들기
12.2 메타 실험
12.3 마치며

저자소개

아서 줄리아니 (지은이)    정보 더보기
딥러닝 및 인지과학 연구자. 오리건 대학교에서 심리학 석사 학위를 취득하고 현재는 인지뇌과학 박사 과정을 밟고 있다. 강화학습, 공간인지, 비주얼 콘셉트 개발, 지각 행동 교차 등에 관심이 많다. 트위터 @awjuliani
펼치기
송교석 (옮긴이)    정보 더보기
고려대학교 졸업 후 카네기 멜런 대학교에서 컴퓨터과학 석사 학위를 받았습니다. LG전자, 동양시스템즈를 거쳐 안랩에서 10년간 근무했으며, 안랩에서 분사한 노리타운스튜디오의 대표를 역임한 바 있습니다. 2017년 4월 메디픽셀(Medipixel)을 설립하여 대표를 맡고 있으며, 인공지능 기반의 폐암 진단 및 수술로봇 자동화 시스템의 연구개발을 진행하고 있습니다. 『신경망 첫걸음』(2017), 『처음 배우는 인공지능』(2017), 『강화학습 첫걸음』(2018, 이상 한빛미디어)을 우리말로 옮겼습니다.
펼치기

책속에서



추천도서

이 포스팅은 쿠팡 파트너스 활동의 일환으로,
이에 따른 일정액의 수수료를 제공받습니다.
도서 DB 제공 : 알라딘 서점(www.aladin.co.kr)
최근 본 책