책 이미지

책 정보
· 분류 : 국내도서 > 경제경영 > 트렌드/미래전망 > 인공지능/빅데이터
· ISBN : 9791193228029
· 쪽수 : 279쪽
· 출판일 : 2024-11-15
책 소개
목차
한국어판 출간에 부쳐
시작하며
1장 >> 일상생활 깊숙이 스며든 데이터 사이언스
데이터 사이언티스트란 | 첨단 정보기술 인재 | 디지털 마케팅 | 배송 경로 최적화 | 다이내믹 프라이싱 | AI 발주 시스템 | 스포츠 데이터 사이언스 | 피플 애널리틱스
Column — 진화하는 데이터 활용
2장 >> 자주 쓰이는 머신러닝 알고리즘과 통계 개념들
데이터 사이언스 핵심 개념 지도 | 모집단과 표본 | 평균값과 중앙값 | 분산 | 중심극한정리 | 신뢰구간 | 가설 검정 | 상관계수 | 베이즈 통계 | 몬티 홀 문제 | 인과 추론 | AI | 머신러닝 | 딥러닝 | 알고리즘 | 회귀분석 | 다중 공선성 | 회귀분석의 P값 | 로지스틱 회귀 | 결정 트리 | LightGBM | 클러스터링 | k-평균법 | 주성분 분석 | 베이즈 네트워크 | 시계열 분석 | 프로펫 | 자연어 처리 | GPT-3 | 과학습 | 교차 검증 | 자동 머신러닝 | 블랙박스 문제 | 로우코드, 노코드
Column ― 넓어지는 업무 범위
3장 >> 궁금한 그 현상을 어떻게 데이터로 바꿀 것인가
분석 모형 구축 | 수리 최적화 | 프로그래밍 | 클라우드 활용 | 구매 데이터 분석 | 인과관계 분석 | 텍스트 마이닝 | 의도 파악 | 이미지 인식 | 음성 인식
Column ― 데이터 사이언티스트의 미래
4장 >> 현실에서 당장 부딪힌 예상 밖 낯선 상황들
데이터 분석은 전처리가 8할 | 지난 2년 데이터로 향후 10년을 예측 | 머신러닝이라 간단히 처리할 수 있다? | 제한적인 분석 환경과의 싸움 | 경영자 기대는 정밀도 99% | 분석 자체가 목적이 된다 | 담당자 직감과 어긋난다고? | 비용 대비 효과가 떨어진다? | 본보기가 될 만한 선배가 없다? | 데이터 분석만 할 뿐이다?
Column ― 수식의 아름다움
5장 >>어쩌다 보니 데이터 사이언티스트가 된 사람들
데이터 사이언티스트의 경력 이야기 | 짧은 이야기① 심리학에서 컨설팅으로 | 짧은 이야기② 원치 않던 부서 경험을 살려 | 짧은 이야기③ 수비와 공격의 텍스트 마이닝 | 짧은 이야기④ 모험적 성향이 천직으로 이어져 | 짧은 이야기⑤ 생체 반응 연구와 미래를 읽는 힘 | 짧은 이야기⑥ 취직 후 대학원에서 다시 공부 | 짧은 이야기⑦ 차고 넘치는 데이터를 활용해
Column ― 의외로 많은 문과 출신
6장 >>데이터 해석 능력을 키우기 위해 갖추어야 할 자질들
현장 비즈니스를 이해하는 힘 | 전문적인 내용을 알기 쉽게 전달하는 힘 | 최적의 답을 구체적으로 제안하는 힘 | 불확실한 시대를 시뮬레이션하는 힘 | 데이터로 할 수 있는 일을 상상하는 힘 | 따두면 어디든 써먹을 수 있는 자격증
Column ― AI 시대 새로운 직업을 찾아서
마치며
찾아보기
리뷰
책속에서
스포츠 데이터 사이언스는 선수 개개인의 역량을 극대화할 뿐 아니라 코칭과 육성, 부상 방지와 치료 등에도 유용하다. 그 배경에는 수집할 수 있는 데이터의 종류와 양이 기하급수적으로 늘어나고 있다는 사실이 존재한다. 이를테면 야구에서 투수의 투구 관련 데이터를 보면 예전에는 구속과 구종, 스트라이크존 정도가 데이터로 축적되었다면 지금은 공의 회전수와 회전축, 변화량, 3D로 재현하는 투구 궤도 등에 관한 정보도 얻을 수 있다. 이러한 데이터 수집에는 군사 기술을 응용한 트래킹 시스템이 활용된다. 인간의 감각에 가까운 부분이 데이터로 축적되어 선수 개개인의 연습이나 지도에 사용되는 것이다. 최근에는 신체에 센서를 부착해 특정 부위의 운동 속도와 부하, 가동 영역 등에 관한 수치도 데이터로 수집된다.
전체 국민의 소득이 늘어나고 있는지 논의할 때 자주 거론되는 개념이 소득의 평균값과 중앙값이다. 후생노동성의 국민생활기초조사에 따르면 최근 10년간 일본 가구당 평균 소득은 거의 변화가 없으며 제자리걸음을 계속하고 있다. 주요국과 비교해 일본의 가구당 평균 소득은 성장이 정체되어 큰 문제가 되고 있다. 이 데이터는 어디까지나 ‘평균값’의 추이를 살펴본 것이다. 소득 구간별 분포를 살펴보면 평균값은 약 552만 엔인 데 비해 중앙값은 437만 엔이다. 중앙값은 데이터를 크기순으로 나열할 때 중앙에 오는 값을 의미하는데, 소득의 경우 평균값과 큰 차이가 난다는 사실을 알 수 있다.