책 이미지
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 컴퓨터 공학 > 컴퓨터공학/전산학 개론
· ISBN : 9788934999171
· 쪽수 : 272쪽
책 소개
목차
감사의 말
들어가는 말
1장 데이터 과학은 무엇인가?
2장 데이터와 데이터 세트란 무엇인가?
3장 데이터 과학 생태계
4장 기계학습 101
5장 표준적인 데이터 과학 업무
6장 프라이버시와 윤리
7장 미래 동향과 성공의 원칙
옮긴이의 말
용어설명
주
더 읽을거리
참고문헌
찾아보기
리뷰
책속에서
데이터 과학의 목적은 큰 데이터 세트에서 끌어낸 통찰을 기반으로 더 나은 의사결정을 내리는 데 있다. 데이터 과학은 일련의 규칙, 문제의 정의, 알고리즘, 데이터 세트에서 뻔하지 않으면서 유용한 패턴을 추출하는 작업 등을 아우르는 개념이다.
데이터 과학이 점점 더 많이 쓰이는 이유는 빅데이터와 소셜데이터의 부상, 컴퓨터 성능의 향상, 컴퓨터 메모리 가격의 하락, 딥러닝과 같은 더 강력한 데이터 분석, 모델링 기법의 개발 등 덕분이다. 이런 요소들이 동시에 결합되자 어떤 조직이나 단체가 데이터를 모으고, 저장하고, 분석하기가 어느 때보다 쉬워졌다. 한편 이런 기술적 혁신과 데이터 과학의 활용 범위의 확장은 ‘개인 정보와 데이터를 어떻게 적절하게 사용할 것인가’란 전례 없는 윤리적인 과제도 불러왔다. 이 책의 목적은 데이터 과학에서 핵심적인 요소들의 기초를 깊이 들여다봄으로써 독자가 원칙에 기초하여 데이터 과학을 이해하도록 만드는 데 있다.
글이 탄생한 이후 지난 2003년까지 약 5천 년 동안 만들어진 데이터의 양은 모두 합해 약 5엑사바이트(1엑사바이트는 2의 60승 바이트?옮긴이)로 추정된다. 그런데 2013년 이후에는 매일 이 정도의 데이터가 쌓이고 있다. 쌓이는 데이터의 양만 늘어난 것이 아니라 그 종류도 극적으로 다양해졌다. 몇 가지만 생각해봐도 전자우편, 블로그, 사진, 트윗, ‘좋아요’, 공유, 웹 검색, 비디오 업로드, 온라인 구매목록, 팟캐스트 등으로 매우 다양함을 알 수 있다. 더군다나 이 각각의 데이터에 대한 메타데이터(원데이터의 속성과 구조를 설명하는 데이터)까지 생각해보면 왜 빅데이터란 말이 유행하게 됐는지 알 수 있을 것이다. 빅데이터는 보통 3개의 V로 설명된다. 어마어마한 데이터의 양(volume), 그 종류의 다양함(variety), 데이터를 처리하는 속도(velocity) 등이다.