오픈소스기반데이터분석
정재화, 이태민 | 한국방송통신대학교출판문화원
34,200원 | 20250725 | 9788920052859
“In the end you should only measure and look at the numbers that drive action, meaning that the data tells you what you should do next.” - Alexander Peiniger
이 말은 정보 혁신 시대를 살아가는 우리가 데이터와 분석을 바라보는 태도에 대해 던지는 통찰이자 경고로 들립니다. 최근 몇 년간 ‘데이터’라는 단어는 무한 반복되고 있지만, 정작 그것을 올바로 수집하고, 정제하고, 해석하고, 실천 가능한 요약된 형태로 전환할 수 있는 능력은 매우 제한되어 있습니다. 단순히 데이터를 저장하는 것과, 그 안에서 의미를 읽어 내고 행동으로 옮기는 것은 전혀 다른 문제입니다.
이 교재 『오픈소스 기반 데이터 분석』은 그 간극을 좁히기 위한 교육적 시도이자 실천입니다. 현대 사회는 소셜 미디어, 센서, 웹 로그, 전자상거래 등에서 초당 수백만 건의 데이터가 생성되는 데이터 기반 사회로 전환되었습니다. 예컨대 기업은 소비자의 행동을 분석하여 상품을 제안하고, 정부는 감염병 확산을 예측해 방역정책을 설계하며, 병원은 환자의 유전정보와 진료기록을 분석해 정밀 의료를 제공합니다. 데이터는 더 이상 보조적인 도구가 아닌 사실을 설명하고 미래를 설계하는 핵심 자원이 된 것입니다. 그러나 데이터만 있다고 해서 저절로 의미가 생기지는 않습니다. 의미는 분석을 통해 탄생합니다. 분석은 단순한 기술이 아닌 해석의 방식이며, 분석의 방식은 곧 세상을 정확하게 바라보는 관점을 형성합니다. 이 교재는 데이터를 보는 눈을 기르고, 데이터를 다루는 손을 만들고, 데이터를 해석할 수 있는 머리를 갖추도록하기 위해 기획되었습니다. 특히 이 교재는 ‘오픈소스 기반’이라는 점에서 다른 데이터 분석 교재와 차별됩니다.
오픈소스는 단순히 ‘무료 도구’라는 개념을 넘어서 기술을 공유하고 재사용하며 함께 진화시키는 철학을 품고 있습니다. 리눅스, 파이썬, 주피터 노트북, Pandas, GitHub, VS Code 등 우리가 실습에서 활용하는 분석 도구는 모두 오픈소스 생태계에서 성장한 것입니다. 수많은 익명의 개발자, 연구자, 학생들의 자발적인 기여로 만들어진 이 도구들은 오늘날 데이터 분석의 표준이 되었고, 이 교재는 그러한 열린 기술 생태계를 이해하고 여러분이 직접 참여할 수 있도록 구성되었습니다.