본문 바로가기

Activity/책 리뷰

[리뷰/책] 파이썬 라이브러리를 활용한 데이터 분석

반응형

한 줄 요약 : 데이터 분석 이론이 아니라 파이썬과 라이브러리를 활용해서 실습 경험을 쌓을 때 도움되는 책


 

[파이썬 라이브러리를 활용한 데이터 분석] 표지

 

시중에 출간된 데이터 분석 책을 크게 두 가지로 분류된다.

1. 이론 중심으로 데이터 분석에 대해 정리한 책

2. 프로그래밍 언어로 간단한 예제들을 실행해보는 책

 

[파이썬 라이브러리를 활용한 데이터 분석]은 이 두 가지를 적정선에서 잘 조합되어 있다.

NumPy, Pandas, Matplotlib, IPython, Jupyter 등 다양한 파이썬 라이브러리를 사용하여 실습을 진행하도록 되어 있다.

 

데이터 분석 책을 보면 복잡한 수식과 그 수식을 설명하는 긴 설명때문에 금방 포기했었다.

라면을 끓이는 것에 비유할 수 있겠다.

라면을 끓일 때는 냄비에 물을 붓고, 끓이고, 면과 스프를 넣고 3분 기다렸다가 먹으면 된다.

라면의 면발을 어떻게 튀겨야 하고, 스프에 들어가는 재료의 구성 비율은 어떻게 맞추고... 이런 것들을 알면 좋겠지만 내가 필요한 건 그게 아니라는 점이다.

 

이 책이 그렇다.

데이터 분석을 하려면 파이썬과 라이브러리를 활용해서 어떤 결과를 내야 한다.

복잡한 수식과 그 이유를 알면 좋겠지만 일단 실습을 끝내고 나서 심화학습하면 된다.

이런 점에서 실습 위주로 되어 있어서 이 고민은 내려놓을 수 있었다.

 

주요 실습 내용은 아래와 같다.

  • IPython 셸, 주피터 노트북 사용하기
  • NumPy 기본 및 고급 기능 알아보기
  • pandas로 데이터 분석 입문하기
  • 유연한 도구를 사용해 데이터 로딩, 정제, 조인, 병합, 변형하기
  • matplotlib으로 유용한 시각화 만들기
  • pandas groupby 기능을 적용해 데이터를 나누고 요약하기
  • 시계열 데이터 분석 및 조작하기

하지만 파이썬 언어의 사용법과 같은 최소한의 지식은 있어야 한다.

 


 


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
리뷰를 위해 한빛미디어에서 책을 제공받았지만 주관적인 생각을 그대로 적었습니다.

반응형