한 줄 요약 : 데이터 과학(엔지니어링)의 바이블!
《견고한 데이터 엔지니어링》은 원서 'Fundamental of Data Engineering'을 한국어로 번역한 책이다.
Fundamental
1. 근본적인(= Basic)
2. 필수적인(= Essential)
3. 기본 원칙, 핵심
제목을 보듯 핵심이 되는 기반 기술과 지식에 대해 다루는 책이다. 그렇기에 특정 도구, 기술 또는 플랫폼에 대한 사용법을 소개하거나, 예제를 실행하는 기술서적과 차이가 있다.
자바스크립트 프로그래밍을 예로 들면 React, Vue.js같은 특정 기술을 소개하는게 아니라 바닐라 자바스크립트, ECMA Script를 다루는 책인 것이다.
흔히 말하는 '바이블(Bible)' 종류의 책이기때문에 언제 읽어도 도움이 된다고 생각한다.
데이터 엔지니어링에 막 발을 들인 엔지니어라면 비전 로드맵으로 사용 할 수 있을 것이다.
데이터 엔지니어링에 경험이 있고, 숙련된 엔지너이라면 놓치고 지나간 부분이 없는지, 심화학습할 지식은 없는지 참고할 수 있을 것이다.
책 구성
1부: 데이터 엔지니어링 기반 구축하기
2부: 데이터 엔지니어링 수명 주기 심층 분석
3부: 보안, 개인정보보호 및 데이터 엔지니어링의 미래
부록: 직렬화, 압축 및 클라우드 네트워킹
책은 세 부분으로 나뉜다.
먼저 1부에서는 데이터 엔지니어링을 얕고 넓게 다룬다. 데이터 엔지니어링이 무엇인지 정의하고, 처리하는 프로세스(또는 라이프사이클, 생명주기)는 어떻게 구성되는지, 좋은 아키텍처는 어떤 것인지, 운영 방법에 대한 비교 등을 소개한다.
2부에서는 1부에서 살펴본 내용을 '데이터 생성 - 저장 - 수집 - 변환 - 서빙'이라는 5단계로 나누고, 심화 내용을 소개한다. 1부에서 숲을 봤다면, 2부에서는 숲으로 들어가 나무 한 그루, 한 그루 살펴보는 단계다. 특정 기술, 플랫폼을 소개한다고 하지는 않았지만 기본적인 파이썬 프로그래밍, SQL, AWS와 같은 클라우드 서비스 경험이 있다고 전제하고 설명하고 있다.
3부에서는 보안, 개인정보에 대해 고민해봐야 할 것과, 미래에 대한 필자의 생각을 엿볼 수 있다.
데이터를 다루는 것은 결국 사람이기에 완벽할 수 없다. 그렇기때문에 보안을 신경써야 하고, 민감한 개인정보를 어떻게 다룰 것인지 고민해야만 한다.
《견고한 데이터 엔지니어링》의 각 장(chapter) 마지막에 '참고 문헌'부분을 보며 '역시 데이터 엔지니어링에 대한 바이블이다!'는 생각을 하게 됐다. 저자가 한 장을, 각 부를, 《견고한 데이터 엔지니어링》을 쓰기 위해 참고한 수많은 글과 논문, 책을 볼 수 있기 때문이다.
《견고한 데이터 엔지니어링》은 500여쪽이라 바이블이라고 보기엔 두께가 얇을 수 있다. 하지만 책을 읽으며 참고문헌을 함께 본다면 1000쪽 이상의 내용을 담은 책과 같을 것이다. 그렇기때문에 《견고한 데이터 엔지니어링》은 반드시 참고 문헌을 보며 함께 공부해야 제대로 읽는 것이라 생각한다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
리뷰를 위해 한빛미디어에서 책을 제공받았지만 주관적인 생각을 그대로 적었습니다.
'Activity > 책 리뷰' 카테고리의 다른 글
[리뷰/책] 《러닝 MySQL》 (0) | 2023.10.29 |
---|---|
[리뷰/책] 《크리에이티브 프로그래머》 (1) | 2023.09.25 |
[리뷰/책]《린 스타트업(10주년 기념판)》 (0) | 2023.07.23 |
[리뷰/책]《데이터 품질의 비밀》 (0) | 2023.05.28 |
[리뷰/책] 《머신러닝 시스템 설계》 (1) | 2023.04.23 |