최근 데이터의 폭발적인 증가로 말미암아 다양한 응용 서비스에서 데이터 분석은 매우 중요한 위치를 차지합니다. 데이터 분석을 효과적으로 진행하려면 준비사항이 많은데, 그 중에서도 필수적인 요건 중 하나가 SQL 활용법입니다.
과거 필자의 블로그 글을 읽은 분은 아시겠지만, 필자의 주요 관심사가 데이터 분야이므로 평소에 SQL 활용법에 많은 관심을 갖고 있습니다. <데이터 분석을 위한 SQL 레시피>에는 간결하면서도 실제 환경에서 활용할 수 있는 유용한 예제가 포함되어 있습니다. 아주 재미있는 책을 리뷰하는 데 도움을 주신 한빛미디어 관계자님께 깊은 감사의 말씀을 전합니다.
이 책에서 다루는 내용은?
SQL은 관계형 데이터베이스 관리 시스템과 대화하는 데 꼭 필요한 언어입니다. SQL을 처음 접해보면 다른 언어와 비교했을 때 학습하기 어렵지 않다고 느끼신 분들이 많을 것으로 생각합니다. 실제로 언어에 감각이 있으신 분들이라면 일주일 안에 모든 문법적인 요소를 학습할 수 있을 것입니다. 하지만 SQL을 학습하는 것과 효율적으로 사용하는 것은 완전히 다른 문제입니다. SQL을 효율적으로 활용할 수 있다면, 성능의 희생 없이 데이터 분석 응용 프로그램에서 발생하는 다양한 요구사항을 간단하게 만족할 수 있을 것입니다.
<데이터 분석을 위한 SQL 레시피>는 일본의 저자가 작성한 책입니다. 일본에서 많이 활용하는 오픈소스 데이터베이스 관리 시스템인 PostgreSQL을 기반으로 설명합니다. 오라클을 기준으로 설명했다면 국내 독자들이 더 좋아했을 것 같습니다만, 필자는 PostgreSQL을 많이 사용해봐서 친근하면서도 재미있게 읽을 수 있었습니다.
PostgreSQL을 비롯하여 Apache Hive, Amazon Redshift, Google BigQuery, SparkSQL 등 다양한 데이터 관리 시스템에서 활용하는 사례도 함께 소개하고 있어 RDBMS가 아닌 다른 영역으로 도메인을 넓히는 기회도 얻을 수 있습니다. 데이터 분석에 관심이 많은 분이라면, 데이터 분석에 매우 유용한 프레임워크인 Spark를 꼭 한 번 살펴보셨으면 좋겠습니다.
<데이터 분석을 위한 SQL 레시피>에서 소개하는 큰 주제 목록은 다음과 같습니다.
- 데이터 가공을 위한 SQL
- 매출을 파악하기 위한 데이터 추출
- 사용자를 파악하기 위한 데이터 추출
- 웹 사이트에서 사용자 행동을 파악하는 데이터 추출
- 데이터 활용의 정밀도를 높이는 분석 기술
- 데이터를 무기로 삼기 위한 분석 기술
위 내용은 데이터를 가공 및 추출하고 분석하는 기법에 대해 소개를 했다면, 필자가 가장 인상 깊었던 부분은 이 책의 마지막 챕터입니다. 실제 업무에 활용하는 방법에 대해 소개를 하고 있으며, 이 책을 읽기 전에 이 챕터부터 읽는 것도 나쁘지 않은 선택인 것 같습니다.
<데이터 분석을 위한 SQL 레시피>는 SQL을 많이 활용한 경험이 있으신 분들에게 추천합니다. SQL에 대한 기본 문법만 이해하고 있는 사람이 읽기에는 다소 어려울 수 있습니다. 기존에 SQL을 사용한 개발자가 이 책을 읽는다면, 한 단계 더 나아가는 개발자가 될 수 있을 것입니다.
마치면서...
<데이터 분석을 위한 SQL 레시피>를 읽은 후, 필자는 이 책을 읽은 독자의 SQL 활용 기술을 한 단계 높여줄 수 있는 책이라고 확신합니다.
SQL 문법을 소개하는 책이 아니므로 이 책에서 소개하는 문법들의 설명이 조금 불친절하다고 느낄 수 있습니다. 하지만 어려운 문법은 아니므로 매뉴얼을 참조하여 관련 문법을 이해하는 데 큰 어려움은 없을 것으로 생각합니다.