독서/서평

SQL로 데이터를 다채롭게 뽑아보는 연습에 딱좋은 책

Dibrary 2022. 9. 5. 09:50
반응형

 

읽게 된 계기

 데이터 분석 이나 데이터 엔지니어에게 SQL은 필수라고 한다. 그러나, 나는 SQL은 기본적인 CRUD만 할 줄 알았고 그것만 잘 하면 된다고 착각하고 있었다. 한 번은 코딩테스트에 SQL 문제가 나왔었는데 이게 그냥 CRUD만 가지고 안되는 수준이었어서 관심을 갖고 SQL을 다채롭게 활용해볼 수 있는 방법을 배우는 책을 찾았다. 그게 이 책이다.

 


이 책의 특징

PostgreSQL, Hive, SparkSQL, Redshift, BigQuery 5개의 DB에 대한 쿼리문을 제공한다. 즉, 같은 결과를 내기 위해 쿼리문이 조금씩 다를 순 있지만, 그 쿼리문을 모두 확인할 수 있다. 
그리고, 데이터를 실제에는 어떻게 분석하고 바라보는지에 대한 설명과, 그 설명의 근거 자료를 찾기 위한 SQL문이 순서대로 제시되므로 실무에 적합한 책이다.
특히나 일반적인 SQL 책에서 많이 보기 힘든 윈도우함수나 각종 중첩쿼리, CTE 등이 매우 많이 나와서 해당 구문이 어려운 사람에게 연습하기 좋은 책이 될 수 있다.

 


간단 내용 정리

 

데이터로부터 어떤 결과를 얻어낼지 먼저 설명하고, 왜 그런 결과를 얻어내야 하는지도 설명한다. 그런 이후에 SQL문을 보여주고, 그 결과도 같이 제시한다.

이 과정을 각 섹터별로 나눠서 설명하지만, 결국에는 위 과정의 반복이 계속 나온다.

 


(나에게) 이 책의 장점

1. 시중에 넘쳐나는 SQL 기본서 수준이 아닌 SQL코드를 보고 생각을 해 봐야 할만한 코드가 많음.

2. 실무에서 어떤 형태, 어떤 방법의 데이터를 바라보는지 설명해 준다.

3. 실무에서 원하는 형태로 변경하는 SQL 코드가 담겨있다.

 


 책의 단점

1. 데이터와 관련된 파일이나 이런게 없어서 테이블을 만들고 데이터를 넣는 작업을 일일이 직접 다 해 줘야 함. 데이터가 몇 개 안되면 모르겠는데.... 시계열 데이터는 내가 임의로 만들어서 싹다 넣어줘야 해서 꽤 양이 많음.

2. 중간중간 오타가 있다. 이 오타를 스스로 해결할 줄 모르면 책의 결과를 볼 수가 없다. 

 


결과

 

내 필요에 딱 맞는 책이라고는 할 순 없으나, 거의 근접한 책이다. SQL을 중급 이상으로 활용하는 예 및 코드가 필요했는데 그나마 여기에 나온 코드가 가장 수준이 있다고 보여진다. 

내가 주로 쓰는 DB는 MariaDB(MySQL) 이라서 관련 코드를 PostgreSQL에서 실행 해 보고, 관련 내용 중에 MariaDB 코드로 바꿔야 하는 것만 수정해서 공부했다. 뭐 ... 그래서 공부하는 데 걸리는 시간이 배로 걸렸지만 그럼에도 책에 나온 코드에 익숙해지는 것 만으로도 굉장히 도움이 된다고 생각한다.

728x90
반응형