반응형

구글 2

[구글 빅쿼리] 빅쿼리에 대해 입문할 수 있는 책

데이터 직무의 자격요건 혹은 기술스택을 보면 어지간해서는 꼭 빅쿼리가 있었다. 처음에는 AWS Athena처럼 클라우드에서 쿼리문 날려서 결과를 받아보는 것이지 않나 하는 생각이었지만, 그래도 기술스택에 '명시'가 되어 있기에 간단하게 봐 두자는 생각으로 이 책을 집었다. 우선 책이 매우 얇다. 250페이지 정도. 그렇기 때문에 약간 클라우드를 안써본 사람이라면 조금 버벅댈 부분이 몇 군데 있다. 처음에 빅쿼리 콘솔 화면을 보여준 후에 곧바로 데이터를 넣고, 꺼내고, 쿼리 작성 등을 해 나간다. 빅쿼리에서 사용하는 SQL문은 여느 DB의 SQL문하고 크게 다르지 않다. 물론, 빅쿼리에서만 쓸 수 있는 ARRAY나 STRUCT 등의 다른 점은 있다. 책을 따라 데이터를 로딩시키려고 하다 보면 안 될 것이다..

독서/서평 2022.10.24

[구글을 지탱하는 기술] 쉽게 풀어쓴 구글의 시스템

Hadoop을 공부하다가, 분산저장 기술은 구글의 논문을 보고 만들어낸 것이라는 글을 보았다. 그래서 GFS 라는 것이 있음을 알게 되었는데, 이 내용이 쉽지 않았다. 다행이 해당 기술을 설명하는 책이 이 책이다. 물론, GFS 만 설명하진 않는다. 먼저 분산처리 기술이 왜 필요해졌는지에 대해 설명하며 시작한다. 구글도 처음에는 지금같은 거대한 규모가 아니었으나, 검색엔진 특성상 크롤러가 저장해야 할 데이터가 기하급수적으로 늘어나게 되었고, 그 필요성으로 저장소를 늘려 나가다가 GFS를 고안해낸 것이다. 구글의 분산 스토리지는 크게 3가지를 설명한다. GFS, Bigtable, Chubby. 저장하는 것 외에, 분산형태로 데이터를 처리하기 위한 기술도 소개한다. 맵리듀스는 Hadoop에서 익히들어 알고 ..

독서/서평 2022.07.07
반응형