Post

[Backend/Database] Google - Big Query

[Backend/Database] Google - Big Query

인턴으로 출근하면서 또 하나 배운 플랫폼이 있는데요. Big query라는 클라우드 데이터베이스입니다.

기업의 경우, 수많은, 수억, 수천억 개의 방대한 데이터를 저장하기 위해 클라우드 서비스를 이용하곤 합니다. 오늘은 그 중 하나인, Big query 서비스에 대해 알아보도록 하겠습니다!


꼭 알아야 하는 개념

※ Data warehouse: 정보(data) + 창고(warehouse)가 결합한 의미로 의사결정에 도움을 주기 위해 분석 가능한 형태로 변환한 데이터들이 저장되어 있는 중앙저장소

※ 클라우드 서비스: 인터넷을 통해 컴퓨팅 자원, 데이터 저장, 소프트웨어, 플랫폼 및 기타 IT 관련 서비스를 원격으로 제공하는 것

※ RDBMS(Relational DataBase Management System): 데이터를 표 형식으로 저장하고 테이블 간의 관계를 정의하여 데이터를 효율적으로 관리하는 시스템


1. BigQuery란


아마 대학생들한테는 생소할 지도 모르는 서비스이다. 나도 실무에서 근무하면서 처음 접해봤기 때문이다. 아무래도 학부 때는 대용량 데이터라고 하면 대회에서 제공하는 csv 형태의 데이터일 것이고, 많이 다뤄봤다 라고 해봤자 190만개 정도에 해당 하는 데이터였다.

근데 웬걸, 기업에서 집계된 데이터만 봤는데도 row가 1천억개 정도 되었다. 그럼 raw data는 얼마나 방대한건지….

이와 같이, 대용량 데이터를 저장하고, 분석에 사용하기 위해 기업에서 많이 도입하고 있는 클라우드 데이터웨어 서비스가 바로 Big Query이다. 많은 데이터를 저장할 수 있을 뿐만 아니라, SQL 쿼리를 빠르게 수행해주는 platform 서비스이다.



2. 특징


  1. 편리한 사용
    • 클라우드 서비스를 통해 제공되기 때문에, 설정이나 운영이 필요하지 않고, 설치하지 않아도 된다는 장점이 존재한다.
  2. SQL문의 사용
    • 또한, 기존 RDBMS에서 사용되던 SQL 문을 사용하면 되므로, 편리하게 사용할 수 있다.
  3. 저렴한 비용
    • 빅쿼리의 비용은 저장되는 데이터 사이즈, 쿼리 시에 발생하는 비용만큼만 과금이 되기 때문에, 타 서비스에 비해 저렴하다고 한다.
    • 무료로도 사용이 가능한데, 조금 느리다는 단점은 있다. ⇒ 인턴으로 근무하는 데는 불편함이 없었음.



많은 기업에서 사용하는 서비스이기 때문에, 사용법을 알고 있으면 유용할 것 같습니다. 현실적으로 학부에서 다뤄보기는 어려운 플랫폼이긴 하지만 개념으로라도 알고 있으면 언젠가 도움이 되지 않을까요? ^^… 이상입니다!~ (/ω\)





🔗 참고 링크

This post is licensed under CC BY 4.0 by the author.