用語解説
Google BigQueryとは、GCPが提供するサーバーレスのフルマネージドデータウェアハウスです。ペタバイト規模のデータに対してSQLクエリを数秒〜数十秒で実行できる高速分析が特徴です。
カラム型ストレージとDremelエンジンにより大量データのスキャンを高速化しており、インフラ管理不要でデータ分析に集中できます。BI Engine・ML・GeoVisなどの拡張機能も統合されています。
どんな場面で活用するか
- マーケティングデータや販売ログを集計してKPIダッシュボードを作成したい場合
- 複数システムのログをBigQueryに集約してアドホック分析を行いたい場合
- 機械学習モデルのトレーニングデータをSQLで前処理・特徴量エンジニアリングしたい場合
よくある誤解
判断のヒント
コスト管理クエリのスキャン量で課金されるため、パーティションテーブルとクラスタリングを設定してスキャン範囲を絞ることが最重要です。開発時はプレビュー(ドライラン)で処理データ量を事前確認しましょう。