用語解説
マーケティングデータレイクとは、広告・SNS・Web解析・CRMなど多様なマーケティングデータを、構造化・非構造化を問わず大量に蓄積・保管するためのデータ基盤です。
従来のデータウェアハウスが事前にスキーマを定義するのに対し、データレイクはスキーマオンリードでデータをそのまま格納し、分析時に変換する柔軟性が特徴です。Google Cloud StorageやAWS S3などのクラウドストレージが基盤として使われます。
どんな場面で活用するか
- 複数媒体の広告データをまとめて蓄積し、横断分析したい
- 将来の機械学習・AI活用を見据えて生データを保存しておきたい
- コストを抑えながら大量のログデータを長期保管したい
よくある誤解
「データレイクはデータウェアハウスの上位互換」は誤りです。正しくは用途が異なり、レイクは蓄積・保管に、DWHは分析・クエリに向いています。多くの企業が両方を組み合わせて使います。
判断のヒント
導入判断ポイント:まず何のデータを集めるかを明確にすることが重要です。目的が曖昧なままデータを貯め込むと「データスワンプ(泥沼)」化するリスクがあります。