この記事でわかること
新規事業開発部のケンイチは、月末の会議に向けて頭を抱えていました。
年末年始の予約データ、アンケートの自由記述、Webサイトのアクセスログ…材料は山ほどあるのに、「集計に時間がかかりすぎて結論が出ない」のです。
ケンイチ:
「課長、ご相談があります。顧客データの分析が全然終わらなくて…。
集計が重くて、会議に間に合わない気がします」
課長:
「その状況なら、Amazon Redshiftを検討しよう。
“分析のためのデータ置き場”を作って、集計を速くするんだ」
ケンイチ:
「Amazon Redshift…それは一体何でしょうか?」
課長:
「一言でいうと、分析用のデータベース(データウェアハウス)だ。
普段の予約システムみたいに“1件ずつ更新する”のが得意なDBとは役割が違う。
Redshiftは“たくさんのデータをまとめて集計する”のが得意なんだ」
ケンイチ:
「分析用…ということは、
予約履歴やアンケート、アクセスログを一か所に集めて、
『どのプランが伸びそうか』を探す感じでしょうか?」
課長:
「その理解でOK。
例えるなら、RDSみたいな通常のDBは“レジ”だ。1件ずつ正確に処理する。
Redshiftは“集計室”だ。1日の売上をまとめて分析する。
レジに『全店舗×全商品の集計』をやらせると重くなるだろ?」
ケンイチ:
「確かに…。今、予約DBで無理やり集計して重くしてる気がします」
課長:
「Redshiftが速い理由は、大量のデータをまとめて読むのが得意な作りだからだ。
イメージは“みんなで手分けして計算する”。データ分析のクエリ(集計命令)を並列でさばける」
ケンイチ:
「なるほど…。
じゃあ『海外からの予約が増えた週だけ、どの広告が効いたか』みたいな集計も速くなりますか?」
課長:
「速くなりやすい。さらに、Redshiftにデータを集めると、
部署ごとに別々のExcelで管理していた“数字のズレ”も減らせる。
『同じ答えが出る原本』を作る感じだ」
ケンイチ:
「それ助かります…!でも注意点はありますか?」
課長:
「注意点は2つ。
1つ目は、分析用なので“何でもかんでも入れればOK”ではないこと。
どう分析したいかを決めて、テーブル設計やデータ取り込みを整える必要がある。
2つ目は、使い方次第でコストが増えること。まずは小さく始めよう」
ケンイチ:
「まず何をすればいいですか?」
課長:
「最初の一歩はこれだ。予約履歴と広告クリック、アクセスログを“分析用に”集める。
『どの広告→どの予約』が増えたかを会議で出せるようにしよう」
ケンイチ:
「ところで課長、なんで“Redshift”って名前なんですか?
赤い…シフト…?」
課長:
「いい質問だ。Redshiftは天文学の言葉で、
“赤方偏移(せきほうへんい)”っていう現象から来ている。
遠くの星の光が“赤っぽくずれる”やつだ」
ケンイチ:
「赤っぽくずれる…? それがデータ分析と関係あるんですか?」
課長:
「直接の仕組みの話じゃない。名前のイメージだな。
Redshiftは“ビッグデータ分析”の世界で有名な言葉で、
大量データを扱う感じを連想させやすい。
AWSは科学っぽい言葉をサービス名に使うこともあるんだ」
ケンイチ:
「なるほど…。名前は科学用語だけど、
覚え方としては“大量データを分析するサービス”って押さえればいいんですね?」
課長:
「その通り。名前に引っぱられず、
Redshift=分析用データベース(集計室)と覚えればOKだ」
| 用語 | 目的 | 得意なこと | 向いている用途 |
|---|---|---|---|
| Amazon Redshift | データ分析(集計) | 大量データの集計・BI | ダッシュボード、DWH |
| Amazon RDS | 業務DB | 1件ずつの更新・整合性 | 予約/会員/決済など |
| Amazon Athena | クエリ実行 | S3上をSQLで直接検索 | 一時分析、ログ調査 |
AWSの公式ブログでは、DeNAがAmazon Redshift Serverlessとdbtを組み合わせ、データ品質テストを最大100倍高速化した事例が紹介されています。
「分析基盤の処理が遅いと改善サイクルが回らない」という悩みに対して、Redshiftを使って分析作業をスピードアップした具体例です。
AWSの導入事例では、DAISOが商品・販売データを集計する仕組みの中でAmazon Redshiftを利用していることが紹介されています。
店舗から集まるデータをまとめて分析し、業務に活かす“データウェアハウス”的な使い方の参考になります。
Amazon Redshiftが得意なこととして正しいのはどれ?
A:大量データの集計・分析
B:画像を自動で加工する
C:スマホのバッテリーを長持ちさせる
Amazon RDSとAmazon Redshiftの違いとして近いのはどれ?
A:RDSはレジ、Redshiftは集計室
B:RDSは天気、Redshiftは地図
C:RDSは紙、Redshiftは鉛筆
Redshiftを使うときの注意点として正しいのはどれ?
A:分析の目的に合わせてデータの整え方が必要
B:何も考えずに入れるだけで必ず速くなる
C:インターネットがなくても自動で動く
1-A:(大量データの集計・分析)(分析向けDWH)
2-A:(RDSはレジ、Redshiftは集計室)(役割が違う)
3-A:(分析の目的に合わせて整える)(設計と取り込みが大事)
解説:Redshiftは「分析(集計)」に強いデータウェアハウスです。業務DB(RDS)と役割が違うので、目的に合わせて使い分けるのがコツです。