AWS Amazon Athena
この記事でわかること
- Amazon Athenaの基本(何ができる?)
- どんな場面で役立つか(“今すぐ集計したい”に強い)
- 注意点(料金の考え方)と、似たサービスとの違い
① ストーリー性を取り入れた説明
旅行会社の新規事業開発部では、顧客アンケートの自由記述(コメント)を毎月まとめていました。ところが、データはCSVで増え続け、担当者が手作業で分類・集計。月末会議に間に合わないことが続き、ケンイチは焦っていました。
ケンイチ:
「課長、ご相談があります。
アンケートの自由記述が多すぎて、集計が追いつきません。
毎月“手作業の地獄”になっています…」
課長:
「それならAmazon Athenaが向くかもしれない。
“ファイル置き場”のS3にあるデータを、SQLでそのまま検索できる」
ケンイチ:
「SQLって、データベースの命令ですよね?データベースを作らないと使えないんじゃ…?」
課長:
「そこがAthenaの強いところだ。Athenaは“データベースを立てる”というより、
S3に置いたファイルを、必要なときだけSQLで読むイメージなんだ」
ケンイチ:
「S3って何でしたっけ?ちょっと記憶が曖昧で。。」
課長:
「S3はクラウド上の“巨大な倉庫”だ。
CSVやJSON、ログファイルを置いておける。
Athenaは、その倉庫の中身を“探す係”だと思えばいい」
ケンイチ:
「なるほど…。つまり、アンケートCSVをS3に置いたら、
Athenaで『不満が多い単語』とか『地域別の集計』ができるってことですか?」
課長:
「そう。しかもサーバーを立てない“サーバーレス”だ。
“今すぐ集計したい”に強い。たとえば今日中に会議資料の数字を作る、みたいな場面で役立つ」
ケンイチ:
「それは助かります!でも注意点はありますか?」
課長:
「Athenaの料金は“読み取ったデータ量(スキャン量)”で決まる。
だから雑に全部読むと高くなる。逆に言うと、必要な部分だけ読む工夫ができれば安く済む」
ケンイチ:
「必要な部分だけ読む工夫…って、どうやるんですか?」
課長:
「まず定番は日付でフォルダ分け(パーティション)だ。
たとえば、
s3://…/survey/2026/03/ のように分ける。
『3月分だけ』を集計するとき、他の月を読まなくて済む」
ケンイチ:
「なるほど!“必要な棚だけ開ける”感じですね」
課長:
「その例えがいい。
さらに余裕が出たら、CSVをParquet(パーケ)みたいな分析向け形式に変えると、
読み取り量が減って速くなることが多い」
・S3(倉庫)のデータをSQLでそのまま検索できる
・サーバーレスなので“今すぐ集計”に強い
・料金はスキャン量次第:パーティション/形式最適化が重要
ケンイチ:
「似たサービスだと、Redshiftもありますよね?
どっちを使えばいいんでしょうか?」
課長:
「使い分けはこう考えろ。
Athenaは“倉庫の中をその場で探す”。
Redshiftは“分析専用の集計室を作って、いつも速い状態にする”。
頻繁に使うダッシュボードや複雑な分析はRedshiftが向くことが多い」
ケンイチ:
「じゃあ今回は、まずAthenaでサクッと集計して、
定例で回すようになったらRedshiftも検討、という流れが良さそうですね?」
課長:
「いい判断だ。まずは今日中に、
アンケートCSVをS3に置いて“月別の不満TOP10”を出すところまでやろう」
ケンイチ:
「ところで課長、なんで“Athena”って名前なんですか?女神の名前ですよね??」
課長:
「いいところに気づいたな。たしかにAthena(アテナ)は、ギリシャ神話の女神で、
知恵・戦略・学問の象徴として有名なんだ」
ケンイチ:
「知恵の女神…!じゃあ“賢くデータを調べる”みたいな意味が込められてるんですか?」
課長:
「そういう覚え方が分かりやすい。Athenaは、S3(倉庫)に置いたデータを、
必要なときにSQLでサッと調べられる。つまり『知恵=欲しい答えを素早く引き出す』イメージだ」
ケンイチ:
「なるほど…。でも、何でもかんでも調べたらお金がかかる、って話でしたよね?」
課長:
「その通り。Athenaは“賢い”ほど安くなる。
日付でフォルダ分けして必要な棚だけ開く(パーティション)とか、
Parquetにして読む量を減らすとか、
知恵の女神らしく、ムダ読みを減らす工夫が大事だ」
ケンイチ:
「つまりAthenaは、
“倉庫の中を賢く探して、必要な分だけ読むサービス”って覚えればいいんですね?」
課長:
「完璧だ。今月のアンケートだけ素早く集計する、みたいな場面で特に強いぞ」
よく間違えられやすい用語との違い
| 用語 | データの置き場所 | 得意なこと | 料金の考え方 |
|---|---|---|---|
| Amazon Athena | S3上のファイル | 必要なときにSQLで検索 | スキャンしたデータ量 |
| Amazon Redshift | Redshift内(DWH) | 定常的な分析・BI | 構成/利用に応じた課金 |
| Amazon RDS | RDS内(業務DB) | 予約/会員などの取引処理 | インスタンス稼働等 |
Amazon Athenaとは、Amazon S3に保存されたデータをSQLクエリで分析できるサーバーレスなクエリサービスです。
② 実際の事例
事例1:株式会社ドリコム(ゲーム分析のサーバーレス基盤でAthenaを活用)
AWSの導入事例では、ドリコムがAmazon Kinesis Data FirehoseやAmazon Athenaを使ったサーバーレス構成で、分析基盤のコスト削減やデータ抽出の高速化を実現したと紹介されています。
「ログやイベントデータをS3にためて、必要なときに素早く集計する」というAthenaらしい使い方です。
事例2:株式会社ナビタイムジャパン(ログ分析基盤をAthenaへ移行)
AWSの事例PDFでは、ナビタイムジャパンが膨大なログ分析基盤をAmazon Athenaに移行し、分析インフラのコスト削減や集計時間短縮につなげたことが紹介されています。
“大量ログをためて、必要な集計を素早く回す”という用途の具体例です。
③ クイズや小テスト
クイズ1
Amazon Athenaが得意なのはどれ?
A:S3のデータをSQLでそのまま検索する
B:仮想サーバーを作ってOSを管理する
C:予約処理を1件ずつ確実に更新する
クイズ2
Athenaの料金で特に意識すべきものはどれ?
A:スキャンしたデータ量
B:利用者の人数
C:パソコンの種類
クイズ3
コストを抑える工夫として近いのはどれ?
A:日付でフォルダ分けして必要な月だけ読む
B:毎回全データを読む
C:データを1つの巨大ファイルにまとめる
答え:
1-A:(S3のデータをSQLでそのまま検索する)(“倉庫を探す”)
2-A:(スキャンしたデータ量)(読んだ分だけ課金)
3-A:(日付でフォルダ分けして必要な月だけ読む)(スキャン量を減らす)
解説:AthenaはS3上のデータをサーバーレスでSQL検索できるサービスです。便利な反面、スキャン量が増えると費用も増えるため、パーティションやデータ形式の工夫が重要です。





