旅行会社の新規事業開発部。デジタル化で増え続ける旅行写真のアーカイブが問題になっていました。
特に、昨月の国内ツアーの写真約12万枚と過去のパンフPDFが蓄積され、月末の見積り会議でコスト圧力が浮き彫りになりました。
ケンイチは、保存コストを下げたいが、たまに顧客から即時で過去写真を取り出す要望があり、どこを削るべきかモヤモヤしています。
課長:
「S3 Glacier Instant Retrievalを検討しよう。
たまにしか見ないけど、すぐ取り出したいデータ向きだ」
ケンイチ:
「S3 Glacier Instant Retrievalって何ですか?
あまり聞き慣れない英単語で…意味から知りたいです」
課長:
「いい着眼点だ。
まず Glacier は“氷河”のこと。
長く眠ってるデータのイメージだね」
ケンイチ:
「氷河…つまり、基本は長期保存向けってことですね?」
課長:
「そう。次に Instant は“すぐに”、
Retrieval は“取り出し”という意味だ」
ケンイチ:
「じゃあ直訳すると、
“氷河(長期保存)だけど、すぐ取り出せる”ですか!」
課長:
「その理解でOK。つまりこれは、
長期保管の安さと即時アクセスを両立した保存クラスだ」
ケンイチ:
「なるほどー。“S3”って言葉も出ましたが、S3って何でしたっけ?」
課長:
「S3は、ひとことで言うと “インターネット上のファイル置き場”だ。
Glacier Instant RetrievalはS3 ストレージクラスの1つ。特徴は・・」
ケンイチ:
「なるほど。メリットは具体的に何ですか?」
課長:
「メリットは、ひとことで言うと
“低頻度の大量データを安く保管しつつ即時参照できること”だ
ただし・・・・
“取り出しは即時だが呼び出し回数で費用が変わる”点に注意だ」
ケンイチ:
「じゃあ、頻繁に取り出すと逆に高くなるってことですね?
いつ使うのがベストですか?」
課長:
「用途は、ひとことで言うと
“長期保管が必要で、参照はまれだが即時応答が必要なデータ”だ」
ケンイチ:
「そうすると我々でしたら旅行写真のアーカイブや、検査用ログ保管に向いているんですね?」
課長:
「そうだね。注意点をリマインドしておくと
“アクセス頻度が高いデータには不向きで、請求構成を要確認”だ」
ケンイチ:
「なるほど、使い分けが大事なんですね…」
| 用語 | 主な用途 | 取り出しの速さ | コストの傾向 |
|---|---|---|---|
| S3 Standard | 頻繁にアクセスするデータ | 即時 | 高め |
| S3 Intelligent-Tiering | アクセス頻度が変動するデータ | 即時 | 自動で最適化 |
| S3 Glacier系(Instant Retrieval) | まれに参照する長期保管データ | 即時 | 保存は安めだが取り出し計算注意 |
課長:
「Intelligent-Tieringは、ひとことで言うと
“アクセスに合わせて自動で最安層に移す仕組み”だ。
これもよく検討されるから覚えておくといい。」
ケンイチ:
「なるほど、S3 Intelligent-Tieringは勝手に一番安い所に移してくれるってことですね?
実務での分かれ目は何を基準にすればいいですか?」
課長:
「基準は、ひとことで言うと
“アクセス頻度と即時性の必要性”だ」
ケンイチ:
「了解です。頻度と即時性を見て使い分けます」
写真販売機能「ルクミーフォト」で、大量の写真データをAmazon S3に保存していました。
サービス開始から年数が経ちデータが蓄積し、S3の保管コストが大きいことが課題に。そこでAWSから、アクセス状況の分析や不要ファイル削除と並行して、ストレージクラス変更による最適化提案を受けました。
具体的には、ライフサイクル設定でStandard→Standard-IAへ移行していたバケットを、段階的にAmazon S3 Glacier Instant Retrievalへ移行。コード変更なしで進めやすい点も利点でした。
結果として、複数施策の効果と合わせて、全サービス合計のS3費用が改善前の約3分の1まで圧縮できたとしています。
情報源:AWS Startup ブログ(ユニファ社インタビュー)
https://aws.amazon.com/jp/blogs/startup/tech-interview-unifa-2023/
S3 Glacier Instant Retrievalが向いているのはどれ?
A:頻繁に更新するデータ
B:長期保管で参照はまれだが即時性が必要なデータ
C:リアルタイム処理の中間データ
S3 Intelligent-Tieringの特徴として正しいのはどれ?
A:手動で階層を移す必要がある
B:アクセスに応じて自動で最適化される
C:取り出しは常に遅延がある
選定で注意すべき点はどれ?
A:保存コストだけで選ぶ
B:アクセス頻度と取り出しコストを両方確認する
C:見た目で選ぶ
1-B:長期保管で参照はまれだが即時性が必要なデータ(即時アクセス向け)
2-B:アクセスに応じて自動で最適化される(運用負担が減る)
3-B:アクセス頻度と取り出しコストを両方確認する(両面で判断)
解説:用途に応じて保存クラスを選ぶと、コストと利便性の両立ができます。