AWS Amazon Comprehend
- Amazon Comprehendが「文章から何が分かるか」がつかめる
- アンケート分析をどう自動化できるかが分かる
- 導入時の注意点が分かる
① ストーリー性を取り入れた説明
旅行会社の新規事業開発部。新サービスのテスト販売を始めたら、自由記述アンケートが一気に増えた。「良い/悪い」は読めても、何が刺さって何が地雷なのか。
締切は月末、手作業の分類はもう限界だ。
ケンイチ:
「アンケートの自由記述が500件を超えました…
自分で分類してたら間に合いません」
課長:
「焦る気持ちは分かる。まず“文章を機械で整理する”道具を使おう。Amazon Comprehendだ」
ケンイチ:
「Comprehendって…
英語でどういう意味でしたっけ?あまり英語に自信がなくて。」
課長:
「comprehendは“理解する”って意味だ。
つまりComprehendは文章を理解して整理するサービスだ」
ケンイチ:
「つまり、感想文を読んで“良い/悪い”とか“何の話か”を
まとめてくれるってことですか?」
課長:
「そう。代表例は3つだ。
①感情分析(好評/不満)
②キーフレーズ抽出(刺さった言葉)
③固有表現抽出(地名・施設名)だ」
ケンイチ:
「固有表現って、例えば…“京都”“道後温泉”みたいな地名を拾う感じですか?」
課長:
「その通り。
“京都が良かった”が多いなら京都商品の改善が分かる。
読む前に当たりを付けられるのが強い」
ケンイチ:
「ちょっと待ってください。
アンケートって、紙やPDFもあります。
その場合はComprehendで読めるんですか?」
課長:
「いい視点だ。
Comprehendは“文章の意味”を読む。
でも画像は、そのままだと文字として読めない」
ケンイチ:
「じゃあ、画像から文字にするには…?それがOCRってやつですか?」
課長:
「そう。OCRは、ひとことで言うと“画像から文字を抜き出す”技術だ。
紙のアンケート写真をテキストに変える役だね。」
ケンイチ:
「つまり、OCRが“文字起こし”。
Comprehendが“意味の整理”。 役割が違うってことですね?」
課長:
「その通り。流れで言うと
①OCRで文字を取り出す
②Comprehendで感情や要望を分類する
この2段階が基本だ」
ケンイチ:
「なるほどー!!
じゃあ旅行写真のキャプションみたいに最初からテキストならOCRはいらないですね?」
課長:
「いらない。最初から文章ならComprehendでいきなり解析できる。
逆に、看板や手書きメモみたいに画像にしかない文字はOCRが先だ」
・OCR:画像 → 文字にする(文字起こし)
・Comprehend:文字 → 意味を整理する(感情/分類/抽出)
・紙や写真の文字は「OCR→Comprehend」が基本
ケンイチ:
「じゃあ“やりたいこと”で言うと、
紙アンケの写真はOCRで文字にして、
その結果をComprehendで『不満』『要望』に分ける…?」
課長:
「そうだ。そこまでできれば、人は“重要な山”だけ読める。
締切前でも間に合う形になる。だから・・・」
ケンイチ:
「うう・・・頑張ります。でもコストはどう見ればいいですか?
使いすぎて請求が爆発するのは怖いです…」
課長:
「課金は基本的に解析したテキスト量で決まる。
だから“全部ぶち込む”より、まずは対象を絞ったほうがいい。月上限アラートも必須だ」
ケンイチ:
「なるほどー!!まずは“自由記述だけ”に絞って小さく試すのが良さそうですね」
課長:
「それでいい。導入の順番はシンプルだ。
①少量で試す
②人が確認してズレを把握
③ルール化して自動化だ」
よく間違えられやすい用語との違い
| 用語 | 主な用途 | 取り出しの速さ | コストの傾向 |
|---|---|---|---|
| Amazon Comprehend | 文章の感情・キーワード・固有名詞の抽出 | APIで即時に結果取得 | 解析量(テキスト量)で増減 |
| Amazon Translate | 文章の翻訳 | 即時 | 翻訳した文字量で増減 |
| Amazon Rekognition | 画像・動画の解析(物体/人物/文字など) | 即時〜バッチ | 画像/動画の解析量で増減 |
Amazon Comprehendとは、文章を解析して感情・キーフレーズ・固有名詞などを自動抽出する自然言語処理(NLP)のサービスです。
② 実際の事例
事例:Siemens(シーメンス)— アンケート自由記述の自動処理
シーメンスは、従業員調査などのアンケート自由記述を効率よく扱うため、AWS上に回答処理ソリューションを構築しました。
完了したアンケートをまずAmazon Comprehendに送って言語を識別し、必要に応じてAmazon Translateで翻訳します。さらにComprehendで個人名などを匿名化し、その後Amazon SageMakerで回答内容を検出してカテゴリやトピックに整理します。
この仕組みにより、分析・分類した結果を従来より少なくとも75%速く返せるようになり、調査プログラムの費用も大幅に削減できました。
また、過去は従業員調査の処理と分析を人手で行うと、1回あたり数ユーロの費用がかかっていましたが、ComprehendなどのAWSサービスを使うことで、翻訳・処理・分析を1回あたり1ユーロ未満で実行できるようになったとしています。
③ クイズや小テスト
クイズ1
Amazon Comprehendでできることとして近いのはどれ?
A:文章から感情やキーワードを抽出する
B:画像を高画質化する
C:サーバーの性能を自動増強する
クイズ2
導入で最初にやると安全なのはどれ?
A:全データを一気に解析して本番化
B:少量で試し、人が結果を確認する
C:専門用語を全部禁止して運用する
クイズ3
コスト管理で重要な考え方はどれ?
A:解析量(テキスト量)を意識して対象を絞る
B:解析は基本無料なので気にしない
C:長文ほど精度が落ちるので短文だけにする
答え:
1-A:文章から感情やキーワードを抽出する(Comprehendの本丸)
2-B:少量で試し、人が結果を確認する(ズレを先に把握)
3-A:解析量を意識して対象を絞る(請求の暴走を防ぐ)
解説:Comprehendは“文章の整理役”。いきなり全自動にせず、最初は人の確認とセットで使うと失敗しにくい。




