【中学生でもわかるIT用語】AWS Amazon Comprehendとは 物語と実際の事例でわかりやすく解説

AWS

AWS Amazon Comprehend

  • Amazon Comprehendが「文章から何が分かるか」がつかめる
  • アンケート分析をどう自動化できるかが分かる
  • 導入時の注意点が分かる

① ストーリー性を取り入れた説明

旅行会社の新規事業開発部。新サービスのテスト販売を始めたら、自由記述アンケートが一気に増えた。「良い/悪い」は読めても、何が刺さって何が地雷なのか。

締切は月末、手作業の分類はもう限界だ。

ケンイチ:
「アンケートの自由記述が500件を超えました…
自分で分類してたら間に合いません」

課長:
「焦る気持ちは分かる。まず“文章を機械で整理する”道具を使おう。Amazon Comprehendだ」

ケンイチ:
「Comprehendって…
英語でどういう意味でしたっけ?あまり英語に自信がなくて。」

課長:
comprehendは“理解する”って意味だ。
つまりComprehendは文章を理解して整理するサービスだ」

ケンイチ:
「つまり、感想文を読んで“良い/悪い”とか“何の話か”を
まとめてくれるってことですか?」

課長:
「そう。代表例は3つだ。
①感情分析(好評/不満)
②キーフレーズ抽出(刺さった言葉)
③固有表現抽出(地名・施設名)だ」

ケンイチ:
「固有表現って、例えば…“京都”“道後温泉”みたいな地名を拾う感じですか?」

課長:
「その通り。
“京都が良かった”が多いなら京都商品の改善が分かる。
読む前に当たりを付けられるのが強い」

ケンイチ:
「ちょっと待ってください。
アンケートって、紙やPDFもあります。
その場合はComprehendで読めるんですか?」

課長:
「いい視点だ。
Comprehendは“文章の意味”を読む。
でも画像は、そのままだと文字として読めない」

ケンイチ:
「じゃあ、画像から文字にするには…?それがOCRってやつですか?」

課長:
「そう。OCRは、ひとことで言うと“画像から文字を抜き出す”技術だ。
紙のアンケート写真をテキストに変える役だね。」

ケンイチ:
「つまり、OCRが“文字起こし”。
Comprehendが“意味の整理”。 役割が違うってことですね?」

課長:
「その通り。流れで言うと
①OCRで文字を取り出す
②Comprehendで感情や要望を分類する
この2段階が基本だ」

ケンイチ:
「なるほどー!!
じゃあ旅行写真のキャプションみたいに最初からテキストならOCRはいらないですね?」

課長:
「いらない。最初から文章ならComprehendでいきなり解析できる。
逆に、看板や手書きメモみたいに画像にしかない文字はOCRが先だ」

◆ OCRとComprehendの違い
・OCR:画像 → 文字にする(文字起こし)
・Comprehend:文字 → 意味を整理する(感情/分類/抽出)
・紙や写真の文字は「OCR→Comprehend」が基本

ケンイチ:
「じゃあ“やりたいこと”で言うと、
紙アンケの写真はOCRで文字にして、
その結果をComprehendで『不満』『要望』に分ける…?」

課長:
「そうだ。そこまでできれば、人は“重要な山”だけ読める。
締切前でも間に合う形になる。だから・・・」

ケンイチ:
「うう・・・頑張ります。でもコストはどう見ればいいですか?
使いすぎて請求が爆発するのは怖いです…」

課長:
「課金は基本的に解析したテキスト量で決まる。
だから“全部ぶち込む”より、まずは対象を絞ったほうがいい。月上限アラートも必須だ」

ケンイチ:
「なるほどー!!まずは“自由記述だけ”に絞って小さく試すのが良さそうですね」

課長:
「それでいい。導入の順番はシンプルだ。
①少量で試す
②人が確認してズレを把握
③ルール化して自動化だ」

よく間違えられやすい用語との違い

用語主な用途取り出しの速さコストの傾向
Amazon Comprehend文章の感情・キーワード・固有名詞の抽出APIで即時に結果取得解析量(テキスト量)で増減
Amazon Translate文章の翻訳即時翻訳した文字量で増減
Amazon Rekognition画像・動画の解析(物体/人物/文字など)即時〜バッチ画像/動画の解析量で増減

■ 用語の定義
Amazon Comprehendとは、文章を解析して感情・キーフレーズ・固有名詞などを自動抽出する自然言語処理(NLP)のサービスです。

② 実際の事例

事例:Siemens(シーメンス)— アンケート自由記述の自動処理

シーメンスは、従業員調査などのアンケート自由記述を効率よく扱うため、AWS上に回答処理ソリューションを構築しました。
完了したアンケートをまずAmazon Comprehendに送って言語を識別し、必要に応じてAmazon Translateで翻訳します。さらにComprehendで個人名などを匿名化し、その後Amazon SageMakerで回答内容を検出してカテゴリやトピックに整理します。

この仕組みにより、分析・分類した結果を従来より少なくとも75%速く返せるようになり、調査プログラムの費用も大幅に削減できました。

また、過去は従業員調査の処理と分析を人手で行うと、1回あたり数ユーロの費用がかかっていましたが、ComprehendなどのAWSサービスを使うことで、翻訳・処理・分析を1回あたり1ユーロ未満で実行できるようになったとしています。

Comprehend のお客様

 

③ クイズや小テスト

クイズ1

Amazon Comprehendでできることとして近いのはどれ?

A:文章から感情やキーワードを抽出する

B:画像を高画質化する

C:サーバーの性能を自動増強する

クイズ2

導入で最初にやると安全なのはどれ?

A:全データを一気に解析して本番化

B:少量で試し、人が結果を確認する

C:専門用語を全部禁止して運用する

クイズ3

コスト管理で重要な考え方はどれ?

A:解析量(テキスト量)を意識して対象を絞る

B:解析は基本無料なので気にしない

C:長文ほど精度が落ちるので短文だけにする

答え:

1-A:文章から感情やキーワードを抽出する(Comprehendの本丸)

2-B:少量で試し、人が結果を確認する(ズレを先に把握)

3-A:解析量を意識して対象を絞る(請求の暴走を防ぐ)

解説:Comprehendは“文章の整理役”。いきなり全自動にせず、最初は人の確認とセットで使うと失敗しにくい。



タイトルとURLをコピーしました