Amazon Textractさわってみる

re:Invent 2022にてAI、MLに関するアップデート情報を見ていた所、Amazon Textractがアップデートという情報を見つけました。
私自身もこんなサービスもあったのかと思ったので、紹介させていただきます。

■概要

まずAmazon Textractとは何という話ですが、以下が概要になります。

Amazon Textract は、スキャンしたドキュメントからテキスト、手書き文字、およびデータを自動的に抽出する機械学習 (ML) サービスです。これは、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやラベルからデータを識別、理解、および抽出します。

■コンソール画面紹介

では実際にコンソール画面を見てみます。(新機能を試す為、オレゴンリージョンです)
開くと下記のような画面に進みましたので、画面右の「Amazon Textractを試す」を押下し、実際に触っていこうと思います。

画像1.png

■テンプレートでの挙動

「Amazon Textractを試す」に進むと、早速テンプレート画像が表示されました。
取得項目には、「生のテキスト」「フォーム」「テーブル」「クエリ」「署名」の5項目あります。
下記テンプレート項目のキャプチャになります。(今回クエリの項目はなかったです)

生のテキスト
テンプレ1.png

フォーム
テンプレ2.png

テーブル
テンプレ3.png

結果はダウンロードする事もでき、zip形式で取得できます。
中身はcsv、textなどに分けられ、結果をまとめたjsonもありました。

■アップデートされた機能について

アップデートされた機能は2つあります。
1つ目は、上記の取得項目の中の署名の項目です。

書類への署名箇所を署名として認識されています。
署名.png

2つ目は、Analyze Leadingです。
これは複数画像をタイプ別に自動で分類および分割し、重要な情報フィールドを抽出する、という内容のようです。

下記スクショの通り、サマリー部分に項目毎の合計が表示されます。

Analyze.png

■手書きしたものをスキャン

実際に手書きしたものをスキャンしてみます。↓

サンプル1枚目
S__21028892.jpg

サンプル2枚目
S__21028912.jpg

■1枚目スキャン

想定通り、スキャンされました!
サンプル結果1.png

新機能の署名も問題なく検出されました!
サインっぽく書かなくても検出されるんですね
サンプル結果2.png

■2枚目スキャン

テーブルも想定通りいけました!

サンプル結果3.png

■おわりに

手書きしたものでもしっかり認識できていますね!
特にサインの所は署名と判断されないと思ってたので、少し驚きでした。

現在の業務上ではなかなか使う機会がなさそうですが、大量の書類の整理に悩まされている方は是非利用してみてください!

この記事を書いた人

aws-recipe-user