写真の文字をテキストにできる「OCR(文字認識)」を試してみた
1枚の書類をスマホに取り込みたいとき、わざわざスキャナーでスキャンしてパソコンなどからスマホへ送るのは少し手間ですよね。
『FineScanner』は、スキャンしたかのようにキレイにスマホで撮影できるアプリ。
しかも、取り込んだ書類の文字を認識してテキストに起こしてくれるらしいです。
・・・え、本当に?
というわけで、試してみました。
書類を撮影してみた
実際に書類を用意しようと思ったのですが、記事に載せられるような手頃な書類がなかったので宮沢賢治の「ポラーノの広場」から一節を拝借しました。
一部の人には「Macでフォントをインストールすると出てくるアレ」で通じると思います。
さっそくFineScannerを起動して撮影しようとすると・・・
白い枠が動き出し、紙を認識すると勝手に撮影をしました!
なにこれスゴイ。
撮影が終わったら、右下に【次へ】というボタンが出てきます。
タップすると、撮影した画像が見られます。
白い部分は白く、黒い部分は黒くパキッとした画像に補正してくれるので、スキャンした画像と似た感じになるんですね。
補正力を試してみる
撮影時に補正がかかりキレイになることがわかったので、次は文字の解像度が低いガビガビの書類を用意してみました。
▲左がガビガビのやつ
同じ文章ですが、小さい文字を拡大させたガビガビな感じになっています。
実際に撮影した画像がこちら。
若干ガビガビ感は残っていますが、補正により文字の輪郭がくっきりしています。
これなら十分に画像として使えますね。

撮影した画像をテキストに起こす
文字認識には、有料会員への登録が必要
次は、撮影した画像からテキストを起こしてみます。
画像からテキストを起こす機能は「OCR(文字認識)」と言うみたいです。
撮影した画像を選び、右下の共有ボタンから【認識】を選択します。
と、思ったら認識機能は有料のプレミアム会員のみの機能のようです。
しかし、7日間無料トライアルがあるので今回はそちらで試してみます。
無料トライアル期間でやめるには、有効期間終了の1日前までに設定でキャンセルしなくてはいけないので注意です。

実際に認識させてみる
プレミアム会員へ登録が完了したら、文字認識の設定が開きました。

認識言語が「JA(日本語)」になっていることを確認(これは書類に書かれている言語によります)
フォーマットはオフィスドキュメント形式の「DOCX」やプレーンテキストの「TXT」形式などいくつか選べますが、今回はTXT形式にしました。
設定が完了するとファイルのアップロードが始まります。サーバーに情報を一旦送信して、テキストとして送ってくれるようです。
ドキュメントの横に青いチェックマークが付いたら認識完了です。このチェックマークをタップすれば、認識した文章が読めます。
そして認識した文章がこちら!
惜しい!!!!
「イーハトーヴォ」が崩れて「イー八!^ーヴォ」となってしまいました。
逆にほかはパーフェクトです!これはすごい!
似ているカタカナと漢字は認識しにくい・・・かも?
カタカナの「ハ」と漢字の「八」は確かに似ていますからね。
間違って認識してしまうのは仕方がないと思います。
今回、用意した書類は「Helvetica」というフォントで印刷しています。
もしかしたら違うフォントならキレイに認識してくれたかもしれません。
しかし、ここまでの精度とは思っていなかったので個人的には「よくぞここまで」と思いました。
1週間は無料で試せるので、みなさんも一度試してみてください。
© 2015, ABBYY Production LLC. Multipage Scanner & OCR. Scan docs from paper on the go.
リクエスト募集中!
AppBankでは、読者の皆さんからの記事ネタを募集しています。
お名前(ペンネーム可)を入力の上、AppBankのライターに書いて欲しい記事ネタを記入し【送信】ボタンを押して、記事リクエストを送ってください。
投稿はこちらから
![]() |
・販売元: ABBYY USA Software House Inc ・掲載時のDL価格: 無料 ・カテゴリ: ビジネス ・容量: 40.1 MB ・バージョン: 5.5.5 |