\r\n\r\n
光学式文字認識(OCR)ツールは、印刷物や手書きのテキストを素早くデジタルテキストに変換することができます。例えば、Instagram上の画像やスキャンした写真からテキストを素早くコピーして編集したいとします。OCRツールはいつでも使える!
インターネットでは、無料のOCRが数多く提供されていますが、有料のOCRもそれなりの市場があります。そこで、私が知りたいのは、無料のOCRツールを使えるのに、お金をかけてOCRツールを使う価値があるのか、ということです。
この記事では、私は最高の有料OCRのオプションのいずれかをテストするために一緒に最高の無料のOCRツールのいずれかを配置します。
MicrosoftのOneNote(無料)とNuanceのOmniPage 18(60ドル)に備えよう。
要約すると、ほとんどのOCRツールは、ほとんど同じように動作します。
OneNoteやOmniPageでも同様のルーチンが適用されます。
どちらのツールが本当に優れているのかを評価するために、それぞれのツールを複数回テストして採点していきます。その前に、はっきりさせておきたいことがあります。
OneNote for OCRを使用するには、OneNote 2016デスクトップソフトウェア版のみをご使用ください。
Windows 10をお使いの場合、お使いのコンピューターに2016年のデスクトップソフトウェアと同じ機能を持たないウェブアプリケーションがある可能性があります。
2016年版のデスクトップソフト以外のOneNoteアプリケーションでOCRを使おうとしても、うまくいきません。信じてください、私は試しました。
OneNote 2016の無料ダウンロードはこちらからどうぞ!「Windowsデスクトップ」のリンクを必ずクリックしてください。
各ツールがどの程度の機能を備えているかを測定するために、各ツールの精度を1〜5のスケールで評価することにしました。 5のスコアは、スペルミスや文法の間違いがなく、正確にテキストを書き写すことができたことを意味します。
どのツールが一番便利なのかを明確にするために、以下のファイルをテキストに変換してみることにした。
期待値としては、2つのツールをかなり均等に重ねてほしいですね。私の経験では、有料ツールと無料ツールは、有料ツールの派手な機能を除けば、比較的同等であることが多いですね。(Google DocsとMicrosoft Wordを見ればわかる)。
私はOneNoteをあまり使用せず、簡単なメモを印刷する以外に使ったことがないので、このテストは両ツールのOCR機能を正確に表現するだけでなく、いかに直感的に操作できるかを考えています。
以下、OneNoteとOmniPageでこれらのテストがどのように機能するかをご覧ください。
この機能を両方のOCRツールで試すために、Lakeshore LearningからこのPDFをダウンロードしました。
各ツールの実装方法は以下の通りです。
PDFファイルをOneNoteに取り込むために、「ファイル印刷」オプションを使って、PDFファイルをノートの1ページに追加しました。
このマイクロソフトの記事の指示に従って、PDF画像を右クリックし、印刷物のこのページからテキストをコピーを選択しました。
この方法を知るために、Googleで検索しまくるのに時間がかかりましたが、少し調べれば、比較的簡単な作業でした。
新しいページにテキストを貼り付けると、oneNoteはPDF文書の1ページ目からテキストをコピーすることに成功しました。PDFの保持はあまり良くないが、テキストは編集可能で検索もでき、誤字脱字もなさそうだった。
OneNoteスコア:5
OmniPageは、ホーム画面の上部にステップバイステップのボタンメニューがあり、何をすればいいのかがわかります。これを使って、PDFファイルをソフトにアップロードした。
そして、「次へ」ボタンをクリックして、OCRを実行します。
次に、「ファイルに保存」をクリックし、新しい文書に名前を付けました。
ファイルを開くと、PDFの元画像と100%編集可能なテキストを含むマイクロソフトのワード文書にきちんと変換されていました。書式はまだまともで、誤字脱字や断続的な行間も気にならなかった。
OmniPage OCRで唯一不思議なのは、PDFファイルをアップロードして変換すると、画像が開かれないことです。
ドキュメントのプレビューなどが表示されるかと思いきや、そんなことはない。次から次へとクリックしていけば、あっという間にOCRが完成するので、ちょっと気に入っています。
合計点数:5点
これらのOCRツールをテストするには、Pinterestの引用文を使ってテストするのが一番でしょう。
このテストでは、DowntoHealthのPinterestアカウントからJPG写真をダウンロードしました[no longer available]。
このテストの結果は次のとおりです。
OneNoteの新しいページで、**画像を表示します。(これは、Microsoft Wordやその他のOfficeプログラムで**画像を表示する方法と同様の方法で行われます)。
PDFの例と同様に、画像上で右クリックし、「画像からテキストをコピー」を選択しました。
しかし、コピーしたテキストを画像の下に貼り付けようとすると、OneNoteは何も貼り付けられない。
プレーンテキストで貼り付け、ソースの書式を保持し、書式を統合することを試しましたが、どちらもうまくいきませんでした。
画像の背景にテクスチャがあるため、OneNoteがテキストをコピーできなかった可能性があります。しかし、この画像のテキストはそれに比べてかなり暗いので、優れたOCRツールなら抽出できるはずだと思うのです。
OneNoteスコア:1
前回と同じ手順で写真をOmniPageにアップロードしたのですが、今回は写真の背景のテクスチャに少し迷いが生じました。
go」という単語はすぐに認識できたが、「what」という単語を書き写すには程遠かった。
提供されたフィールドを使って、いくつかのエラーを手動で修正し、プログラムにOCRの実行を完了するように指示しました。そうして、前回のテストと同じように、生成されたドキュメントを保存しました。
しかし、このテストは、私が手動で修正した単語しか認識できないため、ほとんど失敗に終わりました。
カメラで撮影した画像をテキストに変換するなど、いろいろクリックして試してみましたが、こちらもダメでした。
合計点数:2点
私は紅茶がとても好きなので、次の投稿のために、パソコンの手の届くところにあるチャイティーボックスをさっそく写真に撮りました。
このファイルフォーマットで、OCRツールがより良い動作をするかどうか見てみましょう。
再び「**写真」オプションを使って、新しいOneNoteのページに写真を追加しました。
画像上でマウスの右ボタンでクリックし、「画像からテキストをコピー」を選択しました。
その後、画像の下にテキストをクリックして貼り付けると、OneNoteは驚くほど正確にそれを捕捉してくれました
OneNoteは、いくつかのテキスト行を微調整しましたが、このテストが成功したことに私はとても驚きました。
テキストは完全に編集可能で、このテストは全く時間がかかりません。
OneNoteスコア:5
今回のテストでは、ダウンロードしたJPG画像が主に失敗したので、あまり期待はしていませんでした。しかし、このテストでもOmniPageは非常に正確な仕事をしました。
ワークフローアシスタント機能にアクセスし、「デジタルカメラファイルの読み込み」を選択し、Smart**から写真をアップロードしました。
ソフトが茶箱の焼印と思われる部分を拡大表示した。
驚いたことに、OmniPageで生成されたWordファイルは、余分なテキストが少しあるくらいで、100%正確で編集可能なのです。
合計点数:4点
次のテストでは、メモを書き、それをスキャンしてクラウドに取り込みました。
お察しの通り、私の家にはスキャナーだけではありません。この画像をスキャンするために、iOSとAndroidの両方で利用できる無料アプリ「CamScanner」を使い、**でドキュメントをスキャンしました。
CamScannerは、スキャンしたファイルをPDFかJPGのどちらかでダウンロードできるので、両方試してみることにしました。
どちらのファイル形式でも、**OneNoteするときに、この画像からテキストをコピーするオプションが残っています。
しかし、本ソフトウェアは、OCRを使用してJPG画像からテキストを正常にコピーすることができません。
PDF版のノートから少しテキストをコピーすることができましたが、あまりうまくいきませんでした。
OneNoteスコア:1
印刷されたテキストのJPG画像については、OmniPageはテキストを書き写すのに良い仕事をしない。
PDFファイル形式でテストしたときも、同様の結果でした。
合計点数:2点
印刷されたメモと同じように、手書きのメモをCamScannerでスキャンしてみました。
印刷したメモから文字を検出できなかったにもかかわらず、OneNoteは手書きメモから何らかのテキストをコピーすることができたのです。しかし、これは非常に不正確です。
PDFファイルを使用すると、結果はさらに悪くなります。
OneNoteスコア:1
OmniPageは印刷した文字すら認識できないので、より細かい手書き文字にはあまり期待していません。
しかし、なぜか私の手書き文字を取り込んでしまうのです。しかし、プレーンテキストで取り込もうとしても、編集可能な状態にすることはできないようです。手書きで書いたものをPDFでアップロードする際も同様です。
合計点数:1点
OmniPageはOneNoteに13対14という僅差で勝利し、OneNoteよりも多くの文字を認識することができましたが、結局のところ、どちらも同じくらい有用(あるいは無用)なものだったのです。手書き、印刷、JPGダウンロードのテストはいずれも難しかったが、PDFからテキスト、インテリジェント**画像からテキストへの認識では、両プログラムとも素晴らしい結果を出している。
しかし、有料のOCRツールに投資する価値はあるのでしょうか?私見では、ノーです。OneNoteがOmniPageと同じ分野で成功したり失敗したりするのなら、なぜ60ドルもかけるのか?
あなたが任意のソフトウェアをインストールしたくない場合は、これらの無料のオンラインOCRツールを試してみてください。
どうでしょう、OmniPageには私たちが見逃している基本的な機能があるのでしょうか?有償・無償を問わず、もっと良いOCRツールをご存知ですか?下のコメント欄で教えてください