\r\n\r\n
信じられないかもしれませんが、今でも書類を紙に印刷している人がいます。これらの印刷物を機械で読み取り可能なテキストに変換するのがOCR(光学式文字認識)ソフトウェアです。私たちは、最高の無料のOCRツールのいくつかを見つけ、ここであなたのためにそれらを比較しました。
OCRプログラムは完璧ではありませんから、結果を確認し、いくつかの問題を修正する必要があります。しかし、この方法は、文書全体をコンピューターに入力し直すよりもはるかに速いです。これらのフリーOCRソフトツールは、いずれも利点があります。どれも仕事がはかどりそうです。
これらのツールを比較するために、MakeUseOfのプライバシーページのスクリーンショットを撮り、JPGファイルとして保存してみました。
そして、このJPGを使って、以下のOCRサービスをテストしてみました。
ただし、印刷物を編集する場合は、スキャンすることも可能です。
この場合、Times New RomanやArialなどの一般的なフォントでページを作成すると効果的です。また、スキャンする前に、画像が表向きになっていることを確認してください。また、スキャンした資料のファイルサイズは2MB以下を目安にしてください。
さあ、掘り下げよう!
Google DriveはOCRサポートを統合しており、Googleが書籍のスキャンやPDFファイルのテキストを理解するために使用しているOCRエンジンに依存しています。
はじめに、OCRで送信する画像をパソコンに保存してください。
次に、googledriveのウェブサイトを開き、ファイルをアプリケーションにアップロードします。
プロからのアドバイス:Gmailをお使いの方は、スキャンしたファイルをメールに添付することもできます。添付ファイルにボタンがあり、受信トレイにいながらGoogle Driveにファイルを転送することができます。
Google Driveにドキュメントを配置したら、そのドキュメントを見つけて右クリックします。次に、「Open With」を選択し、「GoogleDocs」を選択します。
画像をスキャンして、Googleドキュメントに編集可能な新しいテキストファイルとして表示します!Googleは、ドキュメントの上部に元の画像を配置し、その下にOCRを使用して編集可能なテキストを自動的に作成します。
googledriveとgoogledocsの組み合わせは、ここでもなかなかよくできています。URLがわかりにくいですが、テストしたツールはすべて
Free OCRなどの無料のオンラインOCRツールは、アップロードに制限があるものが多いのですが、googledocsはページのアップロード制限がないのがメリットです。
マイクロソフトもOCRに対応していますが、Windowsユーザー向けのみです。Microsoft Word 2010以降をお使いですか?すでにMicrosoft Document Imagingを搭載しています。
そうでない場合は、SharePoint Designer 2007をインストールする必要があります。
さて、この話をする前に、OCR方式を実際に動作させるためには、Microsoft Wordが必要であることに留意することが重要です。
Microsoft Wordが無料でないことは知っています。しかし、このOCR方法は非常に効果的であり、Wordにアクセスすることは非常に簡単であるため(任意の図書館や大学のキャンパスに行ってください)、私はとにかく無料のOCRツールのリストにこれを含めることを実行する決定を下すことです。
続けて
このURL [リンク切れ] にアクセスしてSharePointをインストールします。ダウンロードをクリックすると、さまざまなオプションが表示されます。SharepointDesigner.exeをクリックし、ダウンロードをクリックします。
ソフトウェアライセンスに同意した後、「カスタム」を選択します。
画面左上のボックスの中から「インストールオプション」タブを探します(これはプログラムが表示するデフォルトのタブであるはずです)。多くのオプションの左側にあるドロップダウンメニューに注目してください。
Microsoft Office SharePoint Designer、Microsoft Office Shared Features、Office Toolsのドロップダウンメニューを検索します。すべてのオプションで「利用できない」を選択します。見分けやすいように赤いXマークも入っています。
Office Tools」セクションを展開し、「Microsoft Office Document Images」オプションを見つけます。私のコンピューターからすべて実行する」を選択します。ドロップダウンリストで、同様の「マイコンピュータから実行」エントリーを選択しないように注意してください。
最後に、「今すぐインストール」ボタンをクリックします。インストール作業中ずっと使用するダイアログボックスの右下にあります。(注:このインストールには数分かかる場合があります)。
MODI機能が使えるようになりました
次に、原稿をスキャンするか、ウェブから画像を保存します。そして、それをTIFFファイルに変換します。
Microsoft Paintは、無料のTIFF変換オプションの一例です。ペイントでファイルを開き、「名前を付けて保存」をクリックするだけです。他のフォーマットを選択する。
ドロップダウンメニューからTIFF形式を選択し、画像を保存します。
そして、パソコンでMODIを起動します。
パソコンで「Microsoft Office Document Imaging」を検索して、プログラムを開くだけです。
その後、「ファイル」をクリックし、画像ドキュメントを開いて探します。
次に、メニューバーの[OCR]ボタンをクリックします。
プログラムがOCRを終了したら、「ツール」メニューをクリックし、「テキストをWordに送信」を選択します。
プログラムは自動的に新しいワードドキュメントを開き、そこにOCRテキストを貼り付けます。
その結果、使い慣れたプログラムで編集可能なテキストを提供することができます。
最初に支援ソフトをダウンロードしなければならないのは、少し気が引けるかもしれません。しかし、処理自体は難しくありませんし、マイクロソフトはGoogleよりもテキストをうまく認識します。例えば、MakeUseOf.comというウェブサイトのURLは問題なく検出され、単語もつぶされることはありませんでした。
しかし、大きな欠点は、MODIがMacコンピュータで利用できないことです。もしあなたがMacをお持ちなら、以下の代替ソフトをチェックしてみてください。
ダウンロード:MDI to TIFFファイル変換ツール > SharePoint Designer 2007 (Windows版無料)
おそらく、OCR ツールを使い始めたばかりで、非常にシンプルでプラットフォームに依存しないオプション(最高のオンライン ワードプロセッサーなど)が必要なのでしょう。そんなニーズに応えるのが、「OnlineOCR.net」というプログラムです。
40カ国以上の言語に対応しているので、英語以外の言語が含まれるファイルには朗報です。
画面左側の青い「ファイルを選択」ボタンを探してください。15MBまでのサイズのファイルをアップロードできるので、このサービスはグラフィック素材に利用できます。
次に、ドロップダウンリストを使用し、希望の出力言語を選択します。このメニューの右側には、3つのファイル形式が選択できるようになっています。Microsoft Word(私が選んだルート)、Microsoft Excel、プレーンテキストから選択することができます。
Excelオプションは、グラフィックを含む価格表をスキャンして作業する場合に便利です。オンラインOCRは、表や列のある文書にも対応しています。
オプションを調整した後、「Convert」ボタンをクリックして、ツールから出力ファイルをダウンロードしてください。
この無料ツールは、ここで他の2つのようにうまく動作しませんが、あなたが登録せずにオンラインOCRを使用することができますので、それは超便利で簡単です。さらに、私の画像からテキストを認識することもできます。約束や情報提供のないツールを試してみたいという方には、賢い選択だと思います。
また、この無料オプションでは、1時間あたり最大15文書の変換が可能であり、中量のOCRタスクに適した利点があります。
それぞれのプロジェクトには、それぞれの強みがあります。
どのようなツールでも、OCR処理が完了すると、文書のスペルチェックが必要になる場合があります。特に、ツールを使い始めたばかりで、それが正確かどうかわからない場合は、そうです。
また、使い方によっては、OCR文書が全く必要ない場合もあります。例えば、紙の本をOCRすることなく、電子書籍に変換することができます。
どのOCRソフトが最適か?ここで紹介していない、別のお気に入りのOCRソフトがあれば教えてください。コメントをお寄せください。
手書き文字をテキストに変換するOCRもご存知ですか? Macユーザーは、画像キャプチャアプリケーションを使ってOCR処理をすることができます。
写真提供:Nikolay100/photo
原文は2012年3月にChris Hoffmanが執筆したものです。