Simple OCR Controller -ACT Laboratory

Simple OCR Controller

概要

OCR(光学文字認識)技術をシンプルに、そして使いやすく。性格・高速なGoogleエンジンとセキュリティを確保できるローカルのTesseractエンジンを使い分け、PDF文書やスキャン文書画像を簡単OCR

特徴・機能

ベータ版

現在、このソフトはベータ版です。ファイルによっては認識に失敗したり、その他にも思わぬ不具合が残っている可能性があります。完成品ではないことをご理解いただける方のみ、お試しください。ベータ版ではありますが、可能な限りのサポートは提供いたします。また、使った結果の感想等をお寄せいただけますと幸いです。
PDFと3種類の画像ファイルに対応

埋め込みテキストのないPDFファイルやスキャナから取り込んだ３種類の書類画像(jpg・png・gif)の文字部分を認識して読むことができます。
GoogleOCRエンジンの利用で、高速＆高品質

Google社のOCRエンジンを活用すれば、ページ数が増えても認識にかかる時間がほとんど変化しません。また、クラウド上での認識のため、高精度な認識が可能です。
ビジネスやプライベートな書類は手元のPCで認識

クラウドへのアップロードに抵抗のあるビジネス文書やプライベートな文書は、手元のPCだけで認識できます。
自動でファイル保存

認識結果は、テキストファイルとして自動保存されます。保存先は元のファイルと同じ場所、もしくは指定のディレクトリのいずれかを設定できます。
送るメニューに登録して簡単実行

送るメニューへの登録機能を利用すれば、いつでも簡単に呼び出すことができるようになります。
複数ファイルの認識をまとめて実行

複数のファイルをリストに追加してから、まとめて認識処理を開始できます。休憩時間や睡眠時間などを利用して、たくさんのファイルを処理しておくことができます。