Simple OCR Controller

概要

OCR(光学文字認識)技術をシンプルに、そして使いやすく。性格・高速なGoogleエンジンとセキュリティを確保できるローカルのTesseractエンジンを使い分け、PDF文書やスキャン文書画像を簡単OCR

特徴・機能

  • ベータ版

    現在、このソフトはベータ版です。ファイルによっては認識に失敗したり、その他にも思わぬ不具合が残っている可能性があります。完成品ではないことをご理解いただける方のみ、お試しください。ベータ版ではありますが、可能な限りのサポートは提供いたします。また、使った結果の感想等をお寄せいただけますと幸いです。
  • PDFと3種類の画像ファイルに対応

    埋め込みテキストのないPDFファイルやスキャナから取り込んだ3種類の書類画像(jpg・png・gif)の文字部分を認識して読むことができます。
  • GoogleOCRエンジンの利用で、高速&高品質

    Google社のOCRエンジンを活用すれば、ページ数が増えても認識にかかる時間がほとんど変化しません。また、クラウド上での認識のため、高精度な認識が可能です。
  • ビジネスやプライベートな書類は手元のPCで認識

    クラウドへのアップロードに抵抗のあるビジネス文書やプライベートな文書は、手元のPCだけで認識できます。
  • 自動でファイル保存

    認識結果は、テキストファイルとして自動保存されます。保存先は元のファイルと同じ場所、もしくは指定のディレクトリのいずれかを設定できます。
  • 送るメニューに登録して簡単実行

    送るメニューへの登録機能を利用すれば、いつでも簡単に呼び出すことができるようになります。
  • 複数ファイルの認識をまとめて実行

    複数のファイルをリストに追加してから、まとめて認識処理を開始できます。休憩時間や睡眠時間などを利用して、たくさんのファイルを処理しておくことができます。

バージョン一覧

  • 0.5.1

    2021-01-07

    1.一部の環境で正常に起動できない問題を修正
    2.アップデート確認時にはwindowsのプロキシ設定を自動取得して利用するように改善