Aspose.OCR for Java


画像の OCR を処理する Java API

Java アプリケーションに画像ベースの光学データ認識機能を追加

Aspose.OCR for Java

Aspose.OCR for Java は、Java アプリケーション向けのスタンドアロンで拡張性の高い OCR API です。Aspose.OCR for Java により、一般的なすべての画像形式について光学式文字認識処理が可能です。文字認識を管理できるシンプルな一連のクラスとして提供されます。製品 API をアプリケーションに組み込むことで、複数のフォントや言語の文字を画像、スキャンされた回転画像、全体または一部の画像に対して、画像を認識する前に異なるノイズ除去フィルターを適用して読み込むことができます。


概略図

Aspose.OCR for Java でサポートされる主な機能です。


プラットフォームに依存しません

Aspose.OCR for Java でサポートされる環境です。


サポートされるファイル形式

Aspose.OCR for Java でサポートされるファイル形式です。


  • 画像から文字を読み取る
  • 一般的な画像ファイル形式のサポート
  • 多言語をサポート
  • 一般的なフォントのテキストの読み込み
  • 一般的なフォント スタイルをサポート
  • 画像の全体または一部のスキャン
  • 回転画像のスキャン
  • 画像認識前のノイズ除去フィルター
  • 複数のホワイト リストの指定

たった 4 行のコードで OCR 機能を Java アプリケーションに追加できます。簡単そのものです。

            // OcrEngine のインスタンスを生成
            OcrEngine engine = new OcrEngine();

            // 画像ファイルの設定
            engine.setImage(ImageStream.fromFile(dir + "template.jpg"));

            // 画像の処理
            engine.process();

            // 結果の取得
            System.out.println(engine.getText());
          

Aspose.OCR for Java を使用することで、テキストや関連するフォント、スタイル、テキストの位置などを画像の特定部分から抽出できます。この機能により、ドキュメントをスキャンする際の OCR 処理を迅速に行うことができます。

ノイズ リダクションは、OCR 処理の精度を上げるための一般的な前処理です。Aspose.OCR を使用することで、ぼかし、ガウシアン ブラー、ガウシアン メディアンの補正フィルターをドキュメントの画像に適用して画像認識精度を向上できます。

            // OcrEngine の初期化
            OcrEngine engine = new OcrEngine();

            // 画像の指定
            engine.setImage(ImageStream.fromFile(dir + "template.jpg"));

            // フィルターのコレクションを生成
            CorrectionFilters filters = new CorrectionFilters();

            // コレクションにフィルターを追加
            filters.add(new MedianFilter(6));
            filters.add(new GaussBlurFilter());

            // コレクションを OcrEngine に指定
            engine.getConfig().setCorrectionFilters(filters);

            // 後続処理へ
          

Aspose.OCR for Java は、Arial、Times New Roman、Courier New、Verdana、Tahoma および Calibri フォントの標準、太字、斜体スタイルをサポートしています。

Aspose.OCR for .NET は、英語、フランス語、スペイン語、ポルトガル語をサポートしています。



ページトップへ