Aspose.OCR for Python via .NET


Python 向けの光学文字認識 API

Python アプリケーション内で、スキャン画像、写真、スクリーンショットから文字列を抽出、検索可能な PDF の生成、画像内の文字列の検索や比較

Aspose.OCR for Python via .NET

Aspose.OCR for Python via .NET は、Python アプリケーション向けの強力な OCR (光学式文字認識) エンジンです。わずか数行のコードにより、ラテン、キリル、アジアなど多くの言語のテキストを認識し、一般的なドキュメントのデータ交換形式で取得できます。複雑な数式モデルの習得や、機械学習、ニューラル ネットワークなどを構築する必要のない、シンプルで安定した API が提供されます。

Aspose.OCR for Python via .NET のライブラリは、高品質なスキャン画像からスマートフォンの写真まで、あらゆるソースのテキストを読み取ります。回転、ゆがみ、ノイズのある画像をフィルターにより自動的に前処理、後処理することで、短時間で高精度な読み取りが可能です。


主な機能


サポートされるファイル形式


サポートされる環境


  • スキャン画像、写真、スクリーンショットのテキストを抽出
  • スキャンした PDF を検索可能かつインデックス化した PDF に変換
  • 一般的な書体のラテン言語、キリル言語、アジア言語の読み取り
  • 6,000 以上の漢字を認識
  • 不鮮明、ゆがみ、回転、ノイズの含まれた画像の処理
  • 元のテキスト レイアウトに含まれるコンテンツ ブロックの認識と保持
  • 画像、段落、行、単一文字の範囲の検出と読み取り
  • 複数ページのドキュメント、フォルダー、アーカイブを一括で処理
  • ダウンロードすることなくインターネット上の画像を認識
  • スペル ミスの文字の認識と自動修正
  • 画像内のテキストの検索、高精度なテキスト画像の比較

わずか数行のコードで画像を認識し、結果を出力できます。簡単そのものです。

            # OCR エンジンの初期化
            recognitionEngine = AsposeOcr()

            # 画像をバッチ処理に追加
            input = OcrInput(InputType.SINGLE_IMAGE)
            input.add("sample.png")

            # 画像からテキストを抽出
            result = recognitionEngine.recognize(input)

            # 認識結果を表示
            print(result[0].recognition_text)
          

Aspose.OCR for Python via .NET は、複数言語の混在したテキストをはじめ、多くの言語や一般的な書体を認識できます。

  • 拡張ラテン文字: クロアチア語、チェコ語、デンマーク語、オランダ語、英語 (手書き文字を含む)、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語
  • キリル文字: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語
  • 漢字: 6,000 文字以上
  • ヒンディー語

Aspose.OCR for Python via .NET の OCR エンジンで直接サポートされていなくとも、拡張ラテン文字やキリル文字をベースとした、ラテン語、ベトナム語、ゲール語などの言語も読み取り可能です。

OCR における読み取り精度と信頼性は、対象となる画像の品質に大きく依存します。Aspose.OCR for Python via .NET は、自動または手動の画像処理フィルターを多数用意しているので OCR エンジンで処理する前に画像品質を向上させることができます。

  • 画像がまっすぐになるように水平方向の傾きを自動的に補正
  • 傾いた画像を手動で回転
  • 汚れ、しみ、傷、ぼやけ、不要なグラデーション、その他のノイズを自動的に除去
  • 画像のコントラストを自動調整
  • 画像の自動アップスケールまたは手動によるサイズ調整
  • 画像を白黒またはグレースケールに変換
  • 画像の色を反転させて、明るい場所を暗くし、暗い場所を明るく調整
  • 画像内の文字の濃さを増加
  • 文字の輪郭を保持しながらぼやけた画像を調整
  • ページの歪みを補正し、ページ写真のカメラレンズの歪みを修正

これらのフィルターを組み合わせて画像全体や選択部分だけに適用したり、バッチで処理することができます。画像認識の前処理として実行するだけでなく、処理後の画像を表示、キャッシュ、デバッグなどの目的のために保存することもできます。

Aspose.OCR for Python via .NET は、特別なニューラル ネットワークにより、特定の形式の画像から最大精度でテキストを抽出できます。

  • スキャンまたは撮影された身分証明書やパスポート
  • 自動車のナンバー プレート
  • 請求書
  • レシート

Aspose.OCR for Python via .NET では高い認識精度が提供されますが、一方で、印刷不具合、汚れ、非標準フォントなどにより、文字や単語が正常に認識できない場合もあります。認識結果を向上させるために、選択された言語に基づいて単語のつづりのミスを自動的に発見、訂正するスペル チェッカー機能を使用できます。

読み取ったテキストに特殊な専門用語、略語、または一般的に使用されない単語などが含まれている場合に、ユーザー定義の単語リストで確認することもできます。

最高レベルの認識精度であっても、読み取り元の画像には、文字以外の多くの情報や重要な値が含まれている場合があります。Aspose.OCR for Python via .NET では、それらの情報を取得するためのシンプルかつエレガントなソリューションを提供します。画像、PDF、ファイルなどからテキストを抽出し、それらをオリジナルの画像の上に透明なテキスト レイヤーとして配置します。その結果は、ドキュメントの格納や共有のための業界標準である PDF 形式で保存されます。出力結果のファイルは検索やインデックスが可能で、そこでのテキストはオリジナルの文字と同様に、選択、コピーが可能となります。

Aspose.OCR for Python via .NET では、対象となるファイルの数や形式に関係なく、単一画像の読み取る場合と同じように、複数のファイルを認識できます。API をひとつ呼び出すだけで、自動給紙スキャナーからの複数ページを認識したり、自動交通監視カメラから送られる画像から自動車のナンバー プレートを抽出することができます。

読み取り結果は、検索可能な PDF ドキュメントやスプレッドシートとして保存したり、さらなる分析のためにプレーン テキスト、JSON、または XML として返すこともできます。



ページトップへ