Aspose.OCR for Python via .NET は、Python アプリケーション向けの強力な OCR (光学式文字認識) エンジンです。わずか数行のコードにより、ラテン、キリル、アジアなど多くの言語のテキストを認識し、一般的なドキュメントのデータ交換形式で取得できます。複雑な数式モデルの習得や、機械学習、ニューラル ネットワークなどを構築する必要のない、シンプルで安定した API が提供されます。
Aspose.OCR for Python via .NET のライブラリは、高品質なスキャン画像からスマートフォンの写真まで、あらゆるソースのテキストを読み取ります。回転、ゆがみ、ノイズのある画像をフィルターにより自動的に前処理、後処理することで、短時間で高精度な読み取りが可能です。
わずか数行のコードで画像を認識し、結果を出力できます。簡単そのものです。
# OCR エンジンの初期化 recognitionEngine = AsposeOcr() # 画像をバッチ処理に追加 input = OcrInput(InputType.SINGLE_IMAGE) input.add("sample.png") # 画像からテキストを抽出 result = recognitionEngine.recognize(input) # 認識結果を表示 print(result[0].recognition_text)
Aspose.OCR for Python via .NET は、複数言語の混在したテキストをはじめ、多くの言語や一般的な書体を認識できます。
Aspose.OCR for Python via .NET の OCR エンジンで直接サポートされていなくとも、拡張ラテン文字やキリル文字をベースとした、ラテン語、ベトナム語、ゲール語などの言語も読み取り可能です。
OCR における読み取り精度と信頼性は、対象となる画像の品質に大きく依存します。Aspose.OCR for Python via .NET は、自動または手動の画像処理フィルターを多数用意しているので OCR エンジンで処理する前に画像品質を向上させることができます。
これらのフィルターを組み合わせて画像全体や選択部分だけに適用したり、バッチで処理することができます。画像認識の前処理として実行するだけでなく、処理後の画像を表示、キャッシュ、デバッグなどの目的のために保存することもできます。
Aspose.OCR for Python via .NET は、特別なニューラル ネットワークにより、特定の形式の画像から最大精度でテキストを抽出できます。
Aspose.OCR for Python via .NET では高い認識精度が提供されますが、一方で、印刷不具合、汚れ、非標準フォントなどにより、文字や単語が正常に認識できない場合もあります。認識結果を向上させるために、選択された言語に基づいて単語のつづりのミスを自動的に発見、訂正するスペル チェッカー機能を使用できます。
読み取ったテキストに特殊な専門用語、略語、または一般的に使用されない単語などが含まれている場合に、ユーザー定義の単語リストで確認することもできます。
最高レベルの認識精度であっても、読み取り元の画像には、文字以外の多くの情報や重要な値が含まれている場合があります。Aspose.OCR for Python via .NET では、それらの情報を取得するためのシンプルかつエレガントなソリューションを提供します。画像、PDF、ファイルなどからテキストを抽出し、それらをオリジナルの画像の上に透明なテキスト レイヤーとして配置します。その結果は、ドキュメントの格納や共有のための業界標準である PDF 形式で保存されます。出力結果のファイルは検索やインデックスが可能で、そこでのテキストはオリジナルの文字と同様に、選択、コピーが可能となります。
Aspose.OCR for Python via .NET では、対象となるファイルの数や形式に関係なく、単一画像の読み取る場合と同じように、複数のファイルを認識できます。API をひとつ呼び出すだけで、自動給紙スキャナーからの複数ページを認識したり、自動交通監視カメラから送られる画像から自動車のナンバー プレートを抽出することができます。
読み取り結果は、検索可能な PDF ドキュメントやスプレッドシートとして保存したり、さらなる分析のためにプレーン テキスト、JSON、または XML として返すこともできます。