Aspose.OCR for JavaScript via C++


JavaScript で画像や PDF をテキストに変換

数行のコードで光学式文字認識機能を Web アプリケーションに追加

Aspose.OCR for JavaScript via C++

Aspose.OCR for JavaScript via C++ により、わずか数行のコードで OCR (光学式文字認識) 機能をアプリケーションに追加できます。Aspose のニューラル ネットワークと機械学習技術により設計された OCR ライブラリは、卓越したパフォーマンスと読み取り精度により、ラテン言語やキルト言語、中国語をベースとしたさまざまな言語をサポートします。Aspose.OCR for JavaScript via C++ は、スキャン画像、スマートフォンの写真、スクリーンショット、画像の特定領域、PDF のスキャンなどを認識でき、読み取り結果は、一般的なドキュメントのデータ交換形式で取得できます。完全なオフライン環境で動作するので、インターネット接続は必要ありません。Aspose.OCR for JavaScript via C++ はすぐに使用を開始でき、わずかな時間で使いこなすようになれます。読み込み前の処理、歪み修正、ノイズ除去、言語検出、マルチスレッド処理、およびその他の複雑な処理はすべて自動で実行することも、要件に合わせて調整することもできます。


主な機能


サポートされるファイル形式


サポートされる環境


  • 画像からテキストを抽出し、検索可能な PDF を生成
  • スキャナーやカメラから取得できるすべての画像をサポート
  • 拡張されたラテン言語やキリル言語をサポート
  • 6,000 を超える漢字を認識
  • 一般的なすべての書体や書式の検出と認識
  • 読み取り前の画像処理
  • 画像全体または一部のみを選択して処理
  • 回転、歪み、ノイズを含む画像の読み込み
  • フォルダー内やアーカイブ内のすべての画像を一括で処理
  • Web リンク先の画像の認識
  • スペル ミスの単語を検索し、自動的に修正
  • 読み取り結果を JSON で出力

JavaScript による OCR 処理は難しいでしょうか。Aspose.OCR for JavaScript via C++ なら、わずか 5 行のコードで画像を認識し、結果を出力できます。簡単そのものです。

            // 入力の準備
            var input = Module.WasmAsposeOCRInput();
            var inputs = new Module.WasmAsposeOCRInputs();

            // 設定の準備
            var settings = Module.WasmAsposeOCRRecognitionSettings();
            input.url = "<:file name>:";
            inputs.push_back(input);
            var result = Module.AsposeOCRRecognize(inputs, settings);

            // 処理結果の出力
            var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
            console.log(result_str);
          

Aspose.OCR for JavaScript via C++ は、複数言語の混在したテキストをはじめ、多くの言語や一般的な書体を認識できます。

  • 拡張ラテン文字: クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語
  • キリル文字: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語
  • 漢字: 6,000 文字以上

ライブラリによる言語検出機能や、ユーザー定義により言語を定義することで認識性能や信頼性を高めることもできます。

Aspose.OCR for JavaScript via C++ で提供されるさまざまなバッチ処理メソッドにより、複数の画像を 1 回の API コールにより認識できるので、それぞれの画像を 1 つずつ認識する必要はありません。

  • 複数の PDF や TIFF ファイルを認識
  • フォルダー内のすべてのファイルを認識
  • アーカイブ内のすべてのファイルを認識
            // 入力の準備
            var input = Module.WasmAsposeOCRInput();

            // アーカイブのパスを指定
            input.url = "archive.zip";
            var inputs = new Module.WasmAsposeOCRInputs();

            // 設定の準備
            var settings = Module.WasmAsposeOCRRecognitionSettings();
            inputs.push_back(input);
            var result = Module.AsposeOCRRecognize(inputs, settings);

            // 処理結果の出力
            var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
          

Aspose.OCR for JavaScript via C++ のライブラリは、通常書体、太字、斜体の Arial、Times New Roman、Courier New、Tahoma、Calibri などの一般的なすべての文体を読み取ることができ、処理結果においても、それらの書式を保持します。行ごとに読み取り結果を分割したり、ページ内のテキスト部分を検出したりできます。

OCR アプリケーションの利用が制限される一番の理由として、多くのユーザーにとってスキャナーを用意することが難しい点が挙げられます。Aspose.OCR for JavaScript via C++ では、暗い画像、回転している画像、歪んだ画像、ノイズが含まれた画像などを処理できる強力なビルトインの画像処理フィルターが提供されます。加えて、すべての画像形式がサポートされるので、スマートフォンで撮影された写真についても高い信頼度での認識が可能です。ほとんどすべての画像前処理と画像補正は自動的に処理されるので、通常の読み取りでは、手動による追加の処理は必要ありません。

            // 入力の準備
            var input = Module.WasmAsposeOCRInput();
            input.url = "../Data/Source/sample.png";
            var inputs = new Module.WasmAsposeOCRInputs();

            // 設定の準備
            var settings = Module.WasmAsposeOCRRecognitionSettings();
            settings.skew = 5;
            var rects = [ {x: 90, y:186, width:775, height:95} , { x:928, y:606, width:790, height:160 } ];
            settings.rects = rects;
            inputs.push_back(input);
            var result = Module.AsposeOCRRecognize(inputs, settings);

            // 処理結果の出力
            var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
          

Aspose.OCR for JavaScript via C++ では高精度な処理結果が提供されますが、一方で、汚れや印刷不具合などにより、記号が正常に認識できない場合もあります。Aspose.OCR for JavaScript via C++ にビルトインされたスペル チェッカーにより単語のつづりのミスを自動的に置き換えることができるので、読み取り結果を手動で訂正する手間を省くことができます。



ページトップへ