SmartZone OCR/ICR


テキストと手書き文字認識 SDK

自動化されたゾーン データ キャプチャー技術で手作業によるデータ入力を排除。

 

SmartZone ICR/OCR .NET v6.1 リリース (2021.7.14)

  • OCR 認識でグローバル言語をサポート。 SmartZone OCR は、中国語、日本語、韓国語、タイ語、ベトナム語、ロシア語、ウクライナ語、ギリシャ語、ポーランド語など、65 の言語サポートが追加され、77 言語に対応しています。
    詳細は、リリースノートをご参照ください。

 

製品概要

SmartZone の高度なゾーン文字認識テクノロジーを使用すると、ドキュメント画像の指定されたフィールドから、タイプ文字 (OCR) または 手書き文字 (ICR) データをキャプチャしたり、アプリケーションでフルページの OCR をサポートします。データマッチング/ルックアップ、正規表現、およびカスタム文字セットを使用して認識を最適化し、信頼値を設定してオペレータが結果を確認するタイミングを制御することができます。.NET 版のフル機能の評価版には、VB.NET と C# のサンプルが含まれているので、すぐに使い始めることができます。

 

サンプル プログラムのインストールやフォーム処理開発ツールキットの FormSuite をダウンロードし、サンプルのコンパイルと実行できます。このサンプルで実際のフォーム処理開発も可能です。

フォームのフィールドにある OCR または ICR を認識する必要がある場合、FormSuite をお試しください。

FormSuite には、FormFix と SmartZone SDK が含まれます。

主な機能: ゾーン OCR (機械印刷文字の高額文字認識)
ゾーン ICR (手書き文字のインテリジェント文字認識)
対応する開発環境: .NET 32/64ビット

 


 

SmartZone を利用するメリット

フォームのデータ キャプチャを高速化

フォームのデータキャプチャプロセスを自動化して、ドキュメント画像から情報をより効率的に抽出します。

手作業によるエラー排除

フルページ OCR/ICR やゾーン OCR は、ドキュメントの画像を読み取ってテキストを抽出するため、手作業によるデータ入力に伴うエラーを回避することができます。

データキャプチャのカスタマイズ

想定される文字セットや正規表現でゾーンを設定し、ドキュメントの任意の領域からテキストをキャプチャします。


 

主な機能


光学式文字認識 (OCR)

大文字/小文字、数字、通貨、句読点を含む事前定義された文字セットのライブラリを使用して、機械で印刷されたテキストを読み取り、キャプチャします。

インテリジェント文字認識 (ICR)

手書き文字を特定して、データベースやその他のアプリケーションにテキストを抽出するか、ワークフローの次のステップで使用することができます。

調整可能な信頼値

認識結果の信頼値を設定して、手動レビューが必要な時期を判断します。 信頼値は、個々の文字、行、または完全な結果に対して返すことができます。


広範な OCR 言語サポート

中央ヨーロッパ、キリル、バルト、およびアジアの言語を含む、77 の言語のサポート。 サポートされているすべての言語を見る。

ゾーンフィールド認識

事前定義されたフォームフィールドタイプ (名前、日付、時刻、電子メール、マイナンバー、電話番号など) に認識エンジンを集中させて、処理速度を短縮し、精度を向上させます。

フルページ認識

ドキュメントのフルページから、タイプされたテキストや手書きのテキストをキャプチャし、処理ワークフローを高速化します。



OCR および ICR の対応言語

OCR : SmartZone OCR 6.1 では、既存の 11言語 (英語、デンマーク語、オランダ語、フィンランド語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スペイン語、スウェーデン語) に加えて、中国語、日本語、韓国語、タイ語、ベトナム語、ロシア語、ウクライナ語、ギリシャ語、ポーランド語など、65 の言語サポートが追加されました。

ICR : 英語、デンマーク語、オランダ語、フィンランド語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スペイン語、スウェーデン語の 11 言語に対応しています。また、対応するすべての言語の文字を同時に認識することができます。

 

認識

  • 大文字、小文字、アルファベット、数字、通貨、句読点など、あらかじめ定義された文字セット。
  • お客様が定義した文字セットのサブセットに限定することも可能です。
  • 個々の文字、行、および完全な結果の信頼値を返します。
  • 信頼値を持つ各文字の代替結果を返します。
  • 文字が識別できない場合に提供される拒否文字を選択します。
  • 拒否文字が返される信頼水準を設定します。
  • 認識セグメンテーションパラメータを制御することで最適化できます。
  • ユーザーは、フィールドに期待される文字パターンを定義し、各フィールドに異なる正規表現を適用して、精度を劇的に向上させることができます。

 

標準フィールド タイプ

  • 事前定義されたフィールド タイプには、日付、時刻、電子メール、米国の電話、SSN、URL、通貨が含まれます。 定義されたフィールドでは、精度が向上します。
  • これらは正規表現で拡張でき、データ検証リストを使用して部品番号や顧客 ID などを自動的に検証できます。

 


仕様

.NET テクニカル ノート (v6)

  • オペレーティング システム
    • Windows 8.1
    • Windows 10 Versions 1607 およびそれ以降
    • Windows Server 2012
    • Windows Server 2016
    • Windows Server 2019
  • プログラミング環境: Visual Studio 2015、2017、2019
  • 含まれるサンプルコード: VB.NET、C#
  • 64-bit および 32-bit 環境で使用できる .NET AnyCPU アプリケーションの作成
  • マネージド コントロールとして .NET 内でデプロイ
  • .NET Framework 3.5 およびそれ以降
  • NuGet packages が利用可能 (Accusoft.SmartZone.Net)
  • マルチスレッド アプリケーションで利用可能 ( 詳細 )
  • フル機能を試せる評価版を ダウンロードできます

インストール用ファイル (zip ファイル)

Accusoft は、Accusoft 社の Web サイトからダウンロードできる Zip ファイルも提供しています。 Zip ファイルには、開発ライセンスのインストールに使用される ライセンスマネージャー、ビルド済みのデモ実行可能ファイル、デモソースコードとイメージ、および NuGet パッケージに含まれるすべてのアーティファクトが含まれています。

製品ファイルを操作する際の追加のセキュリティ警告を回避するには、製品の ZIP フォルダーを解凍する前にブロックを解除します。これを行うには、ZIP フォルダーの [プロパティ] ページで [許可する] ボタンを選択し、[OK]をクリックします。

次に、zip ファイルを任意のディレクトリに解凍すると、SmartZone ICR や SmartZone OCR の評価を開始できます。

注意: SmartZone ZIPには、ImagXpress および NotateXpress コンポーネントが含まれています。含まれている License Manager を実行して(Windowsレジストリに書き込むには管理者権限が必要です)、SmartZone に含まれているコンポーネントの Evaluation または Toolkit ライセンスをインストールできます。 (SmartZone デモは、ImagXpress および NotateXpress に評価ライセンスをライセンスするように変更されているため、License Manager は評価のオプションのステップです。)

 

含まれるコンポーネント

SmartZone

  • SmartZone は、ICR と OCR の両方を含むバンドルとして利用できます。または、SmartZone ICR または SmartZone OCR のいずれかを使用することもできます。
  • SmartZone には、次のコンポーネントが含まれています(つまり、これらのコンポーネントは、SmartZone のインストール時にインストールされます)。
    • ImagXpress Professional (画像の読み込み、2値化、表示用)
    • NotateXpress (画像注釈の追加用)

注意: SmartZone .NET v6.0 からは、性能制限のない Professional 版のみの販売になります。処理速度に制限のあった Standard 版の販売は終了しました。

 

機能

 

識別機能

  • 既定義の文字セット: 大文字/小文字、アルファベット/数字/通貨/句読点の混在
  • 完全な文字セットの任意のカスタマー定義サブセットに制限可能。
  • それぞれの個別文字、行、全体の結果に対して信頼性値を返します。
  • 各文字に対して信頼性値と候補の結果を返します。
  • 文字が識別できないときに用意される拒絶文字の選択
  • 拒絶文字が返される信頼性レベルの設定
  • 認識セグメンテーション パラメータをコントロールすることで最適化が可能

正規表現 (.NET 版のみ)

  • フィールドで予想される文字パターンを定義
  • 大幅に改良された精度
  • 各フィールドごとに異なる正規表現を適用可能

標準フィールド タイプ (.NET 版のみ)

  • 既定義のフィールドタイプ: 日付、時刻、email、電話番号(米国)、SSN(米国)、URL、通貨
  • 定義されたフィールドで精度改良
  • 正規表現で増大可能
  • データ検証リストを使用し、部品番号、顧客 ID などを自動照合

画像のロード、保存、操作

  • SmartZone には、 ImagXpress Professional ( 詳細な製品説明) が含まれ、画像表示、圧縮、変換、画像処理、編集、注釈、印刷が可能です 。

フォームのフィールドにある OCR または ICR テキストを認識、フォーム ドロップアウトの必要がある場合、 FormSuite をお試しください。

デモ・サンプル

Web ベースのデモ

評価版に含まれているサンプル デモで、SmartZone ICR/OCR の機能をお試しいただけます。

SmartZone Web デモ

 

フォームのフィールドにある OCR または ICR テキストを認識する必要がある場合、 FormSuite をお試しください。

製品に関するお問合せは、弊社営業までお問合せください。