重要 2019年9月30日をもって、ActivePDF Xtractor の販売は終息となります。Xtractor の機能は、ActivePDF Toolkit Ultimate に統合されます。

PDF からテキストや画像を抽出

ActivePDF Xtractor で PDF コンテンツを抽出

ActivePDF Xtractor は、PDF ファイルからテキストや画像を検出して抽出する多目的なサーバーベースのツールです。Xtractor を使用することで、指定した条件に一致するテキストや画像を抽出し、そのデータを自動化したドキュメントワークフローに流用することが可能になります。また、.NET インタフェースにより、コーディングに関わる複雑さも最小限にとどめます。Xtractor は、スタンドアロンのアプリケーションとしての利用はもちろんのこと、 ActivePDF Toolkit と共に使用することで、ドキュメントプロセスの柔軟性を高めることも可能になります。

ActivePDF Xtractor の特長

PDF 内を検索してテキストや画像 (png, jpeg, tiff, bmp) の取得や抽出
住所、請求書内のデータ、レポート内のデータの抽出
抽出したデータを自動化したドキュメントワークフローに流用

PDF からテキストや画像を抽出

製品機能

ファイルごと、またはページごとにテキストを抽出
抽出した内容をファイルまたは配列に出力
高い柔軟性と拡張性
インメモリプロセスで、より早いパフォーマンスを実現
シンプルで扱いやすいプログラムインターフェイス
場所を検索して、テキストを取得
テキストを検索して、場所を取得
フレーズを検索して、隣接したテキストを取得

すべてを検索機能
メタデータの取得
ファイルごと、またはページごとに画像を抽出
単層化したフォームからデータの取得
PDF ドキュメントをテキスト形式に変換
画像の再利用

サンプルコード

ActivePDF 社では、ActivePDF Xtractor のサンプルコードを用意しています。

ActivePDF Xtractor 9.1.0 のシステム要件

最新版のシステム要件は、製品のリリースノートでご確認ください。

オペレーティングシステム

Windows Server 2008 R2
Windows Server 2012 R2
Windows Server 2016

最小ハードウェア要件

512 MB 以上の RAM
150 MB 以上のハードディスクの空き容量 (アプリケーション用)

その他

Microsoft .NET Framework 4.6.2 またはそれ以上のバージョン
ActivePDF Xtractor のリモートデスクトップサービス (RDS)、ターミナルサービス、および Citrix 環境での使用は、サポートされていません。

PDF からテキストや画像を抽出

ActivePDF Xtractor で PDF コンテンツを抽出

ActivePDF Xtractor の特長

製品機能

サンプル コード

ActivePDF Xtractor 9.1.0 のシステム要件

オペレーティング システム

最小ハードウェア要件

その他

サンプルコード

オペレーティングシステム