PDF からテキストや画像を抽出

ActivePDF Xtractor で PDF コンテンツを抽出

ActivePDF Xtractor は、PDF ファイルからテキストや画像を検出して抽出する多目的なサーバーベースのツールです。Xtractor を使用することで、指定した条件に一致するテキストや画像を抽出し、そのデータを自動化したドキュメント ワークフローに流用することが可能になります。また、.NET インタフェースにより、コーディングに関わる複雑さも最小限にとどめます。Xtractor は、スタンドアロンのアプリケーションとしての利用はもちろんのこと、 ActivePDF Toolkit と共に使用することで、ドキュメント プロセスの柔軟性を高めることも可能になります。

ActivePDF Xtractor の特長

  • PDF 内を検索してテキストや画像 (png, jpeg, tiff, bmp) の取得や抽出
  • 住所、請求書内のデータ、レポート内のデータの抽出
  • 抽出したデータを自動化したドキュメント ワークフローに流用

PDF からテキストや画像を抽出

製品機能

  • ファイルごと、またはページごとにテキストを抽出
  • 抽出した内容をファイルまたは配列に出力
  • 高い柔軟性と拡張性
  • インメモリ プロセスで、より早いパフォーマンスを実現
  • シンプルで扱いやすいプログラム インターフェイス
  • 場所を検索して、テキストを取得
  • テキストを検索して、場所を取得
  • フレーズを検索して、隣接したテキストを取得
  • すべてを検索機能
  • メタデータの取得
  • ファイルごと、またはページごとに画像を抽出
  • 単層化したフォームからデータの取得
  • PDF ドキュメントをテキスト形式に変換
  • 画像の再利用

サンプル コード

ActivePDF 社では、ActivePDF Xtractor のサンプル コードを用意しています。

ActivePDF Xtractor 9.1.0 のシステム要件

最新版のシステム要件は、製品のリリースノートでご確認ください。

オペレーティング システム

  • Windows Server 2008 R2
  • Windows Server 2012 R2
  • Windows Server 2016

最小ハードウェア要件

  • 512 MB 以上の RAM
  • 150 MB 以上のハードディスクの空き容量 (アプリケーション用)

その他

  • Microsoft .NET Framework 4.6.2 またはそれ以上のバージョン
  • ActivePDF Xtractor のリモート デスクトップ サービス (RDS)、ターミナル サービス、および Citrix 環境での使用は、サポートされていません。

ページトップへ