GroupDocs.Search for Java


ドキュメントの検索とインデックス処理のための Java API

一般的なドキュメント形式内のテキストを Java アプリケーションでインデックス化して検索できる API

GroupDocs.Search for Java

GroupDocs.Search for Java により、かつてない検索処理を実行できる業務アプリケーションをエンドユーザーに提供できます。GroupDocs.Search for Java の API では、基本的なものから詳細なものまでテキスト検索機能が提供されます。主要なファイル形式をサポートしているので、複数のインデックスの生成と結合、シンプル、ブール、ファジー、正規表現 (regex) クエリ、その他のクエリ タイプを使用して必要なデータをファイル、ドキュメント、メールからスマートな検索によりフェッチすることができます。


概略図

API の概要


プラットフォームに依存しません

サポートされるオペレーティング システムとフレームワーク


サポートされるファイル形式

以下のファイル形式をサポートします


  • メモリ内またはディスク上にインデックスを生成、マルチスレッドのインデッックス化と結合
  • 既存のファイルやファイル名に特定の文字列を含むファイルのインデックス化を抑止
  • インデックス生成の進捗表示、検索結果の更新と取得
  • インデックスのステータスや最近処理したファイルの警告
  • ZIP アーカイブ内のインデックス化とアーカイブ内でインデックスされたファイルをリスト
  • ファイルのインデックス化、エクスポート中に置換された文字のリストやインポート
  • パスワード保護されたファイルのインデックス化、検索とディスク容量を確保するためにインデックスをコンパクト化
  • インデックスやソース ファイルからテキストを抽出、インデックス内でエンコードしたテキスト ファイルを保存
  • 特定の文字を除外してインデックスを高速化
  • ストップ文字で完全なフレーズを検索
  • 同レベルを指定したファジー検索でベスト マッチな検索結果のみを表示
  • ファジー検索時のタイプミスをスマートにハンドリング
  • ブール検索をファセット検索と組み合わせ
  • 同音異義語、シノニム、日付範囲、ワイルドカード、大文字小文字による検索
  • Aspose.Email の API を使用して Outlook のメールをインデックス化、検索、参照
  • 検索クエリ内のスペルチェック、ワイルドカードと検索フレーズ内の特定の文字をスキップ
  • 検索クエリやすべての結果に含まれる文字を制限
  • HTML をファイルや生成された URL に抽出し、HTML 書式の検索結果をナビゲート
  • 複数クエリを単一オブジェクトツリーに結合
  • サポートされない設定やインデックス エラー時の自動インデックス読み込みをユーザーに警告
  • 指定時間経過後に検索処理を中断

GroupDocs.Search for Java API は検索処理のために頻繁にインデックスを使用します。インデックスは迅速かつ正確な検索処理のためにデータを収集、分析、格納します。

  • インデックスの生成:インデックス フォルダーが生成され、ドキュメントはそのフォルダーに追加、インデックスされます。正確かつ迅速な検索処理のために、インデックスデータを収集、分析、格納します。
  • インデックスの読み込み:Index は、すでに存在する場合に読み込まれます。
  • ドキュメントをインデックスに追加:インデックスが生成されると、ドキュメントは非同期にインデックスに追加されます。
  • インデックスの更新:インデックス フォルダーはドキュメントが変更されるたびに更新、追加、削除され、検索結果は常に最新の状態に保たれます。
              // Index の生成
              Index index = new Index("c:\\MyIndex");

              // ドキュメントを Index に追加
              index.addToIndex("c:\\MyDocuments");

              // 'principal'、'principle'、'principles' または 'principally' でドキュメントを検索し、'affect' または 'effect' の文字を検索
              SearchResults results = index.search("?ffect & princip?(2~4)");
            

GroupDocs.Search for Java は複数のインデックスを一つに結合できます。単一のインデックスが頻繁に更新される場合、複数のデルタ インデックスがありますが検索パフォーマンスが劣化します。GroupDocs.Search for Java では、すべてのデルタ インデックスを単一インデックスに結合します。結合された単一インデックスには結合されたデルタ インデックスのすべての情報が含まれますが、デルタ インデックスはそのまま残ります。この方法により、検索処理を効果的に改善できます。インデックスの結合機能により、さまざまな機能をさらに調整することができます。

GroupDocs.Search for Java は、キーボード レイアウトに一致しない言語で書かれた検索クエリを認識できます。88 の言語と 164 の異なるキーボード レイアウトを認識できます。

GroupDocs.Search for Java は、さまざまな文字の活用形で検索できます。たとえば、名詞の場合は、単数形、複数形による検索が可能です。動詞の場合は、すべての活用形を対象に検索が可能です。また、原型、三人称、過去形、およびその他の形態での検索もできます。英語以外の言語の場合もカスタマイズした活用形での実装が可能です。



ページトップへ