GroupDocs.Search for Java


ドキュメントの高度な検索とインデックス処理が可能な Java 検索 API

Java アプリケーション内でドキュメントの検索、検出、分析を効果的に

GroupDocs.Search for Java

GroupDocs.Search for Java は、基本的な検索から高度な検索処理にいたるまで、さまざまなファイル形式のデータの内容を参照することができます。GroupDocs.Search for Java により、多数のファイル形式のインデックス処理や異なる検索クエリ タイプに基づいた検索処理が可能です。あいまい検索、同義語検索、ブール検索、フル テキスト検索などの高度な検索技術がサポートされます。さまざまなディレクトリーやドキュメント内のテキスト、基本的なメタデータ フィールド、ファイル名、ドキュメント形式などを検索することが可能です。


概略図

API の概要


プラットフォームに依存しません

サポートされるオペレーティング システムとフレームワーク


サポートされるファイル形式

以下のファイル形式をサポートします


  • オブジェクト タイプの検索
  • 単純検索、ブール検索、ファセットおよび正規表現クエリーの実行
  • あいまい検索、同義語検索などの高度な検索の実行
  • テラバイトにもおよぶドキュメントの膨大なインデックスの部分検索
  • フル テキストや完全一致フレーズ検索
  • インデックスによる検索
  • 複数のインデックスの並列検索
  • メール メッセージのインデックス化
  • コンパクト、マルチスレッドのインデックス化
  • 辞書の実装
  • 日付、数値範囲の検索
  • パスワード保護されたドキュメントの検索
  • 検索クエリの合計ヒット件数の取得
  • 基本的なメタデータ フィールド
  • 検索結果数の制限
  • 従量制ライセンス オプション

次のオブジェクト タイプがサポートされます。

  • テキスト
  • 基本的なメタデータ フィールド
  • ファイル名
  • ドキュメント形式
  • ドキュメントの生成日、更新日

検索処理では以下の Index が使用されます。

  • Index の生成:Index フォルダーが生成され、ドキュメントはそのフォルダーに追加、インデックスされます。正確かつ迅速な検索処理のために、インデックスデータを収集、分析、格納します。
  • Index の読み込み:Index は、すでに存在する場合に読み込まれます。
  • ドキュメントを Index に追加:インデックスが生成されると、ドキュメントは非同期にインデックスに追加されます。
  • Index の更新:Index フォルダーはドキュメントが変更されるたびに更新、追加、削除され、検索結果は常に最新の状態に保たれます。
              // Index の生成
              Index  index = new Index("D:\Index_Folder\");

              // ドキュメントを Index に追加
              index.addToIndexAsync("D:\Documents_Folder\");

              // Index の検索
              SearchResults searchResults =  index.search("GroupDocs");
            

さらに、次のインデックス機能もサポートされます。

  • ドキュメントのメタデータのインデックス
  • インデックスの結合
  • インデックスのマルチスレッド、コンパクト化
  • 分割されたファイルのインデックス化
  • インデックス辞書内のすべてのドキュメントの変更をトラッキング
  • インデックス化または更新比率の進捗を表示
  • 不要なファイルのインデックスの防止
  • イベントの確認
  • インデックス化されたファイルのリストを抽出
  • インデックス レポジトリ、インデックス化、結合および更新されたインデックスを手動で分解
  • インデックス内のドキュメント テキストを保存
  • エンコードの自動検出
  • AI (accent insensitive:アクセントを区別しない) によるインデックス化

次の辞書がサポートされます。

  • Alias:頻繁に使用される長いクエリーの短縮形の使用
  • Homophone:検索結果の精度を高めるための、変則的な異形同音異義語のリストの管理
  • Letters:検索可能な文字リストの管理
  • Stop Words:フィルターまたはインデックス対象外の文字 (a、an、the、for など)

上記の API 機能以外に、検索機能に関連した次の機能もサポートされます。

  • クエリーの合計ヒット件数
  • 検索スレッド数の指定
  • 形態文字形式による検索
  • スペルミスの修正
  • 検索結果のドキュメント内で一致した単語の取得
  • サポートされない設定の場合にユーザーに警告
  • 単一クエリー内の異なる機能をサポート
  • ステップ関数としてテーブルの個々の関数を定義
  • エンコードを自動保存
  • 検索処理のキャンセル
  • 検索レポートの取得



ページトップへ