GroupDocs.Search for .NET


ドキュメントの高度な検索とインデックス処理が可能な .NET 検索 API

基本検索と詳細検索機能を使って Microsoft Word、Excel、PowerPoint、PDF、テキスト ドキュメントからフル テキストおよびメタデータを取得

GroupDocs.Search for .NET

GroupDocs.Search for .NET は、ドキュメントからテキストとメタデータを抽出し、ファジー機能とシノニム アルゴリズムをベースとした、高度な検索とインデックス処理を実行できるドキュメント検索 API です。フル テキスト検索で取得される情報は、インデックスに基づいています。フレーズ、パラグラフまたは単語を 1 つ以上含むドキュメントが結果としてリストされます。


概略図

API の概要


プラットフォームに依存しません

サポートされるオペレーティング システムとフレームワーク


サポートされるファイル形式

以下のファイル形式をサポートします


  • 複数の基本検索および詳細検索方法
  • オブジェクト タイプの検索
  • インデックスによる検索
  • 複数のインデックスの並列検索
  • メール メッセージのインデックス
  • 辞書の実装
  • ファジー検索、同義語検索
  • 日付、数値範囲の検索
  • パスワード保護されたドキュメントの検索
  • ファイル名、タイプ、テキストの出現数検索
  • 基本的なメタデータ フィールド
  • シンプル、ブール型演算子クエリー
  • ファセット検索、正規表現 Regex クエリー
  • ドキュメントの作成日と変更日

検索処理では以下の Index が使用されます。

  • Index の生成:Index フォルダーが生成され、ドキュメントはそのフォルダーに追加、インデックスされます。正確かつ迅速な検索処理のために、インデックスデータを収集、分析、格納します。
  • Index の読み込み:Index は、すでに存在する場合に読み込まれます。
  • ドキュメントを Index に追加:インデックスが生成されると、ドキュメントは非同期にインデックスに追加されます。
  • Index の更新:Index フォルダーはドキュメントが変更されるたびに更新、追加、削除され、検索結果は常に最新の状態に保たれます。
              // Index の生成
              Index  index = new Index(indexPath);

              // ドキュメントを Index に追加
              index.AddToIndex("documentsDirectory");

              // Index の検索
              SearchResults searchResults =  index.Search("searchTerm");
            

さらに、次のインデックス機能もサポートされます。

  • 分割されたファイルのインデックス化
  • Index フォルダー内のファイルのすべての変更をトラッキング
  • インデックス化または更新比率の進捗を表示
  • インデックスの結合
  • 不要なファイルのインデックスの防止
  • イベントの確認
  • PowerPoint ファイルのメタデータをインデックス化
  • メール メッセージのインデックス化:Outlook PST および OST ファイルのメール メッセージのインデックス化

次の辞書がサポートされます。

  • Alias Dictionary:頻繁に使用される長いクエリーの短縮形の使用
  • Homophone Dictionary:検索結果の精度を高めるための、変則的な異形同音異義語のリストの管理
  • Letters Dictionary:検索可能な文字リストの管理
  • Stop Words Dictionary:フィルターまたはインデックス対象外の文字 (a、an、the、for など)

上記の API 機能以外に、検索機能に関連した次の機能もサポートされます。

  • クエリーの合計ヒット件数
  • 検索結果の上限設定
  • 検索前のクエリーのスペルミスの修正
  • 検索結果のドキュメント内で一致した単語の取得
  • サポートされない設定の場合にユーザーに警告
  • 異なるキーボード レイアウトで入力されたクエリーの認識
  • 単一クエリー内の異なる機能をサポート
  • ステップ関数としてテーブルの個々の関数を定義



ページトップへ