GroupDocs.Search for .NET


ドキュメントの検索とインデックス処理のための .NET API

一般的なドキュメント形式内のテキストを .NET アプリケーションでインデックス化して検索できる API

GroupDocs.Search for .NET

GroupDocs.Search for .NET は、C#、ASP.NET およびその他の .NET テクノロジ環境で開発された業務アプリケーションでドキュメントとテキストを検索できる API です。GroupDocs.Search for .NET は、複数のインデックスの生成と結合、シンプル、ブール、ファジー、正規表現 (regex) クエリ、その他のクエリ タイプを使用して必要なデータをファイル、ドキュメント、メールからスマートな検索によりフェッチするなど、基本的な検索から詳細な検索機能まで提供されます。GroupDocs.Search for .NET により、主要なファイル形式をサポートした、高速、高信頼度、スマートかつ高機能な検索アプリケーションをエンドユーザーに提供できます。


概略図

API の概要


プラットフォームに依存しません

サポートされるオペレーティング システムとフレームワーク


サポートされるファイル形式

以下のファイル形式をサポートします


  • メモリ内またはディスク上にインデックスを生成、マルチスレッドのインデッックス化と結合
  • 既存のファイルやファイル名に特定の文字列を含むファイルのインデックス化を抑止
  • インデックス生成の進捗表示、検索結果の更新と取得
  • インデックスのステータスや最近処理したファイルの警告
  • ZIP アーカイブ内のインデックス化とアーカイブ内でインデックスされたファイルをリスト
  • ファイルのインデックス化、エクスポート中に置換された文字のリストやインポート
  • パスワード保護されたファイルのインデックス化、検索とディスク容量を確保するためにインデックスをコンパクト化
  • インデックスやソース ファイルからテキストを抽出、インデックス内でエンコードしたテキスト ファイルを保存
  • 特定の文字を除外してインデックスを高速化
  • ストップ文字で完全なフレーズを検索
  • 同レベルを指定したファジー検索でベスト マッチな検索結果のみを表示
  • ファジー検索時のタイプミスをスマートにハンドリング
  • ブール検索をファセット検索と組み合わせ
  • 同音異義語、シノニム、日付範囲、ワイルドカード、大文字小文字による検索
  • Aspose.Email の API を使用して Outlook のメールをインデックス化、検索、参照
  • 検索クエリ内のスペルチェック、ワイルドカードと検索フレーズ内の特定の文字をスキップ
  • 検索クエリやすべての結果に含まれる文字を制限
  • HTML をファイルや生成された URL に抽出し、HTML 書式の検索結果をナビゲート
  • 複数クエリを単一オブジェクトツリーに結合
  • サポートされない設定やインデックス エラー時の自動インデックス読み込みをユーザーに警告
  • 指定時間経過後に検索処理を中断

GroupDocs.Search for .NET API は検索処理のために頻繁にインデックスを使用します。インデックスは迅速かつ正確な検索処理のためにデータを収集、分析、格納します。

  • インデックスの生成:インデックス フォルダーが生成され、ドキュメントはそのフォルダーに追加、インデックスされます。正確かつ迅速な検索処理のために、インデックスデータを収集、分析、格納します。
  • インデックスの読み込み:Index は、すでに存在する場合に読み込まれます。
  • ドキュメントをインデックスに追加:インデックスが生成されると、ドキュメントは非同期にインデックスに追加されます。
  • インデックスの更新:インデックス フォルダーはドキュメントが変更されるたびに更新、追加、削除され、検索結果は常に最新の状態に保たれます。
              // Index の生成
              Index index = new Index(@"c:\MyIndex");

              // ドキュメントを Index に追加
              index.AddToIndex(@"c:\MyDocuments");

              // Index の検索
              SearchResults searchResults =  index.Search("searchTerm");
            

GroupDocs.Search for .NET は複数のインデックスを一つに結合できます。単一のインデックスが頻繁に更新される場合、複数のデルタ インデックスがありますが検索パフォーマンスが劣化します。GroupDocs.Search for .NET では、すべてのデルタ インデックスを単一インデックスに結合します。結合された単一インデックスには結合されたデルタ インデックスのすべての情報が含まれますが、デルタ インデックスはそのまま残ります。この方法により、検索処理を効果的に改善できます。インデックスの結合機能により、さまざまな機能をさらに調整することができます。

GroupDocs.Search for .NET はインデックス内でインデックス化されたテキストをキャッシュできます。キャッシュされたテキストは検索結果をハイライトすることで HTML マークアップを即座に生成するために使用されます。この方法は、ファイルからテキストを直接抽出するよりも高速です。ソース ファイルが存在しない場合でもテキストをキャッシュから取得できます。キャッシュされたテキストはさまざまな圧縮レベルを適用し格納することで、少ないディスク容量と高速なインデックス化が可能になります。

ファジーまたは正規表現検索を実行すると、入力値に完全に合致するドキュメントのリストを参照できます。しかしながら、入力値に類似した単語や項目を含むドキュメントもまた参照されます。たとえば、GroupDocs.Search for .NET を使用して "cost" をファジー検索すると、"cost" という単語を含むドキュメント以外にも "coat" などの類似した単語を含むドキュメントも参照されます。本製品の API を使用してファジーのレベルを設定することで、検索結果を調整できます。

GroupDocs.Search for .NET は、キーボード レイアウトに一致しない言語で書かれた検索クエリを認識できます。88 の言語と 164 の異なるキーボード レイアウトを認識できます。

GroupDocs.Search for .NET は、さまざまな文字の活用形で検索できます。たとえば、名詞の場合は、単数形、複数形による検索が可能です。動詞の場合は、すべての活用形を対象に検索が可能です。また、原型、三人称、過去形、およびその他の形態での検索もできます。英語以外の言語の場合もカスタマイズした活用形での実装が可能です。



ページトップへ