Aspose.HTML for .NET は、.NET アプリケーション内で HTML ドキュメントを生成、操作する高度な HTML 操作を可能にする API です。HTML ノードの挿入、削除、置換、CSS スタイルの抽出、トラバース、XPath または CSS セレクター クエリーで提供される NodeIterator や TreeWalker により HTML ドキュメントの検索などが可能です。さらに独自のスクリプトにより JavaScript で HTML DOM を操作できます。
Aspose.HTML for .NET は、HTML ファイルを読み込んで PDF、XPS またはラスター画像形式で出力できます。また、Aspose.HTML for .NET の API は、ドキュメントを暗号化して、出力結果のページ設定を指定できる一方で、出力ファイルを PDF ファイルに変換したり、出力ドキュメント内の JPEG 画像の圧縮率を指定することも可能です。
Aspose.HTML for .NET は、わずか数行のコードで HTML から PDF や画像、その他の形式への変換機能を .NET アプリケーションに追加できます。
// 変換対象のファイルの読み込み using (var document = new Aspose.Html.HTMLDocument("document.html")) { // HTML を PDF に変換 Aspose.Html.Converters.Converter.ConvertHTML(document, new PdfSaveOptions(), "output.pdf"); // HTML を画像に変換 Aspose.Html.Converters.Converter.ConvertHTML(document, new ImageSaveOptions(ImageFormat.Png), "output.png"); }
マークダウンは、プレーンテキスト構文のマークアップ言語です。簡単に読み書きできるドキュメント形式なので、Readme ファイルなどで使用されることが多いです。Aspose.HTML for .NET から提供される強力かつ柔軟なマークダウン変換機能により、マークダウンと HTML 間の変換が可能になります。さらに、Aspose.HTML for .NET の変換機能には、いくつかの定義済み規則が含まれるので、正規のマークダウン構文を使用して HTML をマークダウンに変換したり、GitLab 互換のマークダウンへ変更したり、必要に応じたルール設定なども可能です。
// HTML ファイルの読み込み using (var document = new Aspose.Html.HTMLDocument("document.html")) { // GitLab 互換のマークダウンでサポートされる機能により HTML からマークダウンに変換 document.Save("output.md", Aspose.Html.Saving.MarkdownSaveOptions.Git); }
上記の逆の変換処理も簡単です。
// マークダウンから HTML への変換 Aspose.Html.Converters.Converter.ConvertMarkdown("document.md", "output.html");
Aspose.HTML for .NET は、電子書籍 (EPUB) 形式を標準でサポートします。Aspose.HTML for .NET は、EPUB や MHTML ファイルから PDF、XPS、画像ファイル形式に高精度で変換できます。
// EPUB から PDF への変換 Aspose.Html.Converters.Converter.ConvertEPUB("document.epub", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
// MHTML から PDF への変換 Aspose.Html.Converters.Converter.ConvertMHTML("document.mht", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
Web スクレイピングは、Web ハーベスティング、Web データ収集、Web クローリングとも呼ばれる、Web サイトからのデータ抽出の技術です。Aspose.HTML for .NET では、Web スクレイピングを標準ではサポートしていません。ただし、完全に W3C 標準に基づき、 XPath や CSS セレクター クエリーをサポートする Aspose.HTML for .NET の API によって、さまざまな HTML ドキュメントのコンテンツを容易に検査したり、独自の Web スクレイピング ソリューションを生成することができます。
// Web サイトをパラメーターとして HTML ドキュメントのインスタンスを生成 using (var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API")) { // すべてのアンカー要素を取得 var elements = document.QuerySelectorAll("a"); // アンカー要素のデータをコンソールに出力 elements.Cast<HTMLAnchorElement>().ToList().ForEach(x => { System.Console.WriteLine("[Href]: " + x.Href); System.Console.WriteLine("[Content]: " + x.TextContent); }); }