Aspose.HTML for .NET


HTML を操作する .NET API

HTML の生成、編集、データ抽出や PDF、XPS、画像などへの変換

Aspose.HTML for .NET

Aspose.HTML for .NET は、.NET アプリケーション内で HTML ドキュメントを生成、操作する高度な HTML 操作を可能にする API です。HTML ノードの挿入、削除、置換、CSS スタイルの抽出、トラバース、XPath または CSS セレクター クエリーで提供される NodeIterator や TreeWalker により HTML ドキュメントの検索などが可能です。さらに独自のスクリプトにより JavaScript で HTML DOM を操作できます。

Aspose.HTML for .NET は、HTML ファイルを読み込んで PDF、XPS またはラスター画像形式で出力できます。また、Aspose.HTML for .NET の API は、ドキュメントを暗号化して、出力結果のページ設定を指定できる一方で、出力ファイルを PDF ファイルに変換したり、出力ドキュメント内の JPEG 画像の圧縮率を指定することも可能です。


主な機能


サポートされる環境


サポートされるファイル形式


  • HTML ページの新規作成
  • ファイル、ストリーム、URL からの既存の HTML の読み込み
  • W3C HTML 標準規格の実装
  • テンプレート結合を使用して html テンプレートを実装
  • さまざまなデータ ソースでテンプレートにデータをセット
  • HTML Canvas 2D を PDF 形式で出力
  • HTML ノードの追加、置換、削除
  • CSS スタイル情報の抽出
  • EPUB や MHTML ファイル形式の読み込み
  • HTML をラスター画像形式で出力
  • 複数のドキュメントを一括で出力

Aspose.HTML for .NET は、わずか数行のコードで HTML から PDF や画像、その他の形式への変換機能を .NET アプリケーションに追加できます。

            // 変換対象のファイルの読み込み
            using (var document = new Aspose.Html.HTMLDocument("document.html"))
            {
              // HTML を PDF に変換
              Aspose.Html.Converters.Converter.ConvertHTML(document, new PdfSaveOptions(), "output.pdf");

              // HTML を画像に変換
              Aspose.Html.Converters.Converter.ConvertHTML(document, new ImageSaveOptions(ImageFormat.Png), "output.png");
            }
          

マークダウンは、プレーンテキスト構文のマークアップ言語です。簡単に読み書きできるドキュメント形式なので、Readme ファイルなどで使用されることが多いです。Aspose.HTML for .NET から提供される強力かつ柔軟なマークダウン変換機能により、マークダウンと HTML 間の変換が可能になります。さらに、Aspose.HTML for .NET の変換機能には、いくつかの定義済み規則が含まれるので、正規のマークダウン構文を使用して HTML をマークダウンに変換したり、GitLab 互換のマークダウンへ変更したり、必要に応じたルール設定なども可能です。

            // HTML ファイルの読み込み
            using (var document = new Aspose.Html.HTMLDocument("document.html"))
            {
              // GitLab 互換のマークダウンでサポートされる機能により HTML からマークダウンに変換
              document.Save("output.md", Aspose.Html.Saving.MarkdownSaveOptions.Git);
            }
          

上記の逆の変換処理も簡単です。

            // マークダウンから HTML への変換
            Aspose.Html.Converters.Converter.ConvertMarkdown("document.md", "output.html");
          

Aspose.HTML for .NET は、電子書籍 (EPUB) 形式を標準でサポートします。Aspose.HTML for .NET は、EPUB や MHTML ファイルから PDF、XPS、画像ファイル形式に高精度で変換できます。

            // EPUB から PDF への変換
            Aspose.Html.Converters.Converter.ConvertEPUB("document.epub", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
          
            // MHTML から PDF への変換
            Aspose.Html.Converters.Converter.ConvertMHTML("document.mht", new Aspose.Html.Saving.PdfSaveOptions(), "output.pdf");
          

Web スクレイピングは、Web ハーベスティング、Web データ収集、Web クローリングとも呼ばれる、Web サイトからのデータ抽出の技術です。Aspose.HTML for .NET では、Web スクレイピングを標準ではサポートしていません。ただし、完全に W3C 標準に基づき、 XPath や CSS セレクター クエリーをサポートする Aspose.HTML for .NET の API によって、さまざまな HTML ドキュメントのコンテンツを容易に検査したり、独自の Web スクレイピング ソリューションを生成することができます。

            // Web サイトをパラメーターとして HTML ドキュメントのインスタンスを生成
            using (var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API"))
            {
              // すべてのアンカー要素を取得
              var elements = document.QuerySelectorAll("a");

              // アンカー要素のデータをコンソールに出力
              elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
              {
                System.Console.WriteLine("[Href]: " + x.Href);
                System.Console.WriteLine("[Content]: " + x.TextContent);
              });
            }
          



ページトップへ