如何提取JS操作页面后的最终HTML

How do I extract the final HTML after the JS manipulation of pages?

本文关键字:HTML 操作 何提取 提取 JS      更新时间:2023-09-26

让我用一个例子来解释。想象一下,我有一个包含JS的网页,它修改了页面本身的HTML。我想把JS修改的HTML的最终内容放在string中。

我该怎么办?

您可以通过c#在Web浏览器组件中打开页面来访问dom。这是一个教程开始。如果你不想显示组件,你可以安全地隐藏它。

您可以覆盖页面的呈现方法并捕获html

Public override void Render(HtmlTextWriter htmlW)
{
    TextWriter txtW = new StrigWriter();
    HtmlTextWriter htmlTxtW = new HtmlTextWriter(txtW);
    base.Render(htmlTxtW);
    string output = txtW.toString();
    htmlW.Write(txtW.toString());
}

输出字符串包含html源代码。