在HtmlUnit HtmlElement中访问原始HTML
Getting access to the original HTML in HtmlUnit HtmlElement?
我使用HtmlUnit从一个网站读取内容。
一切都很完美,我正在阅读的内容:
HtmlDivision div = page.getHtmlElementById("my-id");
即使div.asText()
返回预期的字符串对象,但我想获得<div>...</div>
内部的原始HTML作为字符串对象。我该怎么做呢?
我不愿意将HtlmUnit
更改为其他东西,因为网站期望客户端运行JavaScript,而HtmlUnit
似乎能够做所需的事情。
如果原始HTML是指HTMLUnit已经格式化的HTML代码,那么您可以使用div.asXml()
。现在,如果您真的在寻找服务器发送给您的原始HTML,那么您将找不到这样做的方法(至少到v2.14)。
现在,作为一种解决方法,您可以获得服务器发送给您的页面的整个文本,并给出以下答案:如何在HTMLUnit中获得页面的纯原始HTML,同时忽略JavaScript和CSS?
作为旁注,您可能应该仔细考虑为什么需要HTML代码。HTMLUnit将允许您从代码中获取数据,因此不需要存储源代码,只需要存储源代码中包含的信息。我的两分钱。
相关文章:
- 如何使用JavaScriptLib将字符串(WYSIWYG)转换为原始html
- 获取原始HTML并将其重新呈现为HTML
- Webpack:如何将原始HTML加载为React JSX
- 表情符号显示为原始 HTML 代码
- 正在将DOM元素转换为原始HTML字符串
- 保存对“;contentEditable;部分返回到原始HTML文件
- 当我附加XSS过滤后的html时,它会打印原始html
- Electron:将原始html注入BrowserWindow
- 有没有一种方法可以用javascript将原始html添加为新的表行
- 如何在 MVC 中使用 javascript 作为原始 html 插入内容 ASP.NET
- 按 Esc 按钮后恢复为原始 html
- 确定元素是否由 JS 添加,还是原始 HTML 文档 *OR* 检测脚本何时通过 InnerHTML 更新节点
- 获取聚合物元素的原始 HTML 代码
- DOM、原始 html 以及页面上显示的内容是什么关系
- 原始HTML样式与jQuery生成的具有相同结构的HTML不同
- 使用 jquery 检索原始 html,而不是渲染的 html
- Angularjs:在双花括号内渲染原始html - 可能
- 如何将 html 元素添加到当前文本区域值,并将其输出为原始 html
- Angularjs routing 使用 $state 得到原始 html 标签
- 如何将节点内容从 xml 复制到硬编码的 html(动态到原始 html)