使用Jsoup解析html和javascript
Parse html and javascript using Jsoup
我正在解析包含HTML标签和javascript标签的HTML字符串,使用以下
public Document parse(String content) {
return Jsoup.parse(content, "", Parser.xmlParser());
}
问题是javascript元素只包含在一行中。
同样,我也尝试过
public Document parse(String content) {
return Jsoup.parse(content, "", Parser.htmlParser());
}
,这在Javascript中工作得很好…但是HTML元素没有结束标记。例:
<link rel="shortcut icon" href="../../static/public/img/favicon.ico" data-th-remove="all"></link>
被解析为
<link rel="shortcut icon" href="../../static/public/img/favicon.ico" data-th-remove="all">
当我运行我的应用程序时,它不起作用。
我怎样才能解决这个问题?是否有任何方法来解析HTML和Javascript一起使用JSOUP?
注意:我刚刚在JSOUP gitHub上创建了以下问题https://github.com/jhy/jsoup/issues/774
认为,
link
元素在HTML中没有结束标记。它只出现在标题中。详见https://developer.mozilla.org/de/docs/Web/HTML/Element/link
所以当你使用Parser.htmlParser()
你能更详细地解释一下,为什么你不能处理一个未关闭的link
标签?
相关文章:
- Javascript html每点击一次就会更改url
- 通过javascript/html访问twitter共享iframe
- 使用鼠标悬停JavaScript/HTML显示文本
- JavaScript-HTML表单到JSON(空值)和格式
- 使用javascript html实时预览文本区域输入
- 如何每秒从一个变量中提取一定次数的javascript/html
- 使用变量值作为'名称标识符'javascript/html
- JavaScript HTML Onclick
- 非侵入性Javascript HTML注入
- AppendChild Form / Table [Javascript/Html/PHP]
- 按钮don't使用onClick-Javascript HTML重定向
- 在库(javascript/HTML)中将“name”替换为“id”
- 如何确定使用 javascript/html 单击了哪个对象/图像
- 新的javascript HTML元素不遵循css规则
- JavaScript/HTML 错误的解决方案
- 从图像URL javascript html保存图像文件
- javascript html使用webstorage保存表单
- Javascript+HTML中的日期选择器准备好了吗?(需要:DD、MM、YY的单独字段加上日历选择器)
- 谷歌地图/融合表Javascript HTML赢得't显示/可视化所有多边形数据(通过色标)
- JavaScript/HTML命令行小部件