如何从包含HTML的变量中获取正文内容?
How can I get the body contents out of a variable containing HTML?
我有一个变量htmlSource
包含这样的HTML代码:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>IIS 8.0 Detailed Error - 404.0 - Not Found</title>
</head>
<body>xxx some code here yy</body>
</html>
我如何创建一个新的变量htmlBodyOnly
,它只包含"xxx一些代码这里yy"。如果可能的话,我想用正则表达式来做这件事。我只是不确定如何使用正则表达式或类似的东西排除开始和结束。
对不起,但我没有jQuery来帮助。我只是在一个javascript变量工作。
这很难看,但是你可以用这个方法把它保持为字符串:
htmlsource.substring(htmlsource.indexOf("<body>")+6, htmlsource.indexOf("</body>"))
+6
是因为字符串"<body>"
有6个字符,indexOf方法返回字符串中要搜索的第一个字符的索引。
下面是给出示例的证明:http://jsfiddle.net/9wBkf/
这里假设body标签没有属性,即<body class="myClass>
可以使用DOMParser
来解析html并提取正文的内容。看到这个问题:转换HTML字符串到DOM元素?
var parser = new DOMParser()
var doc = parser.parseFromString(stringToParse, "text/html")
console.log(doc.body.innerHTML)
这是小提琴!
我不知道你可以使用哪个正则表达式,但我想我知道一个替代解决方案。你也可以将你的var '转换'为DOM-object,然后读取body-child。
将HTML字符串转换为DOM元素?
相关文章:
- 在IE8和其他带有javascript的浏览器中获取正文类的标准解决方案是什么
- 获取IE版本+将类添加到正文
- JavaScript:获取搜索文本在正文上的滚动位置
- jQuery/JS正在获取导航菜单,以便在单击正文时隐藏
- 如何在tizen网络应用程序上获取消息正文
- 在 chrome 中获取 iframe 正文 html 内容
- 无法获取在 JS 中创建的表(或正文中的任何内容)以显示在浏览器中
- 添加事件处理程序以获取按钮单击LeadPage,我可以在其中对正文进行编码
- 使用 Java 脚本获取 HTML 正文中所有文本框的名称和 ID
- 如何在 Node.js 中获取 Twilio SMS 正文文本
- 如何从 Nodejs 中的 post 请求中获取正文
- 如何获取网络浏览器窗口正文的确切高度
- Gmail:从扩展程序中获取邮件正文
- uiwebview JavaScript HTML 仅获取面向用户的正文文本
- 使用 javascript 和循环获取所有正文元素
- Javascript 从 iframe 内部的页面获取正文标签
- Redux 获取正文不使用没有 CORS 模式
- 使用边距获取正文元素的左偏移量和顶部偏移量:自动
- 使用 JavaScript 获取消息正文 (Thunderbird)
- 使用 Gmail API 获取带有格式的邮件正文