用python从html文档中提取javascript变量值
Extract javascript variable value from html document with python
我需要解析一个包含json对象的javascript代码的HTML文档。
像这样:
<html>
<head>
</head>
<body>
<script type="text/javascript">
myJSONObject = {"name": "steve", "city": "new york"}
</script>
<p>Hello World.</p>
</body>
</html>
我如何提取myJSONObject值与python?
您可以使用lxml解析HTML,然后提取JSON:
>>> import lxml.etree,json
>>> s = '''<html><body><script type="text/javascript">
myJSONObject = {"name": "steve", "city": "new york"}
</script></body></html>'''
>>> js = lxml.etree.HTML(s).find('.//body/script').text
>>> jsonCode = js.partition('=')[2].strip()
>>> json.loads(jsonCode)
{u'city': u'new york', u'name': u'steve'}
相关文章:
- 如何在HTML源代码中提取javascript变量
- 从CSV文件中提取JavaScript代码
- 从excel中提取Javascript
- 如何从html中提取javascript
- 如何在单击按钮后提取javascript中textarea的id(在本例中是动态的)
- 使用R从xml节点提取javascript语法
- 使用 PHP 在页面中提取 Javascript 的源代码
- 如何在 Java 中从 HTML 页面中提取 JavaScript 链接
- 在Poedit中提取javascript gettext
- 用于提取 javascript (.js) 类和方法结构的库
- 有没有办法从Google Docs/with Google Apps Script中的页面中提取JavaScript变量
- 使用 Babel CLI 提取器提取 Javascript 获取文本消息
- 安卓系统,使用javascript接口从webview中提取javascript变量
- 使用DOMDOCUMENT提取JavaScript值
- 如何使用正则表达式提取javascript变量
- 如何通过python从源页面中提取javascript创建的隐藏标签
- 仅从脚本标记中提取javascript
- 如何从下面的页面中提取JavaScript函数
- 正在提取JavaScript中的URL参数值
- 如何从网页中提取javascript动态数据