如何在HTML源代码中提取javascript变量
How to extract javascript variable in HTML source code
我正试图使用python从网页中提取一些javascript。我设法隔离了javascript(其中包含我需要的数据),但我在定位包含我需要信息的js变量时遇到了问题。
javascript的格式如下所示
javascript存储在python中一个名为links 的变量
将script标记中的{}替换为<>
links = {script type="text/javascript"}
var ADC = ADC || {};
ADC.model = {};ADC.model.search = {"count": 48, "title": "Commercial Real Estate for Sale", "h1_text": "Commercial Properties for Sale", "asset": [{"pre_auction_enabled": false, "available": true, "registration_url": "http://www.auction.com/registration/event/commercial/B-152/8024124/",....}]}
我缩短了ADC.model.search的内容,但其余数据采用相同的格式。我只需要ADC.model.search变量中包含的信息。
我通过以下操作隔离javascript:
links = source_code.find_all("script", {"type" : "text/javascript"})
其中source_code是我试图抓取的页面的整个源代码
如何提取ADC.model.search的内容?
regex怎么样
链接来自您上面的代码;
import re
pattern='ADC'.model'.search=([^;']]+?)'
match = re.match(pattern, links, re.i) # 'links' goes from your code abouve
print match.group(1)
- 如何在HTML源代码中提取javascript变量
- 从CSV文件中提取JavaScript代码
- 从excel中提取Javascript
- 如何从html中提取javascript
- 如何在单击按钮后提取javascript中textarea的id(在本例中是动态的)
- 使用R从xml节点提取javascript语法
- 使用 PHP 在页面中提取 Javascript 的源代码
- 如何在 Java 中从 HTML 页面中提取 JavaScript 链接
- 在Poedit中提取javascript gettext
- 用于提取 javascript (.js) 类和方法结构的库
- 有没有办法从Google Docs/with Google Apps Script中的页面中提取JavaScript变量
- 使用 Babel CLI 提取器提取 Javascript 获取文本消息
- 安卓系统,使用javascript接口从webview中提取javascript变量
- 使用DOMDOCUMENT提取JavaScript值
- 如何使用正则表达式提取javascript变量
- 如何通过python从源页面中提取javascript创建的隐藏标签
- 仅从脚本标记中提取javascript
- 如何从下面的页面中提取JavaScript函数
- 正在提取JavaScript中的URL参数值
- 如何从网页中提取javascript动态数据